Jump to content
Forumu Destekleyenlere Katılın ×
Paticik Forumları
2000 lerden beri faal olan, çok şukela bir paylaşım platformuyuz. Hoşgeldiniz.

Python Web Scraping - BeautifulSoup - IMDB vs


Öne çıkan mesajlar

Mesaj tarihi:

şöyle bir program yapmaya çalışıyorum.

ben bir film ismi ve yılı gireceğim. bu filmi IMDB, Metacritic, RottenTomatoes, Letterboxd üstünde arayacak, ve filmin sayfasını bulacak. sonra bu sayfadaki puanı alıp bir yere kaydedecek.

örneğin RoboCop (1987) dersem, bana https://www.imdb.com/title/tt0093870/ bu linki verecek.
RoboCop (2014) dersem, bana https://www.imdb.com/title/tt1234721/ bu linki verecek.
ve o sayfalardaki 7.6 ve 6.1 puanlarını kayıt alacak.

Google'dan, ChatGPT'ten, DeepSeek'ten cevaplara bakarak anlamaya çalışıyorum da düzgün sonuç veren tek kod şu oldu:

 

# Kullanıcı ajanı headers (bazı siteler için gerekli)
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'
}

def get_imdb_url(film_adi, yil):
    try:
        search_query = urllib.parse.quote_plus(f"{film_adi} {yil}")
        url = f"https://www.imdb.com/find?q={search_query}"
        response = requests.get(url, headers=headers)
        soup = BeautifulSoup(response.text, 'html.parser')
        
        # İlk film sonucunu bul
        result = soup.find('li', class_='ipc-metadata-list-summary-item')
        if result:
            path = result.find('a')['href']
            imdb_id = path.split('/')[2]
            return f"https://www.imdb.com/title/{imdb_id}/"
        return "IMDb URL bulunamadı"
    except Exception as e:
        print(f"IMDb hatası: {e}")
        return "IMDb URL bulunamadı"

 

burada anladığım verdiğim film adı ve yılı ile search query yapıyor, gelen sonuçlardan ilkini de filmin url'si olarak aktarıyor.

BeautifulSoup kullanmış birileri varsa belki daha iyi fikir verebilir veya öneri getirebilir.

Metacritic, RottenTomatoes, Letterboxd felan için de mi böyle yapacağız? yoksa daha iyi bir yöntem olabilir mi?

Mesaj tarihi:

Scrapping yerine aklıma direkt api marketplace geldi. Rapidapi imdb search fonksiyonu aşağıdaki gibi mesela. Ayda 500 query ücretsiz. Tabi diğer sitelere bakmadım, belki hiç opsiyon yok.

spacer.png

 

Ayrıca ai destekli scrapping için firecrawl'i favorilere atmıştım, test etme imkanım olmadı.

 

 

×
×
  • Yeni Oluştur...