خبر و ترفند روز

خبر و ترفند های روز را اینجا بخوانید!

چگونه داده های IMDb را با پایتون و سینماگور استخراج کنیم

با استفاده از API ساده این کتابخانه، یاد بگیرید که چگونه داده‌های مربوط به فیلم‌ها، بازیگران و موارد دیگر را واکشی کنید.

پایگاه اینترنتی فیلم های اینترنتی (IMDb) بزرگترین پایگاه داده آنلاین است که حاوی اطلاعات مربوط به فیلم ها، سریال های تلویزیونی، ویدیوهای خانگی، بازی های ویدیویی و محتوای جریانی است. پایگاه داده آنلاین حاوی میلیون ها رکورد دقیق است که می توانید برای انجام تجزیه و تحلیل داده ها از آنها استفاده کنید.

Cinemagoer (که قبلا با نام IMDbPY شناخته می شد) یک کتابخانه پایتون برای مدیریت و بازیابی داده های پایگاه داده فیلم IMDb است. می‌توانید به داده‌های مربوط به فیلم‌ها، افراد و شرکت‌ها دسترسی داشته باشید که می‌توانند بیشتر برای تجزیه و تحلیل استفاده شوند.

نصب کتابخانه های مورد نیاز

برای دسترسی به پایگاه داده IMDb باید کتابخانه cinemagoer Python را نصب کنید. برای نصب کتابخانه دستور زیر را در خط فرمان اجرا کنید:

pip install cinemagoer

برای نصب کتابخانه های خارجی پایتون باید پیپ را روی سیستم خود نصب کرده باشید.

کد مورد استفاده در این پروژه در a موجود است
مخزن GitHub
و استفاده از آن تحت مجوز MIT برای شما رایگان است.

استخراج داده های IMDb با استفاده از پایتون

شما باید کتابخانه سینماگر را قبل از استفاده در کد خود وارد کنید.

from imdb import Cinemagoer

ia = Cinemagoer()

کد بالا کتابخانه سینماگر را وارد می کند و نمونه ای از کلاس سینماگر ایجاد می کند.

جستجوی فیلم ها

با استفاده از روش search_movie() می توانید فیلم هایی را با عنوان مشخص (یا مشابه) جستجو کنید. به عنوان مثال، اگر می خواهید فیلم هایی با عنوان راک جستجو کنید، باید کد زیر را اجرا کنید:

from imdb import Cinemagoer
 
# Creating an instance of the Cinemagoer class
ia = Cinemagoer()
 
# Searching movies that have rock in their name
movies = ia.search_movie('rock')
print(movies[0])

این باید اولین فیلمی را که پیدا می کند چاپ کند، به عنوان مثال:

مطلب مرتبط:   چگونه یک مهندس پایگاه داده شویم: راهنمای مبتدی

فیلم های جستجوی پایتون imdb

شما می توانید یک فیلم را با شناسه IMDb آن دریافت کنید. سپس می توانید اطلاعات بیشتری مانند نام کارگردان و ژانرها را استخراج کنید. برای به دست آوردن اطلاعات فردی باید فهرست را مرور کنید.

from imdb import Cinemagoer
 
# Creating an instance of the Cinemagoer class
ia = Cinemagoer()
 
# Getting movie by IMDb ID
movie = ia.get_movie('0468569')
print(movie)
 
# Printing the names of the directors of the movie
print('Directors:')
 
fordirectorinmovie['directors']:
    print(director['name'])
 
# printing the genres of the movie
print('Genres:')
 
forgenreinmovie['genres']:
    print(genre)

در خروجی باید نام فیلم مورد نظر، کارگردان(های) و ژانر(های) آن را مشاهده کنید:

python imdb جستجوی فیلم بر اساس id

جستجو برای یک شخص

با استفاده از متد search_person() می توانید افراد را جستجو کنید. به عنوان مثال، اگر می خواهید “Heath” را جستجو کنید، باید کد زیر را اجرا کنید:

from imdb import Cinemagoer
 
# Creating an instance of the Cinemagoer class
ia = Cinemagoer()
 
# Searching for people having Heath in their names
persons = ia.search_person('Heath')
print(persons[0])

نام اولین فرد منطبقی را که جستجو پیدا می کند، خواهید دید:

خروجی ترمینال پایتون شخص جستجوگر imdb

جستجوی شرکت ها

با استفاده از متد search_company() می توانید شرکت ها را جستجو کنید. به عنوان مثال، اگر می خواهید “Universal” را جستجو کنید، باید کد زیر را اجرا کنید:

from imdb import Cinemagoer
 
# Creating an instance of the Cinemagoer class
ia = Cinemagoer()
 
# Searching for companies having Universal in their names
companies = ia.search_company('Universal')
print(companies)

لیست تمام شرکت هایی که یونیورسال را به نام خود دارند دریافت خواهید کرد.

مطلب مرتبط:   نحوه ایجاد یک پاورقی پاسخگو در React

همچنین می توانید اطلاعات یک شخص و شرکت را با استفاده از شناسه آن بازیابی کنید.

from imdb import Cinemagoer
 
# Creating an instance of the Cinemagoer class
ia = Cinemagoer()
 
# Getting person data by ID
person = ia.get_person('0005132')
print(person['name'])
print(person['birth date'])
 
# Getting company data by ID
company = ia.get_company('0005073')
print(company['name'])

خروجی جزئیات شخص و نام یک شرکت را نشان می دهد:

داده های شرکت شخص پایتون imdb توسط شناسه

پیدا کردن فیلم های بالا و پایین

می توانید داده های 250 فیلم برتر و 100 فیلم پایین را به ترتیب با استفاده از متدهای get_top250_movies() و get_bottom100_movies() بازیابی کنید:

from imdb import Cinemagoer
 
# Creating an instance of the Cinemagoer class
ia = Cinemagoer()
 
# Finding the top 250 movies
top = ia.get_top250_movies()
print(top[0])
 
# Finding the bottom 100 movies
bottom = ia.get_bottom100_movies()
print(bottom[0])

در پاسخ، نام بهترین فیلم و نام بدترین فیلم را خواهید دید:

فیلم های بالا و پایین پایتون imdb

کتابخانه سینماگر روش های دیگری مانند
get_top250_tv()
،
get_popular100_movies()
، و
get_top250_indian_movies()
.

آموزش استفاده از ابزارهای نرم افزار تجزیه و تحلیل داده ها

تجزیه و تحلیل داده ها، ارزیابی داده ها با استفاده از ابزارهای تحلیلی یا آماری برای استخراج اطلاعات است. محبوبیت تجزیه و تحلیل داده ها هر روز در حال افزایش است. اکنون توسط مشاغل، شرکت های بازاریابی و تیم های ورزشی استفاده می شود. فرآیند کامل تجزیه و تحلیل داده ها شامل تعیین اهداف، طرح سوالات، جمع آوری داده ها، تجزیه و تحلیل داده ها، تجزیه و تحلیل داده ها و نتیجه گیری است.

می‌توانید با استفاده از کتابخانه‌های پایتون مانند Cinemagoer یا از طریق پلتفرم‌های آنلاین مانند Kaggle، مجموعه داده‌های پروژه‌های خود را دریافت کنید. در کنار زبان‌های کامل مانند Python و R، می‌توانید از ابزارهای دیگری مانند Microsoft Excel، Tableau و Stata برای انجام تجزیه و تحلیل داده‌ها استفاده کنید.

مطلب مرتبط:   نحوه تولید تصاویر با استفاده از OpenAI API و DALL·E 2 در پایتون