با استفاده از API ساده این کتابخانه، یاد بگیرید که چگونه دادههای مربوط به فیلمها، بازیگران و موارد دیگر را واکشی کنید.
پایگاه اینترنتی فیلم های اینترنتی (IMDb) بزرگترین پایگاه داده آنلاین است که حاوی اطلاعات مربوط به فیلم ها، سریال های تلویزیونی، ویدیوهای خانگی، بازی های ویدیویی و محتوای جریانی است. پایگاه داده آنلاین حاوی میلیون ها رکورد دقیق است که می توانید برای انجام تجزیه و تحلیل داده ها از آنها استفاده کنید.
Cinemagoer (که قبلا با نام IMDbPY شناخته می شد) یک کتابخانه پایتون برای مدیریت و بازیابی داده های پایگاه داده فیلم IMDb است. میتوانید به دادههای مربوط به فیلمها، افراد و شرکتها دسترسی داشته باشید که میتوانند بیشتر برای تجزیه و تحلیل استفاده شوند.
نصب کتابخانه های مورد نیاز
برای دسترسی به پایگاه داده IMDb باید کتابخانه cinemagoer Python را نصب کنید. برای نصب کتابخانه دستور زیر را در خط فرمان اجرا کنید:
pip install cinemagoer
برای نصب کتابخانه های خارجی پایتون باید پیپ را روی سیستم خود نصب کرده باشید.
کد مورد استفاده در این پروژه در a موجود است
مخزن GitHub
و استفاده از آن تحت مجوز MIT برای شما رایگان است.
استخراج داده های IMDb با استفاده از پایتون
شما باید کتابخانه سینماگر را قبل از استفاده در کد خود وارد کنید.
from imdb import Cinemagoer
ia = Cinemagoer()
کد بالا کتابخانه سینماگر را وارد می کند و نمونه ای از کلاس سینماگر ایجاد می کند.
جستجوی فیلم ها
با استفاده از روش search_movie() می توانید فیلم هایی را با عنوان مشخص (یا مشابه) جستجو کنید. به عنوان مثال، اگر می خواهید فیلم هایی با عنوان راک جستجو کنید، باید کد زیر را اجرا کنید:
from imdb import Cinemagoer
# Creating an instance of the Cinemagoer class
ia = Cinemagoer()
# Searching movies that have rock in their name
movies = ia.search_movie('rock')
print(movies[0])
این باید اولین فیلمی را که پیدا می کند چاپ کند، به عنوان مثال:
شما می توانید یک فیلم را با شناسه IMDb آن دریافت کنید. سپس می توانید اطلاعات بیشتری مانند نام کارگردان و ژانرها را استخراج کنید. برای به دست آوردن اطلاعات فردی باید فهرست را مرور کنید.
from imdb import Cinemagoer
# Creating an instance of the Cinemagoer class
ia = Cinemagoer()
# Getting movie by IMDb ID
movie = ia.get_movie('0468569')
print(movie)
# Printing the names of the directors of the movie
print('Directors:')
fordirectorinmovie['directors']:
print(director['name'])
# printing the genres of the movie
print('Genres:')
forgenreinmovie['genres']:
print(genre)
در خروجی باید نام فیلم مورد نظر، کارگردان(های) و ژانر(های) آن را مشاهده کنید:
جستجو برای یک شخص
با استفاده از متد search_person() می توانید افراد را جستجو کنید. به عنوان مثال، اگر می خواهید “Heath” را جستجو کنید، باید کد زیر را اجرا کنید:
from imdb import Cinemagoer
# Creating an instance of the Cinemagoer class
ia = Cinemagoer()
# Searching for people having Heath in their names
persons = ia.search_person('Heath')
print(persons[0])
نام اولین فرد منطبقی را که جستجو پیدا می کند، خواهید دید:
جستجوی شرکت ها
با استفاده از متد search_company() می توانید شرکت ها را جستجو کنید. به عنوان مثال، اگر می خواهید “Universal” را جستجو کنید، باید کد زیر را اجرا کنید:
from imdb import Cinemagoer
# Creating an instance of the Cinemagoer class
ia = Cinemagoer()
# Searching for companies having Universal in their names
companies = ia.search_company('Universal')
print(companies)
لیست تمام شرکت هایی که یونیورسال را به نام خود دارند دریافت خواهید کرد.
همچنین می توانید اطلاعات یک شخص و شرکت را با استفاده از شناسه آن بازیابی کنید.
from imdb import Cinemagoer
# Creating an instance of the Cinemagoer class
ia = Cinemagoer()
# Getting person data by ID
person = ia.get_person('0005132')
print(person['name'])
print(person['birth date'])
# Getting company data by ID
company = ia.get_company('0005073')
print(company['name'])
خروجی جزئیات شخص و نام یک شرکت را نشان می دهد:
پیدا کردن فیلم های بالا و پایین
می توانید داده های 250 فیلم برتر و 100 فیلم پایین را به ترتیب با استفاده از متدهای get_top250_movies() و get_bottom100_movies() بازیابی کنید:
from imdb import Cinemagoer
# Creating an instance of the Cinemagoer class
ia = Cinemagoer()
# Finding the top 250 movies
top = ia.get_top250_movies()
print(top[0])
# Finding the bottom 100 movies
bottom = ia.get_bottom100_movies()
print(bottom[0])
در پاسخ، نام بهترین فیلم و نام بدترین فیلم را خواهید دید:
کتابخانه سینماگر روش های دیگری مانند
get_top250_tv()
،
get_popular100_movies()
، و
get_top250_indian_movies()
.
آموزش استفاده از ابزارهای نرم افزار تجزیه و تحلیل داده ها
تجزیه و تحلیل داده ها، ارزیابی داده ها با استفاده از ابزارهای تحلیلی یا آماری برای استخراج اطلاعات است. محبوبیت تجزیه و تحلیل داده ها هر روز در حال افزایش است. اکنون توسط مشاغل، شرکت های بازاریابی و تیم های ورزشی استفاده می شود. فرآیند کامل تجزیه و تحلیل داده ها شامل تعیین اهداف، طرح سوالات، جمع آوری داده ها، تجزیه و تحلیل داده ها، تجزیه و تحلیل داده ها و نتیجه گیری است.
میتوانید با استفاده از کتابخانههای پایتون مانند Cinemagoer یا از طریق پلتفرمهای آنلاین مانند Kaggle، مجموعه دادههای پروژههای خود را دریافت کنید. در کنار زبانهای کامل مانند Python و R، میتوانید از ابزارهای دیگری مانند Microsoft Excel، Tableau و Stata برای انجام تجزیه و تحلیل دادهها استفاده کنید.