در اینجا یک پروژه ساده وجود دارد که هنوز هم بسیار مفید است، به خصوص اگر از طرفداران کلمات گفتاری باشید.
کتابهای صوتی محبوبیت بیشتری نسبت به کتابهای الکترونیکی سنتی پیدا میکنند. آنها راحت تر هستند زیرا می توانید در هر زمان و هر مکان به آنها گوش دهید.
شما می توانید PDF کتاب الکترونیکی را با یک اسکریپت ساده پایتون به کتاب صوتی تبدیل کنید. با استفاده از چند کتابخانه ساده، میتوانید پروژهای ایجاد کنید که یک PDF را میخواند و کتاب صوتی را به عنوان یک فایل جدید ذخیره میکند.
نصب پکیج های مورد نیاز
برای شروع باید بسته های PyPDF3، pyttsx3 و pdfplumber را نصب کنید. شما می توانید این بسته ها را با استفاده از مدیر بسته pip نصب کنید. مطمئن شوید که پیپ را قبلا روی سیستم خود نصب کرده اید. برای نصب بسته ها دستور زیر را در خط فرمان اجرا کنید:
pip install PyPDF3 pyttsx3 pdfplumber
- شما می توانید از کتابخانه PyPDF3 برای خواندن و ویرایش فایل های PDF در پایتون استفاده کنید.
- کتابخانه pyttsx3 تبدیل متن به گفتار را فراهم می کند.
- pdfplumber یک کتابخانه است که به شما امکان می دهد متن و جداول را از فایل های PDF استخراج کنید.
کد مورد استفاده در این پروژه در یک مخزن GitHub موجود است و استفاده از آن تحت مجوز MIT برای شما رایگان است.
تبدیل PDF به کتاب صوتی با استفاده از پایتون
پس از نصب بستههای بالا، آماده وارد کردن آنها به فایل پایتون خود هستید:
import PyPDF3
import pyttsx3
import pdfplumber
شما باید نام و محل فایل PDF مورد نظر برای تبدیل را وارد کنید. برای سادگی، می توانید از هر نمونه فایل PDF استفاده کنید. آن را در همان دایرکتوری اسکریپت خود کپی کنید و نام آن را در یک متغیر ذخیره کنید. اگر Lorem.pdf نام دارد، برای مثال:
file = 'Lorem.pdf'
بعد، یک شی فایل برای فایل PDF و یک شی PDF خواننده ایجاد کنید:
book = open(file, 'rb')
pdfReader = PyPDF3.PdfFileReader(book)
بعداً، تمام صفحات فایل PDF را مرور خواهید کرد. برای یافتن تعداد کل صفحات، از ویژگی numPages استفاده کنید:
pages = pdfReader.numPages
اکنون، شما آماده استخراج متن از فایل PDF هستید:
finalText = ""
with pdfplumber.open(file) as pdf:
for i in range(0, pages):
page = pdf.pages[i]
text = page.extract_text()
finalText += text
از حلقه for برای تکرار در تمام صفحات و استخراج متن از PDF استفاده کنید. می توانید از بسته pdfplumber برای باز کردن فایل pdf و از روش extract_text برای واکشی متن از یک صفحه استفاده کنید.
با ذخیره متن کامل در یک متغیر، بسته به نیاز خود می توانید آن را بیشتر پردازش کنید. اگر می خواهید متن را به صدا تبدیل کنید و آن را در یک فایل جدید ذخیره کنید، از کد زیر استفاده کنید:
engine = pyttsx3.init()
engine.save_to_file(finalText, 'lorem.mp3')
engine.runAndWait()
هنگامی که این کد پایتون را اجرا می کنید، یک فایل کتاب صوتی در دایرکتوری خود ایجاد می کند.
اگر نمیخواهید کتاب صوتی را ذخیره کنید و مثلاً میخواهید فایل PDF را بازخوانی کنید، میتوانید به جای آن از کد زیر استفاده کنید:
engine = pyttsx3.init()
engine.say(finalText)
engine.runAndWait()
وقتی این اسکریپت را اجرا می کنید، فایل PDF را بازگو می کند.
توسعه پروژه ها با استفاده از پایتون
پایتون به خاطر تطبیق پذیری اش معروف است. با استفاده از پایتون می توانید به راحتی پروژه هایی با برنامه های کاربردی ایجاد کنید.
اگر به دنبال این هستید که دستان خود را با کد پایتون کثیف کنید، می توانید با توسعه پروژه های کوچک شروع کنید. برخی از ایده های شروع خوب عبارتند از یک برنامه مسابقه، ربات چت، بازی مار، کوتاه کننده URL، اسکراپر وب یا مبدل واحد.