خبر و ترفند روز

خبر و ترفند های روز را اینجا بخوانید!

نحوه تبدیل فایل PDF به کتاب صوتی با استفاده از پایتون

در اینجا یک پروژه ساده وجود دارد که هنوز هم بسیار مفید است، به خصوص اگر از طرفداران کلمات گفتاری باشید.

کتاب‌های صوتی محبوبیت بیشتری نسبت به کتاب‌های الکترونیکی سنتی پیدا می‌کنند. آنها راحت تر هستند زیرا می توانید در هر زمان و هر مکان به آنها گوش دهید.

شما می توانید PDF کتاب الکترونیکی را با یک اسکریپت ساده پایتون به کتاب صوتی تبدیل کنید. با استفاده از چند کتابخانه ساده، می‌توانید پروژه‌ای ایجاد کنید که یک PDF را می‌خواند و کتاب صوتی را به عنوان یک فایل جدید ذخیره می‌کند.

نصب پکیج های مورد نیاز

برای شروع باید بسته های PyPDF3، pyttsx3 و pdfplumber را نصب کنید. شما می توانید این بسته ها را با استفاده از مدیر بسته pip نصب کنید. مطمئن شوید که پیپ را قبلا روی سیستم خود نصب کرده اید. برای نصب بسته ها دستور زیر را در خط فرمان اجرا کنید:

pip install PyPDF3 pyttsx3 pdfplumber

  • شما می توانید از کتابخانه PyPDF3 برای خواندن و ویرایش فایل های PDF در پایتون استفاده کنید.
  • کتابخانه pyttsx3 تبدیل متن به گفتار را فراهم می کند.
  • pdfplumber یک کتابخانه است که به شما امکان می دهد متن و جداول را از فایل های PDF استخراج کنید.

کد مورد استفاده در این پروژه در یک مخزن GitHub موجود است و استفاده از آن تحت مجوز MIT برای شما رایگان است.

تبدیل PDF به کتاب صوتی با استفاده از پایتون

پس از نصب بسته‌های بالا، آماده وارد کردن آنها به فایل پایتون خود هستید:

import PyPDF3
import pyttsx3
import pdfplumber

شما باید نام و محل فایل PDF مورد نظر برای تبدیل را وارد کنید. برای سادگی، می توانید از هر نمونه فایل PDF استفاده کنید. آن را در همان دایرکتوری اسکریپت خود کپی کنید و نام آن را در یک متغیر ذخیره کنید. اگر Lorem.pdf نام دارد، برای مثال:

مطلب مرتبط:   9 زبان برنامه نویسی که رو به انقراض هستند

file = 'Lorem.pdf'

بعد، یک شی فایل برای فایل PDF و یک شی PDF خواننده ایجاد کنید:

book = open(file, 'rb')
pdfReader = PyPDF3.PdfFileReader(book)

بعداً، تمام صفحات فایل PDF را مرور خواهید کرد. برای یافتن تعداد کل صفحات، از ویژگی numPages استفاده کنید:

pages = pdfReader.numPages

اکنون، شما آماده استخراج متن از فایل PDF هستید:

finalText = ""

with pdfplumber.open(file) as pdf:
for i in range(0, pages):
page = pdf.pages[i]
text = page.extract_text()
finalText += text

از حلقه for برای تکرار در تمام صفحات و استخراج متن از PDF استفاده کنید. می توانید از بسته pdfplumber برای باز کردن فایل pdf و از روش extract_text برای واکشی متن از یک صفحه استفاده کنید.

با ذخیره متن کامل در یک متغیر، بسته به نیاز خود می توانید آن را بیشتر پردازش کنید. اگر می خواهید متن را به صدا تبدیل کنید و آن را در یک فایل جدید ذخیره کنید، از کد زیر استفاده کنید:

engine = pyttsx3.init()
engine.save_to_file(finalText, 'lorem.mp3')
engine.runAndWait()

هنگامی که این کد پایتون را اجرا می کنید، یک فایل کتاب صوتی در دایرکتوری خود ایجاد می کند.

اگر نمی‌خواهید کتاب صوتی را ذخیره کنید و مثلاً می‌خواهید فایل PDF را بازخوانی کنید، می‌توانید به جای آن از کد زیر استفاده کنید:

engine = pyttsx3.init()
engine.say(finalText)
engine.runAndWait()

وقتی این اسکریپت را اجرا می کنید، فایل PDF را بازگو می کند.

توسعه پروژه ها با استفاده از پایتون

پایتون به خاطر تطبیق پذیری اش معروف است. با استفاده از پایتون می توانید به راحتی پروژه هایی با برنامه های کاربردی ایجاد کنید.

اگر به دنبال این هستید که دستان خود را با کد پایتون کثیف کنید، می توانید با توسعه پروژه های کوچک شروع کنید. برخی از ایده های شروع خوب عبارتند از یک برنامه مسابقه، ربات چت، بازی مار، کوتاه کننده URL، اسکراپر وب یا مبدل واحد.