آموزش پردازش فایل PDF با پایتون
اطلاعات میتوانند به صورت اسناد با فرمتهای مختلفی ایجاد شوند، یکی از این فرمتها PDF میباشد، که بسیار رایج و کاربردی است.
فرمت PDF یا Portable Document Format ابتدا توسط کمپانی Adobe معرفی شد، اما درحال حاضر سازمان بینالمللی استاندارد (ISO) آن را حفظ می کند و یک استاندارد باز است. بعضی از اجزای اصلی یک فایل PDF شامل متن ساده، دکمهها، فرمها، دکمههای رادیویی، تصاویر، صدا، ویدئو، امضا و ابردادهها هستند که با ابزارهای پایتونی نیز قابل استخراج هم هستند. در پایتون، میتوانیم عملیات مختلفی را برای پردازش اجزای فایل PDF و همچنین ایجاد فایلهای PDF انجام دهیم.
هدف از این آموزش آشنایی با ابزارهای لازم برای کار با PDF است. ابزارهای زیادی برای کار با این فایلها در زبان پایتون وجود دارد. در این آموزش، مهمترین این ابزارها را معرفی خواهیم کرد و روی فایلهای PDF عملیاتی را انجام خواهیم داد. لازمهی شروع فراگیری این آموزش، آشنا بودن به زبان پایتون در حد مقدماتی است.
سرفصل های دوره :
درس اول: نصب محیط برنامه نویسی برای پایتون
درس دوم: معرفی pip
درس سوم: معرف مخزن pypi
درس چهارم: کار با PyPdf2 – خواندن فایل و استخراج متن
درس پنجم: کار با PyPdf2 – مشاهده متادیتای فایل
درس ششم: کار با PyPdf2 – پسورد گذاری روی فایل
درس هفتم: کار با PyPdf2 – حذف پسورد فایل
درس هشتم: کار با PyPdf2 – چرخش صفحات فایل
درس نهم: کار با PyPdf2 – ساخت فایل pdf
درس دهم: کار با PyPdf2 – ادغام فایلهای pdf
درس یازدهم: کار با PyPdf2 – فشرده سازی فایل
درس دوازدهم: کار با PyPdf2 – حذف تصاویر از یک فایل
درس سیزدهم: کار با pikepdf – خواندن و ذخیره فایل
درس چهاردهم: کار با pikepdf – پسورد گذاری روی فایل
درس پانزدهم: کار با pikepdf – ذخیره محدودهای از صفحات یک فایل بعنوان فایل جداگانه
درس شانزدهم: کار با pikepdf – مشاهده متادیتای فایل
درس هفدهم: کار با pikepdf – جداسازی همه صفحات یک فایل بعنوان فایل جدگانه
درس هجدهم: کار با pikepdf – ادغام چندین فایل pdf بعنوان یک فایل
پیش نیاز های دوره :
- پایتون مقدماتی
نظرات کاربران در رابطه با این دوره