BG MVC Model View Controller eğitim serisi yayında...

Ana sayfa > Programlama > Python Programlama > Python örnek kodlar > python_pdf_to_excel

Python örnek kodlar

Çok sayfalı Pdf dosyasını Excel dosyasına çevirme

Program için aşağıda bilgileri ve sanal ortamda kurulum komutu verilen Spire.PDF kütüphanesini kullanacağız:

Spire.PDF kütüphanesi

Spire.PDF, Python uygulamaları içinde PDF dosyalarının oluşturulmasına, okunmasına, düzenlenmesine ve dönüştürülmesine olanak tanıyan, zengin özelliklere sahip bir kütüphanedir. Bu kütüphane ile PDF'ler üzerinde metin veya resim ekleme, metin veya resim çıkarma, dijital imza ekleme, sayfa ekleme veya silme, PDF'leri birleştirme veya bölme, yer imleri oluşturma, metin veya resim filigranları ekleme dahil olmak üzere çok çeşitli işlemler gerçekleştirebiliriz. Ayrıca PDF dosyalarını Word, Excel, görseller, HTML, SVG, XPS, OFD, PCL ve PostScript gibi çeşitli dosya formatlarına da dönüştürebiliriz.

Python ortamında aşağıdaki komutu kullanarak kurabiliriz:

pip install Spire.Pdf

# Spire yükleme
from spire.pdf.common import *
from spire.pdf import *

# PdfDocument sınıfından bir nesne oluşturma
pdf = PdfDocument()
# PDF dosyasını yükleme
pdf.LoadFromFile("dosya.pdf")

# Değişim seçeneklerini tanımlamak için XlsxLineLayoutOptions nesnesi oluşturma
'''
XlsxLineLayoutOptions constructor parametreleri: convertToMultipleSheet, rotatedText, splitCell, wrapText, overlapText
ConvertToMultipleSheet: Çok sayfalı PDF'nin birden fazla Excel sayfasına mı yoksa tek bir Excel sayfasına mı dönüştürüleceğini belirtir.
rotarydText: Döndürülmüş metnin gösterilip gösterilmeyeceğini belirtir.
splitCell: Birden çok satıra yayılan metin içeren bir PDF tablo hücresinin Excel'de birden çok satıra bölünüp bölünmeyeceğini belirtir.
sarmaText: Bir Excel hücresindeki metnin kaydırılıp kaydırılmayacağını belirtir.
OverlapText: Çakışan metnin görüntülenip görüntülenmeyeceğini belirtir.
​'''
convertOptions = XlsxLineLayoutOptions(False, True, False, True, False)

# Değişim seçeneklerini ayarlama
pdf.ConvertOptions.SetPdfToXlsxOptions(convertOptions)

# PDF dosyayı Excel XLSX dosyası olarak kaydetme
pdf.SaveToFile("dosya.xlsx", FileFormat.XLSX)
# PdfDocument nesnesini kapatma
pdf.Close()

Programı çalıştırdığımızda, dosya.pdf adlı dosyayı yükler. Yüklenen dosyayı Excel formatına çevirerek kaydeder.