PDF parsen

Manchmal muss man PDF-Dateien auslesen. Dieser Artikel zeigt, wie man das mit einem Python-Skript macht.

#PDF #Parser #parsen #Auslesen #pypdf #Linux

https://gnulinux.ch/pdf-parsen

PDF parsen

Manchmal muss man PDF-Dateien auslesen. Dieser Artikel zeigt, wie man das mit einem Python-Skript macht.

GNU/Linux.ch
@gnulinux Danke! Ich muss meine Python-Kenntnisse wieder auffrischen. Ich stehe tatsächlich auch öfters vor dem Problem, strukturierte Daten aus PDF "rauszuholen".
@gisiger Gerne. Ich kann ein wenig Python-knowhow nur empfehlen. Ein paar einfache Python-Skripte haben mir schon viel Arbeit abgenommen. /Ralf
@gnulinux deine PDFs beinhalten den Text aber schon direkt, OCR ist nicht notwendig, oder?
@Kernic Ja, sie enthalten den Text. Mit OCR wäre es noch schwieriger. /Ralf