Das isses: Lade ein Buch aus #ScriptaPaedagogica der #BBF und erstelle einen #Volltext
$> ppn=1675717745 && curl -v -o $ppn.xml https://scripta.bbf.dipf.de/viewer/sourcefile?id=$ppn && mkdir -p tifs && cd tifs && ( (xmllint --xpath "//*[local-name()='FLocat']/@*[local-name()='href'][contains(.,'full/800')]" ../$ppn.xml | cut -c88-99) | xargs -I % curl -v -o %.jpg https://scripta.bbf.dipf.de/viewer/api/v1/records/1675717745/files/images/%/full/800,/0/default.jpg ) && ls -1 > input.txt && tesseract -l deu input.txt allInONe
#bash übrigens