Mastodawn

Check this tutorial https://youtu.be/orsfcXDSTNw (watch to ~middle) for local Tesseract OCR digitization of handwritten notes.
Scan → extract text offline → clean & enhance with AI. Simple, cost-free workflow. #TesseractOCR #HandwrittenToDigital #Productivity

5 Steps to Digitize Handwritten Notes (Tesseract OCR)

YouTube

Michał Turski Jan 4

Kennt jemand gute Einstiegstutorial zum HTR? Ich möchte ein Model für HTR der polnischen und deutschen Handschrift für eigene Forschungszwecke entwickeln, bin ich aber in der Tesseract Dokumentation völlig lost.

Lebt e-Scriptorium-Projekt noch? Kann man den auf eigenem Computer installieren und ausprobieren? #HTR #OCR #eScriptorium #Tesseractocr

Habr Jul 12, 2024

Как я хотел выиграть пиццы у Dodo (бот на python)

Моя неплохая попытка выиграть Пиццы от Додо с их конкурсом по игре Балда, которая почти окончилась успехом. Пытаюсь переиграть всех

https://habr.com/ru/articles/828522/

#python #додо #додопицца #бот #pyautogui #pillow #easyocr #tesseract #tesseractocr #автоматизация

Как я хотел выиграть пиццы у Dodo (бот на python)

Балда от Dodo Пиццы Тут я буду писать код!! и на Python Как-то друг мне показал пост ВКонтакте из паблика Додо Пиццы. Там говорилось как-то так Мы запускаем нашу игру "Балда" . В течении (~месяца) за...

Хабр

Stefan Weil Jun 6, 2024

Extra zur #BiblioCON24 gibt's das neue Release 5.4.0 für #TesseractOCR, unsere Standardlösung für die automatisierte Texterkennung (nicht nur) bei der #Zeitungsdigitalisierung. Tesseract kann jetzt auch #PAGEXML erzeugen und generiert schönere PDF-Dateien.

David Sullivan Apr 28, 2024

I made an example OCR app that highlights word confidence in the results. Handles images and pdfs.

https://github.com/tkroo/tesseract.js-sveltekit

#sveltekit #tesseractOCR #ocr

GitHub - tkroo/tesseract.js-sveltekit: A SvelteKit app that uses tesseract.js for text recognition.

A SvelteKit app that uses tesseract.js for text recognition. - tkroo/tesseract.js-sveltekit

GitHub

Show thread

bs2 Mar 8, 2024

It was great to see books by Paolo Freire and John Dewey mentioned in Greta Goetz's post about Education and Free Software. I didn't know you could link to a page of a book on #ArchiveOrg. Archive is usefull with both pdf and full text versions. So far their full text seems better than the text I get from #TesseractOCR . Here are the paragraphs cited by #GretaGoetz from
#EducationForCriticalConsciousness and #ProblemsOfMen , #DemocracyAndEducation

Habr Jan 23, 2024

Оптическое распознавание символов и разбор чеков Rimi

Некоторое время назад в нашей стране крупные сети магазинов стали вводить электронные чеки. В частности, магазины сети Rimi . Эти чеки покупатель получает по почте в виде PDF документа. У меня скопилось много таких чеков, и мне стало интересно посмотреть на разного рода статистику: например, на цены на различные товары в разное время, сколько чего было приобретено и т. п. К сожалению, PDF документы, которые покупатели получают – это картинка. Получить интересующую меня информацию из них без оптического распознавания символов ( OCR ) невозможно. Однако, OCR , как оказалось, не на столько хорош, чтоб идеально справиться и точно всё распознать с первого раза. И это несмотря на то, что чеки достаточно хорошего качества: строки ровные, нет никаких артефактов в виде тёмных пятен, буквы достаточно одинаковые (правда присутствуют несколько разных шрифтов).

https://habr.com/ru/articles/788296/

#OCR #tesseractocr #parsing #parsing_data

Оптическое распознавание символов и разбор чеков Rimi

Введение Некоторое время назад в нашей стране крупные сети магазинов стали вводить электронные чеки. В частности, магазины сети Rimi . Эти чеки покупатель получает по почте в виде PDF документа. У...

Хабр

heikofotografiert Oct 14, 2023

@njakob

Irgendwo hab ich auch noch einen Collegeblock, auf dem ein halbes Kapitel steht, das musste ich dann mühsam abtippen.

Wenn die neue (K)Ubuntu Version draußen ist, will ich meinem Rechner ne neue Platte gönnen (wir sprachen ja neulich schon davon) und nochmal alles neu und vernünftig aufspielen.

Hatte vor langer Zeit mal damit angefangen, Flachbettscanner und #TesseractOCR sauber aufeinander abgestimmt aufzusetzen und Tesseract dann u.a. an meine beiden mechanischen Schreibmaschinen zu "gewöhnen". Das klappt ganz gut und der ausgelesene Fließtext ist nahezu fehlerfrei.

Selbiges will ich dann, wenn ich zumindest meinen Haufen Schmerzmittel los bin, auch für Handschrift einrichten. Das lohnt sich aber erst dann, wenn meine Sauklaue wieder wie gewohnt schlampig aussieht.

Das ist dann für mich ein guter Mittelweg... egal womit geschrieben, einfach durch den Scanner jagen und fertig is.

Naja, Du bist es ja gewohnt, das meiste eben auf dem Fon oder dem Tablet zu machen. Dann würde ich wohl auch so arbeiten, wie Du es jetzt tust. Ich habe ja den zweifelhaften Luxus meines gepflegten Durcheinanders und muss mir dafür ein Konzept zusammenfummeln. 😀

Mal sehen, worauf es dann hinauslaufen wird. Ganz ablassen vom Zettelgeschmiere kann ich wohl eher nicht. 😉

Stefan Weil Oct 6, 2023

Yesterday we made a new release 5.3.3 for #TesseractOCR. It fixes a bug in the layout recognition, so everybody who uses Tesseract for #OCR should update.

Kaan Barmore-Genc Feb 11, 2023

People sometimes shit on web development, but it's crazy how fast you can build with modern web.

I had an idea around reading product labels from images on a phone. So I grabbed the #SvelteKit template, added #TailwindCSS and #TesseractOCR, and put together with an input type="file". Then I used bore.pub to connect it to my phone and boom, I can take a photo on my phone and have text OCRed with one button. Built in under an hour.