Scanned PDFs are often just images, making it impossible to search for text or copy content. K4PDF's OCR tool extracts selectable text from scanned pages, making your documents searchable and easier to reuse. Read our guide to learn how to implement text recognition: https://k4pdf.com/blog/ocr-pdf-text-recognition?utm_source=mastodon&utm_medium=social&utm_campaign=daily_pdf_news&utm_content=2026-06-23-ocr #PDF #OCR #Workflow
PDF OCR Free Online | Convert Scanned PDF to Text - K4PDF Suite

Convert scanned PDFs to searchable text with free OCR technology. Multi-language support, extract text from images, create searchable documents.

K4PDF Suite

«Клиенты приходят не только из-за курса»: как РНКО «Металлург» 10 лет живет без ручного ввода паспорта

Привет, Хабр! На связи Smart Engines. Недавно мы провели открытый диалог с Егором Карасевым, первым заместителем Председателя Правления РНКО «Металлург», и обсудили наше сотрудничество длиной в 10 лет. Все это время компания использует технологии Smart Engines для распознавания паспортов клиентов в отделениях. Получился разговор не столько об OCR, сколько о том, как автоматизация меняет потоковое обслуживание, снижает нагрузку на сотрудников и помогает бизнесу не терять клиентов из-за ручного ввода данных. Под катом – история о том, как паспортный сканер, взятый с выставки «на попробовать», стал частью банковского процесса, который работает уже одиннадцатый год.

https://habr.com/ru/companies/smartengines/articles/1050548/

#распознавание_паспорта #распознавание_документов #банки #обслуживание_клиентов #ocr #ocrтехнологии #успех #успех_проекта #распознавание_изображений #финансы

«Клиенты приходят не только из-за курса»: как РНКО «Металлург» 10 лет живет без ручного ввода паспорта

Привет, Хабр! На связи Smart Engines. Недавно мы провели открытый диалог с Егором Карасевым, первым заместителем Председателя Правления РНКО «Металлург», и обсудили наше сотрудничество длиной в 10...

Хабр
CircleToSearch: بديل مفتوح المصدر لميزة Circle to Search من Google بتحكم كامل وخصوصية

CircleToSearch هو تطبيق أندرويد مفتوح المصدر يقدم تجربة Circle to Search الشهيرة لجميع الأجهزة، مع دعم محركات بحث متعددة (Google وBing وYandex وTinEye وChatGPT) وميزة OCR محلية تعمل دون اتصال بالإنترنت، مع الحفاظ على ...

🔗 https://salehgnutux.github.io/GT-NEWSTECH/ar/foss/circletosearch-open-source-alternative/

#CircleToSearch #Circle_to_Search #بحث_عكسي #OCR #أندرويد #مفتوح_المصدر #خصوصية #gnutux
CircleToSearch: بديل مفتوح المصدر لميزة Circle to Search من Google بتحكم كامل وخصوصية

CircleToSearch هو تطبيق أندرويد مفتوح المصدر يقدم تجربة Circle to Search الشهيرة لجميع الأجهزة، مع دعم محركات بحث متعددة (Google وBing وYandex وTinEye وChatG...

GT-NEWSTECH

some self hosting resources and some nice tools

#notes #video #motion #ocr #selfhosting

https://jbrio.net/posts/202624/

Notes 202624 :: Juan B. Rodriguez

some self hosting resources and some nice tools

I got some days off, recovery days - need to get llc done, have to read more

do more homework on printer, i will use it

will i ever get a 3d printer - sure at some point - that is almost a shop tool
#paperless-ngx #ocr #qrcodes #stencils

Random Thoughts: Searchable comics text pages?. “After finding a collection of Marvel Bullpen Bulletins for the search engine for magazines about comics, I started to wonder whether it’d be useful (or fun) to include text pages from comics in general. I mean — editorials, letters pages, ‘hype pages’… There’s information there that’s not available anywhere else. So… perhaps? Maybe?”

https://rbfirehose.com/2026/06/19/random-thoughts-searchable-comics-text-pages/
Random Thoughts: Searchable comics text pages?

Random Thoughts: Searchable comics text pages?. “After finding a collection of Marvel Bullpen Bulletins for the search engine for magazines about comics, I started to wonder whether it’d be u…

ResearchBuzz: Firehose
Besoin de bricoler vite fait une #image, ralentir un #gifanim extraire du texte d'un scan #ocr générer un #qrcode , virer un arrière-plan, retoucher une image, rogner, redimensionner, convertir… c'est le moment de découvrir la framatoolbox "images" : https://omnitools.framatoolbox.org/categories/image-generic merci @Framasoft
OmniTools

@dianea @alice so basically what we all know as OCR, "Big Data" and "Machine Learning" for ages…

  • Like the Oltmann - Style 'stochastic translator' used by Google Translate which uses a set "known correct translations" licensed under permissible terms (i.e. legal documents from the likes of UN, EU & others which have been professionally translated and proofread)…

The only ethical setups I see is either self-hosted (i.e. research and when it comes to handling confidential datasets in a compliant manner) or in limited circumstances where it's computational footprint is negligible [i.e. we've been doing OCR for over a quarter century, thus we got really good at it]…

  • Otherwise I see "AI" like Car Useage: Every car on the road is a failure of Public Transport to meet demand & needs.

#AI #OCR #BigData #MachineLearning #translation #AltText

AI를 활용한 글로벌 FMCG 브랜드의 품질 문서 10만 건 자동 처리 사례

글로벌 FMCG 기업이 10만 건 이상의 품질 테스트 PDF 문서를 AI로 자동 추출 및 검증하여 수동 검토 노력을 80% 절감했다.

🔗 원문 보기

AI를 활용한 글로벌 FMCG 브랜드의 품질 문서 10만 건 자동 처리 사례

글로벌 FMCG 기업이 10만 건 이상의 품질 테스트 PDF 문서를 AI로 자동 추출 및 검증하여 수동 검토 노력을 80% 절감했다.

Ruby-News

[Перевод] Почему промпты для VLM работают наоборот: как это исправить

Недавно я пытался выжать максимум из корпоративной OCR-модели, перебирая промпты и гиперпараметры, когда наткнулся на issue в репозитории Qwen-3-VL. Автор утверждал, что точность задачи выросла просто от изменения порядка: сначала изображение, потом текст. Просто перестановка блоков.

https://habr.com/ru/articles/1049176/

#prompt_engineering #vlm #ocr #Qween #Gemma #Positional_Encoding

Почему промпты для VLM работают наоборот: как это исправить

Недавно я пытался выжать максимум из корпоративной OCR-модели, перебирая промпты и гиперпараметры, когда наткнулся на issue в репозитории Qwen-3-VL. Автор утверждал, что точность задачи выросла просто...

Хабр