Nathan (@nathanhabib1011)

@VikParuchuri 팀이 신규 OCR 모델 Chandra OCR 2를 공개했다. olmocr 벤치마크 1위(85.9%)를 기록했고, 90개 이상 언어 지원, 40억 파라미터 규모, 레이아웃 정보 추출, 이미지·도표 캡션 생성, 필기·수식·양식 인식 강화 등 문서 이해 기능이 크게 향상됐다.

https://x.com/nathanhabib1011/status/2034565076963991910

#ocr #chandra #opensource #documentai #multilingual

Nathan (@nathanhabib1011) on X

NEW SOTA OCR MODEL DROPPED Congrats to @VikParuchuri and team for releasing Chandra OCR 2! - 85.9% on olmocr bench, making it first place 🏆 - 90+ language support - 4B model - Full layout information - Extracts + captions images and diagrams - Strong handwriting, math, form,

X (formerly Twitter)

Baidu Inc. (@Baidu_Inc)

Qianfan-OCR가 공개되었습니다. 문서 지능을 위한 4B 파라미터 엔드투엔드 모델로, 단일 패스로 표 추출, 수식 인식, 차트 이해, 핵심 정보 추출을 모두 수행합니다. 파이프라인 없이 문서 처리 작업을 통합한 점이 핵심입니다.

https://x.com/Baidu_Inc/status/2034265136182202765

#ocr #documentai #multimodal #ai #opensource

Baidu Inc. (@Baidu_Inc) on X

🚀 Introducing Qianfan-OCR: a 4B-parameter end-to-end model for document intelligence. One model. No pipeline. Table extraction, formula recognition, chart understanding, and key information extraction, all in a single pass. Paper: https://t.co/cmNhv5SLgV Models:

X (formerly Twitter)

GLM-OCR runs locally on 2GB VRAM, handles tables and math equations, and hits 260 tok/s on a Mac.

No cloud API. No subscription. Just your machine.

Local models are getting better and smaller faster than anyone expected.

https://x.com/RoundtableSpace/status/2033547584208580991

#glmocr #ocr #localai #ondevice #smallmodels

0xMarioNawfal (@RoundtableSpace) on X

GLM-OCR runs locally on 2GB VRAM, handles tables and math equations, and hits 260 tok/s on a Mac. No cloud API. No subscription. Just your machine. Local models are getting better and smaller faster than anyone expected.

X (formerly Twitter)

Gerade 32 Seiten mit dem #Einzugsscanner gescannt...

Dann wieder in die Küche zum Essen geschaut.
Dort ist ein Lärm...

Oh.

Naja das Dokument ist im SMB Share gelandet und da hat es #paperlessngx geholt, #OCR gemacht und den Inhalt per ML bewertet...
Da ging der CPU Lüfter von dem #Proxmox mal kurz auf Vollast an^^

New blog post: Co-working and 25 years of eggs – The Distant Librarian https://distlib.pival.me/co-working-and-25-years-of-eggs/

#distlib #EthanMollick #Co-intelligence #Co-working #OCR

Co-working and 25 years of eggs – The Distant Librarian

Baidu Inc. (@Baidu_Inc)

Qianfan-OCR 소개: 문서 인텔리전스를 위한 4B 파라미터 엔드투엔드 모델로, 하나의 모델만으로 파이프라인 없이 테이블 추출, 수식 인식, 차트 이해, 핵심 정보 추출 등을 단일 패스로 처리한다. 관련 논문(arXiv) 링크가 제공됨.

https://x.com/Baidu_Inc/status/2034265136182202765

#qianfanocr #ocr #documentintelligence #arxiv

Holà,
J'ai un soucis de freeze sur #linux #mint ;
Ça arrive lors de la manpulation de fichiers PDF assez lourd (2 à 5M) avec de l #ocr

C'est un ordi de puissance correct; j'ai pas trouvé d'autres solutions que d'eayyer de mettre une limite sur l'usage du processeur dans le lanceur du visionneur pdf :

cpulimit -l 50 -- xreader %U

Est-ce que des personnes ont d'autres solutions ? Est ce que vous pensez cette solution peut poser problème ?

🚀 Running #OCR at scale with a #Vision #LLM for $0.49/hour

Just deployed dots.ocr (3B parameter Vision LLM by RedNote) on a single #RTX A6000 (48GB VRAM) via #RunPod. The results are great:

https://github.com/rednote-hilab/dots.ocr

#ai #opensource

📄 The Setup
- Upload any #PDF → server converts each page to an image (PyMuPDF)
- Images are sent in parallel to #vLLM (continuous batching)
- The Vision LLM reads each page and returns clean Markdown

🧵 👇

Как маскировать персональные данные на изображениях: наш эксперимент с OCR и NER

Всем привет! Меня зовут Андрей Иванов, я NLP-исследователь в R&D red_mad_robot. Мы разрабатываем систему Guardrails для защиты персональных данных (PII) и фильтрации небезопасного контента. В этой статье расскажу, как мы решали задачу точечного маскирования PII на картинках без обучения специальных визуальных детекторов. Разберём связку оптического распознавания символов (OCR) с NER-моделью, покажем метрики на реальных данных, раскроем ограничения подхода и наши решения для их преодоления.

https://habr.com/ru/companies/redmadrobot/articles/1011450/

#ai #llm #ocr #ner #pii #computer_vision #маскирование_данных #обработка_изображений #nlp #rnd

Как маскировать персональные данные на изображениях: наш эксперимент с OCR и NER

Всем привет! Меня зовут Андрей Иванов, я NLP-исследователь в R&D red_mad_robot. Мы разрабатываем систему Guardrails для защиты персональных данных (PII) и фильтрации небезопасного контента. В этой...

Хабр

Ein kleines Nebenprojekt: Neue #OCR, leichte Auswertung und Webseitenbildung von gemeinfreien Texten, erstmal aus Naglers "Neuem allgemeinem Künstlerlexikon".

https://resources.museum-digital.org/

resources.museum-digital.org - Gemeinfreie Quellen nutzbarer machen :: museum-digital:resources

Ziele und Methoden von resources.museum-digital.org.