Exploring IBM Docling: the new open-source toolkit for turning complex documents into structured data ready for #RAG and AI workflows. 📝⚡
Forget messy OCR—preserve tables, lists, formulas & layout, feeding #LangChain, #LangGraph, and other vector pipelines.
#AI #DocumentUnderstanding #OpenSource #VectorDB #DataEngineering #MachineLearning #LLM

Abhishek Yadav (@abhishek__AI)

GLM-OCR은 약 0.9B(9억) 파라미터의 경량 모델임에도 불구하고 문서 이해에서 SOTA 수준의 성능을 보인다고 평가됩니다. 특히 표 처리에 강하고 정보 추출이 깔끔하며 수식 인식도 견고해 문서 OCR 및 구조화된 정보 추출용으로 '빠르고 효율적인' 솔루션으로 소개되고 있습니다.

https://x.com/abhishek__AI/status/2018764025778286970

#glmocr #ocr #documentunderstanding #nlp #computervision

Abhishek Yadav (@abhishek__AI) on X

GLM-OCR is quietly impressive 👀 A SOTA level document understnding with just 0.9B params. - Strong on tables - Clean info extraction - Solid formula recognition Lean, fast, and very capable.

X (formerly Twitter)

Z.ai (@Zai_org)

GLM-OCR이라는 문서 이해 특화 모델이 공개되었습니다. 약 0.9B 파라미터로 설계되어 수식 인식, 표 인식, 정보 추출 등 복잡한 문서 이해 벤치마크에서 SOTA 성능을 달성했다고 보고하고 있습니다. 경량 모델로 실무 문서 처리에 최적화된 점을 강조합니다.

https://x.com/Zai_org/status/2018520052941656385

#glmocr #ocr #documentunderstanding #multimodal

Z.ai (@Zai_org) on X

Introducing GLM-OCR: SOTA performance, optimized for complex document understanding. With only 0.9B parameters, GLM-OCR delivers state-of-the-art results across major document understanding benchmarks, including formula recognition, table recognition, and information extraction.

X (formerly Twitter)

Abhishek Yadav (@abhishek__AI)

GLM-OCR이 매우 인상적이라는 평입니다. 파라미터 수가 0.9B에 불과함에도 문서 이해에서 SOTA 수준의 성능을 보이며 특히 표 처리, 정보 추출, 수식 인식에 강점을 보인다고 합니다. 경량·고속 문서 AI 모델의 유망 사례로 소개됩니다.

https://x.com/abhishek__AI/status/2018573637515915490

#glmocr #ocr #documentunderstanding #sota #smallmodels

Abhishek Yadav (@abhishek__AI) on X

GLM-OCR is quietly impressive 👀 A SOTA level document understnding with just 0.9B params. - Strong on tables - Clean info extraction - Solid formula recognition Lean, fast, and very capable.

X (formerly Twitter)

Python Trending (@pythontrending)

chandra는 복잡한 표, 양식(form), 필기체(handwriting)를 포함한 문서 레이아웃을 온전히 유지하면서 인식할 수 있는 OCR 모델로, 레이아웃 기반 문서 이해와 정보 추출 작업에 활용 가능한 신규 OCR 도구입니다.

https://x.com/pythontrending/status/2011476854364893281

#ocr #documentunderstanding #layout #handwriting

Python Trending 🇺🇦 (@pythontrending) on X

chandra - OCR model that handles complex tables, forms, handwriting with full layout. https://t.co/9wB0GNWCOB

X (formerly Twitter)

Urdaten presenta nueva herramienta digital

La empresa Urdaten lanzó su plataforma de inteligencia artificial y optimizó la gestión documental.

Por Deyanira Vázquez | Reportera                                        

La compañía mexicana Urdaten, con más de una década de experiencia en innovación digital, presentó su sistema Document Understanding. La herramienta buscó transformar la forma en que las organizaciones gestionaron expedientes y contratos electrónicos en México y Latinoamérica.

El sistema integró inteligencia artificial conversacional, procesos de automatización y seguridad con estándares bancarios internacionales. Con ello, las empresas redujeron tiempos de gestión documental, disminuyeron costos y minimizaron riesgos asociados a errores de captura.

El cofundador de la empresa, Sergio Haro, explicó que el wallet interpretó solicitudes en lenguaje natural. Además, garantizó trazabilidad, privacidad y cumplimiento normativo, ofreciendo a los usuarios un control automatizado en cada interacción.

Transformación y contexto regional

De acuerdo con la firma Quocirca, solo 11 % de las empresas globales operaron sin papel en 2024. En México, gran parte de los corporativos aún dependieron de procesos manuales para administrar contratos y expedientes legales.

El estudio indicó que un trabajador dedicó en promedio 9.3 horas semanales a buscar documentos. Ese tiempo representó más de una jornada laboral completa, lo cual generó pérdidas de productividad y retrasos en trámites esenciales para la competitividad.

El entorno de alta competencia empresarial impulsó la adopción de soluciones digitales más eficientes. En ese sentido, la plataforma de Urdaten ofreció ventajas claras al reducir la dependencia de registros físicos.

Más que una digitalización

La herramienta no solo procesó actas constitutivas, también ofreció un análisis jurídico automatizado. El sistema permitió ahorrar hasta 60 % de tiempo en revisiones, además de disminuir riesgos y costos operativos en 40 %.

El software organizó la información en secciones como resumen ejecutivo, riesgos principales, sugerencias de mejora y cláusulas destacadas. De esa manera, los equipos jurídicos se enfocaron en los puntos más relevantes sin revisar el documento completo.

El análisis legal incluyó la detección de riesgos específicos vinculados a normativas vigentes. También proporcionó alertas para atender posibles inconsistencias contractuales antes de que representaran un problema mayor.

Automatización de trámites

Otro diferenciador fue el llenado automático de formularios en procesos administrativos. La función simplificó gestiones frecuentes como solicitudes de crédito, trámites ante el SAT o inscripciones en el IMSS.

Lo que antes requería horas de captura manual, con el sistema se resolvió en minutos. Esto redujo errores humanos y optimizó áreas críticas en instituciones financieras, despachos jurídicos y dependencias gubernamentales.

El beneficio directo para las organizaciones incluyó mayor eficiencia en operaciones y disminución de costos asociados a la administración documental. –sn–

Sociedad Noticias

¡Conéctate con Sociedad Noticias! Suscríbete a nuestro canal de YouTube y activa las notificaciones, o bien, síguenos en las redes sociales: FacebookTwitter e Instagram.

También, te invitamos a que te sumes a nuestro canal de información en tiempo real a través de Telegram.

#NoticiasMX #PeriodismoParaTi #atenciónInmediata #automatizaciónDocumental #Cdmx #contratosDigitales #DocumentUnderstanding #gestiónDocumental #GobiernoFederal #IMSS #Información #InformaciónMéxico #inteligenciaArtificialMéxico #México #Morena #noticia #noticias #NoticiasMéxico #NoticiasSociedad #reduciendoCostosYTiemposOperativosParaCompañíasEnMéxicoYLatinoamérica_ #SAT #SeguridadDigital #SN #Sociedad #SociedadNoticias #SociedadNoticiasCom #sociedadNoticias #SociedadNoticiasCom #Urdaten

🎉 Behold, "Mistral OCR" - the #API that promises to revolutionize document understanding! 🚀 Because, clearly, centuries of human progress have led us to this pivotal moment where we can finally make sense of PDFs. 🙄 It's like discovering fire again... if fire was a glorified data extraction tool. 🔥📄
https://mistral.ai/news/mistral-ocr #MistralOCR #DocumentUnderstanding #RevolutionizeDataExtraction #TechInnovation #PDFProcessing #HackerNews #ngated
Mistral OCR | Mistral AI

Introducing the world’s best document understanding API.

🚀 Buckle up, folks! 🤓 Mistral OCR is here to revolutionize document understanding, because apparently we've been doing it all wrong since hieroglyphs. Who knew unlocking the "collective intelligence" of PDFs was the next frontier in human enlightenment? 🙄
https://mistral.ai/fr/news/mistral-ocr #MistralOCR #DocumentUnderstanding #TechInnovation #CollectiveIntelligence #HumanEnlightenment #HackerNews #ngated
Mistral OCR | Mistral AI

Introducing the world’s best document understanding API.

【UiPath】バージョン「23.4」AI / Document Understanding 機能改善紹介 - Qiita

はじめに本記事では、UiPath バージョン 23.4 の AI / Document Understanding の機能改善を幾つかピックアップして紹介します。記事の内容は、個人の見解または確…

Qiita
UiPath Document Understanding+AI CenterでML抽出をカスタマイズする方法 - Qiita

はじめにUiPath Document Understandingは、半定型帳票(*)の読取り精度が出なければ、再トレーニングで精度向上していくことができます。読み取れないフィールドも追加して、再…

Qiita