AISatoshi (@AiXsatoshi)

NVIDIA의 Nemotron OCR v2가 소개됐다. 이미지 내 문자 위치를 찾고, 텍스트를 읽어 문자열로 변환하며, 레이아웃과 읽기 순서까지 이해한다. 여러 줄 문서, 다중 블록 레이아웃, 간판·풍경 속 문자 등 복잡한 실제 OCR 환경에 대응하는 모델이다.

https://x.com/AiXsatoshi/status/2039548085156905224

#nvidia #ocr #nemotron #documentai #multimodal

AI✖️Satoshi⏩️ (@AiXsatoshi) on X

Nemotron OCR v2 NVIDIAのOCRモデル •画像のどこに文字があるか見つける •見つけた文字を読み取って文字列にする •レイアウトや読み順を理解する 複数行の文書、複数ブロックのレイアウト、看板や風景中の文字など、現実的で複雑なOCRにも対応

X (formerly Twitter)