Abhishek Yadav (@abhishek__AI)

MarkItDown이 공개됐다. OCR, 오디오, YouTube, PDF, 문서, Excel, PPT 등 다양한 파일을 LLM용 깔끔한 Markdown으로 변환해 주는 100% 오픈소스 도구로, AI 파이프라인의 전처리를 크게 간소화한다.

https://x.com/abhishek__AI/status/2044256285672255743

#opensource #llm #markdown #ocr #datapipeline

Abhishek Yadav (@abhishek__AI) on X

Your AI pipeline just got upgrade MarkItDown turns messy files into clean Markdown for LLMs. → OCR, Audio, YouTube → PDFs, Docs, Excel, PPT → Structured, token efficient output 100% Open Source

X (formerly Twitter)