Open Source-джентльмены 2026: Обзор самых ярких GitHub-проектов, определивших начало года

2025 год стал переломным для open-source-сообщества. Согласно ежегодной статистике GitHub, количество публичных репозиториев перевалило за 395 миллионов, а аудитория платформы выросла до 180 миллионов разработчиков. Но главная интрига развернулась на пьедестале языков программирования: TypeScript впервые сместил Python и JavaScript , став самым быстрорастущим языком с годовым приростом в 1 миллион новых разработчиков. Мы вступили в 2026 год, и тренд на «агентность» и «интеграцию с ИИ» перестал быть просто хайпом. Теперь это архитектурный стандарт. В этой статье я собрал проекты, которые буквально «взорвали» GitHub в конце 2025 и начале 2026 года. Это не просто игрушки, а реальные инструменты, меняющие ландшафт разработки.

https://habr.com/ru/articles/1003526/

#GitHub_2026 #open_source #AI #Python_libraries #agentic_workflows #vibe_coding #GitHub_Spark #PydanticAI #Smolagents #MarkItDown

Open Source-джентльмены 2026: Обзор самых ярких GitHub-проектов, определивших начало года

2025 год стал переломным для open-source-сообщества. Согласно ежегодной статистике GitHub, количество публичных репозиториев перевалило за 395 миллионов, а аудитория платформы выросла до 180 миллионов...

Хабр

Microsoft just released the open‑source MarkItDown library – it can unpack ZIP archives, read CSVs and render them as clean Markdown, all powered by LLMs via LangChain. A handy tool for developers building AI‑augmented docs and data pipelines. Dive in to see how it simplifies content handling! #MarkItDown #ZIP #LangChain #AI

🔗 https://aidailypost.com/news/microsofts-markitdown-library-converts-zip-files-unifying-supported

🧠 [RISORSA UTILE + COLAB]
#Microsoft ha pubblicato #MarkItDown, uno strumento in Python che converte file in Markdown.
👉 Ho creato un Colab pronto all’uso, con un’ulteriore integrazione: https://www.linkedin.com/posts/alessiopomaro_microsoft-markitdown-llm-activity-7373596011358912512-17dl

___
✉️ 𝗦𝗲 𝘃𝘂𝗼𝗶 𝗿𝗶𝗺𝗮𝗻𝗲𝗿𝗲 𝗮𝗴𝗴𝗶𝗼𝗿𝗻𝗮𝘁𝗼/𝗮 𝘀𝘂 𝗾𝘂𝗲𝘀𝘁𝗲 𝘁𝗲𝗺𝗮𝘁𝗶𝗰𝗵𝗲, 𝗶𝘀𝗰𝗿𝗶𝘃𝗶𝘁𝗶 𝗮𝗹𝗹𝗮 𝗺𝗶𝗮 𝗻𝗲𝘄𝘀𝗹𝗲𝘁𝘁𝗲𝗿: https://bit.ly/newsletter-alessiopomaro

#AI #GenAI #GenerativeAI #IntelligenzaArtificiale #LLM

Добавление OCR-слоя и другие преобразования PDF

При сканировании и сохранении в формате PDF зачастую документы сохраняются в виде графических изображений. Это неудобно, потому что делает невозможным полнотекстовый поиск по содержанию. Утилита OCRmyPDF решает эту проблему: она одной командой из консоли добавляет к PDF-документу слой OCR с распознанным текстом. Ниже упомянуты ещё несколько полезных инструментов для парсинга PDF, в том числе для преобразования сложных математических PDF-документов в текстовый формат Markdown.

https://habr.com/ru/companies/globalsign/articles/940286/

#pdf #syntax #markitdown #конвертация #ocrmypdf #ocr

Добавление OCR-слоя и другие преобразования PDF

OCRmyPDF выравнивает и оптимизирует PDF-файлы вместе с распознаванием текста При сканировании и сохранении в формате PDF зачастую документы сохраняются в виде графических изображений. Это неудобно,...

Хабр
Today I converted some DOCX documents to Markdown. I thought #markitdown is better at extracting texts from DOCX, since it's maintained by Microsoft. However, after trying it out, I found it's worse than #pandoc. #pandoc is able to handle the LaTeX formulas and preserves more formattings, while #markitdown cannot.

Together, nb and markitdown offer a powerful and convenient toolset for managing local notes.

`markitdown https://americansuburbx.com/2010/02/theory-standing-on-corner-reflections_08.html | nb add photography/`

🔗 https://github.com/xwmx/nb
🔗 https://github.com/microsoft/markitdown

#opensource #notestaking #notes #unix #tooling #nb #markitdown

Standing on the Corner - Reflections Upon Garry Winogrand's Photographic Gaze - Mirror of Self or World? Part II (1991)

Whenever I see it, I immediately hear a voice singing, "Standing on the corner watching all the girls go by." Yes, it is a sexist work. But that is a fact about Winogrand we must face and accept, if we are to honestly assess his picture-making. Part II (This is the second of a two-part essay on

AMERICAN SUBURB X

Just came across #MarkItdown for converting various formats to Markdown (for LLM purposes)...but also great and very accurate for general conversion purpose e.g. for extracting content from office formats for the purpose of indexing.

https://github.com/microsoft/markitdown

GitHub - microsoft/markitdown: Python tool for converting files and office documents to Markdown.

Python tool for converting files and office documents to Markdown. - microsoft/markitdown

GitHub

#開源分享 微軟髮布了一個文件轉換MCP:markitdown-mcp,用於將網頁連結(http/https)、本地文件以及數據轉換為Markdown格式!

主要是調用MarkItDown進行格式轉換。可以通過Docker運行或直接安裝,也可以與Claude等AI工具集成使用

專案地址: github.com/microsoft/markitdown/tree/main/packages/markitdown-mcp

#MCP #markitdown

Deep Dive into Microsoft MarkItDown

What is MarkItDown? MarkItDown is a Python package developed by Microsoft, designed to...