Why we shrank our TimescaleDB chunks from 30 days to 7

By Yask Srivastava

Medium

Ho iniziato a divertirmi con l'approccio #RAG in occasione delle elezioni amministrative a Venezia, quando ho organizzato una base di conoscenza in #markdowne una piccola app in #vibecoding.

Oggi, ho riutilizzato quella base per sperimentare alcuni tool come Gitbook e ottimizzare la struttura, l'indicizzazione e il #chunking all'organizzazione del flusso, poi i tool aiutano a rendere il Mini-RAG interrogabile in linguaggio naturale.

Ed è davvero tanta roba!

👉 https://medium.com/webeconoscenza/il-tuo-mini-rag-gratis-f0a9663c9a15

RAG в enterprise: 70-80% проблем не в модели, а в данных

Эта статья родилась из работы над

https://habr.com/ru/companies/alpinadigital/articles/1036196/

#RAG #enterprise_AI #retrieval_augmented_generation #embeddings #GraphRAG #Agentic_RAG #BM25 #chunking #LLM #AlpinaGPT

RAG в enterprise: 70-80% проблем не в модели, а в данных

Жемал Хамидун, Head of AI Alpina Digital , CPO AlpinaGPT , автор тг-канала «Готовим ИИшницу» . Эта статья родилась из работы над AlpinaGPT . Мы недавно зарелизили в нём по-настоящему крутых...

Хабр

Стриминг ответов в Telegram-боте: новый API и 100 строк Python

1 марта 2026 Telegram добавил в Bot API метод sendMessageDraft - возможность потокового вывода сообщений. Тот самый эффект, к которому все привыкли в ChatGPT и Claude. Текст появляется по частям, в конце бегают анимированные точки, и ты видишь, что ответ ещё генерируется. Я написал простенький рабочий пример на чистом Python - без каких-либо фреймворков. Только asyncio и urllib .

https://habr.com/ru/articles/1019836/

#telegram #telegram_bot #telegram_api #stream #chunking

Стриминг ответов в Telegram-боте: новый API и 100 строк Python

1 марта 2026 Telegram добавил в Bot API метод  sendMessageDraft  - возможность потокового вывода сообщений. Тот самый эффект, к которому все привыкли в ChatGPT и Claude. Текст появляется по...

Хабр

Learn how chunking strategies impact RAG performance in 2026, including fixed-size, semantic, and hybrid approaches. Discover optimization techniques for use cases like medical research and legal analysis using tools like LangChain and embedding models.

#RAG #chunking #semantic chunking #LangChain #embedding models

https://dasroot.net/posts/2026/02/chunking-strategies-rag-performance/

Chunking Strategies: The Hidden Lever in RAG Performance

Learn how chunking strategies impact RAG performance in 2026, including fixed-size, semantic, and hybrid approaches. Discover optimization techniques for use cases like medical research and legal analysis using tools like LangChain and embedding models.

Technical news about AI, coding and all

🧠 New preprint by Zhong et al. proposes a #synaptic mechanism for #chunking in #WorkingMemory.

Using short-term #plasticity and synaptic augmentation, their model shows how items can be temporarily suppressed and later retrieved as chunks, increasing effective capacity w/o increasing simultaneous activity.

🌍 https://doi.org/10.7554/eLife.109538.1

#Neuroscience #CompNeuro #SynapticPlasticity

so, you want to chunk really fast?

How we built memchunk - a blazing fast text chunking library using SIMD and memchr for RAG pipelines

Topaz

Архитектура высоконагруженных RAG-систем: 10 стратегий оптимизации чанкинга и интеграция с Weaviate, Qwen / Llama /Gemma

Привет, Хабр! Это Андрей Носов, AI-архитектор в компании Raft, проектирую и внедряю высоконагруженные RAG-системы на предприятиях. Сегодня я расскажу о вызовах, которые мы преодолеваем каждый день, создавая такие системы, и сделаю акцент на чанкинге. Обозначим направления, в которых мы будем работать. Сегодня поговорим только о двух возможностях применения больших языковых моделей — это MedTech и LegalTech. Они наиболее востребованные на рынке в текущий момент в плане систем поиска. Такой выбор направлений связан с глобальным трендом на работу с профессиональными знаниями, о котором говорят Gartner и OpenAI.

https://habr.com/ru/companies/oleg-bunin/articles/967102/

#rag #chunking #llm #genai #архитектура #чанкинг #highload #highload++

Архитектура высоконагруженных RAG-систем: 10 стратегий оптимизации чанкинга и интеграция с Weaviate, Qwen / Llama /Gemma

Привет, Хабр! Это Андрей Носов, AI-архитектор в компании Raft, проектирую и внедряю высоконагруженные RAG-системы на предприятиях. Сегодня я расскажу о вызовах, которые мы преодолеваем каждый день,...

Хабр

Mô hình ngữ cảnh dài có thực sự giải quyết 'attention dilution'? Có người cho rằng Gemini 1M context loại bỏ RAG/chia nhỏ tài liệu. Tuy nhiên, tác giả bài viết nghi ngờ, kinh nghiệm cho thấy hiệu suất giảm mạnh sau 100K-200K token. Điều này rất quan trọng với tài liệu pháp lý cần độ chính xác cao.

#AI #LLM #LongContext #AttentionDilution #RAG #Chunking #Gemini #TechNews #ArtificialIntelligence
#MôHìnhAI #NgữCảnhDài #XửLýNgônNgữ #CôngNghệ #TríTuệNhânTạo #HỏiĐáp

https://www.reddit.com/r/LocalLLa