We shrank our TimescaleDB chunks from 30 days to 7
https://tech.wmg.com/why-we-shrank-our-timescaledb-chunks-from-30-days-to-7-07cab8afefc5
#HackerNews #TimescaleDB #database #optimization #dataengineering #chunking #performance
Ho iniziato a divertirmi con l'approccio #RAG in occasione delle elezioni amministrative a Venezia, quando ho organizzato una base di conoscenza in #markdowne una piccola app in #vibecoding.
Oggi, ho riutilizzato quella base per sperimentare alcuni tool come Gitbook e ottimizzare la struttura, l'indicizzazione e il #chunking all'organizzazione del flusso, poi i tool aiutano a rendere il Mini-RAG interrogabile in linguaggio naturale.
Ed è davvero tanta roba!
👉 https://medium.com/webeconoscenza/il-tuo-mini-rag-gratis-f0a9663c9a15
RAG в enterprise: 70-80% проблем не в модели, а в данных
Эта статья родилась из работы над
https://habr.com/ru/companies/alpinadigital/articles/1036196/
#RAG #enterprise_AI #retrieval_augmented_generation #embeddings #GraphRAG #Agentic_RAG #BM25 #chunking #LLM #AlpinaGPT
Стриминг ответов в Telegram-боте: новый API и 100 строк Python
1 марта 2026 Telegram добавил в Bot API метод sendMessageDraft - возможность потокового вывода сообщений. Тот самый эффект, к которому все привыкли в ChatGPT и Claude. Текст появляется по частям, в конце бегают анимированные точки, и ты видишь, что ответ ещё генерируется. Я написал простенький рабочий пример на чистом Python - без каких-либо фреймворков. Только asyncio и urllib .
Learn how chunking strategies impact RAG performance in 2026, including fixed-size, semantic, and hybrid approaches. Discover optimization techniques for use cases like medical research and legal analysis using tools like LangChain and embedding models.
#RAG #chunking #semantic chunking #LangChain #embedding models
https://dasroot.net/posts/2026/02/chunking-strategies-rag-performance/

Learn how chunking strategies impact RAG performance in 2026, including fixed-size, semantic, and hybrid approaches. Discover optimization techniques for use cases like medical research and legal analysis using tools like LangChain and embedding models.
🧠 New preprint by Zhong et al. proposes a #synaptic mechanism for #chunking in #WorkingMemory.
Using short-term #plasticity and synaptic augmentation, their model shows how items can be temporarily suppressed and later retrieved as chunks, increasing effective capacity w/o increasing simultaneous activity.
So, you want to chunk really fast?
https://minha.sh/posts/so,-you-want-to-chunk-really-fast
#HackerNews #chunking #fast #performance #optimization #coding #techniques
Архитектура высоконагруженных RAG-систем: 10 стратегий оптимизации чанкинга и интеграция с Weaviate, Qwen / Llama /Gemma
Привет, Хабр! Это Андрей Носов, AI-архитектор в компании Raft, проектирую и внедряю высоконагруженные RAG-системы на предприятиях. Сегодня я расскажу о вызовах, которые мы преодолеваем каждый день, создавая такие системы, и сделаю акцент на чанкинге. Обозначим направления, в которых мы будем работать. Сегодня поговорим только о двух возможностях применения больших языковых моделей — это MedTech и LegalTech. Они наиболее востребованные на рынке в текущий момент в плане систем поиска. Такой выбор направлений связан с глобальным трендом на работу с профессиональными знаниями, о котором говорят Gartner и OpenAI.
https://habr.com/ru/companies/oleg-bunin/articles/967102/
#rag #chunking #llm #genai #архитектура #чанкинг #highload #highload++
Привет, Хабр! Это Андрей Носов, AI-архитектор в компании Raft, проектирую и внедряю высоконагруженные RAG-системы на предприятиях. Сегодня я расскажу о вызовах, которые мы преодолеваем каждый день,...
Mô hình ngữ cảnh dài có thực sự giải quyết 'attention dilution'? Có người cho rằng Gemini 1M context loại bỏ RAG/chia nhỏ tài liệu. Tuy nhiên, tác giả bài viết nghi ngờ, kinh nghiệm cho thấy hiệu suất giảm mạnh sau 100K-200K token. Điều này rất quan trọng với tài liệu pháp lý cần độ chính xác cao.
#AI #LLM #LongContext #AttentionDilution #RAG #Chunking #Gemini #TechNews #ArtificialIntelligence
#MôHìnhAI #NgữCảnhDài #XửLýNgônNgữ #CôngNghệ #TríTuệNhânTạo #HỏiĐáp