#lecturelà Whore foods, de LA Warman, chez RAG éditions

#lawarman #rag #ragéditions

GPT-4.1's 1M-token context window is insufficient for real-world Use Cases (HackerNoon):
➡️ A massive context window enables handling of extensive data within a single query.
➡️ Its practical application is hindered by prohibitive costs, extended latency, and the absence of robust citation mechanisms.
➡️ RAG outperforms large-context LLMs in scalability and cost-effectiveness.

https://hackernoon.com/gpt-41s-1m-token- context-window-is-impressive-but-insufficient-for-real-world-use-cases?source=rss

#AI #RAG #LLMs

RAGで使用するHTMLの前処理を検証(マークダウン形式→チャンク分割)
https://qiita.com/infra365/items/bff82bc8414c90c09edc?utm_campaign=popular_items&utm_medium=feed&utm_source=popular_items

#qiita #備忘録 #rag

RAGで使用するHTMLの前処理を検証(マークダウン形式→チャンク分割) - Qiita

内容ローカルのHTMLファイルを使用してRAGシステムの構築を想定。前処理を行い、適切な形にチャンク分割出来るかの検証になります。HTMLを一旦マークダウン形式に変換した後、マークダウンの見出し(…

Qiita

If you're trying to figure out how the heck vector searches work (for retrieval-augmented generation, or RAG), this set of slides will get you up to speed incredibly quickly.

https://pamelafox.github.io/my-py-talks/pgvector-python/

Thanks to @pamelafox for putting this together. 👏

#rag #pgvector #python #ai

pgvector for Python developers

Preview 2 of the .NET AI Template Now Available - .NET Blog

Preview 2 of the .NET AI Chat Web App template introduces support for .NET Aspire and Qdrant vector database integration, making it easier to create cloud-native AI-powered chat applications with custom data.

.NET Blog

I used AI2 Scholar QA to ask about knowledge conflicts in RAG query applications. It was illuminating to learn about some of the limitations of RAG applications and LLMs.

https://ai2-scholar-qa.allen.ai/query/ddae7a82-e708-492b-8baf-de732a74123f

#RAG #LLM

Ai2 ScholarQA

How to Build a Local RAG App with Ollama and ChromaDB in the R Programming Language

A Large Language Model (LLM) is a type of machine learning model that is trained to understand and generate human-like text. These models are trained on vast datasets to capture the nuances of human language, enabling them to generate coherent and co...

freeCodeCamp.org

🤖 Want to improve your RAG (Retrieval-Augmented Generation) pipeline?

Our latest blog breaks down four retrieval techniques to boost accuracy, relevance and performance in your GenAI systems.

🔗 Read more: https://ter.li/fcr52o

#RAG #GenAI #AI #Tech

Four retrieval techniques to improve RAG you need to know

Take a look at some key innovations in retrieval-augmented generation that aim to improve LLM reliability and accuracy.

Thoughtworks
🧵 8/9 The 'Goal': Dissemination of IPCC Reports and #climatechange lit using #semantification as a basis. #ClimateKG is aimed at being a service for indexing and publishing. Status: Prototype (PoC) #1: 'IPCC Reports and City Climate Change Plans: Proof of concept prototype - Open Climate Reader' https://semanticclimate.github.io/city-open-climate-reader/ - Currently interfaces are for search and #RAG #LLM - all built on #openscience based #digitalsoveriegn tech. The goal sits off in future, over the horizon - but its we're going
IPCC Reports and City Climate Change Plans: Proof of concept prototype - Open Climate Reader

Как технологии ИИ трансформируют работу контактного центра на Платформе Эра

В данной статье расскажем про ключевые процессы обслуживания клиентов, и смежные процессы управления — контроль качества и аналитику. Основной акцент сделаем на искусственном интеллекте. Рассмотрим также речевые технологии, вскользь коснемся классических подходов к построению автоматических сервисов. Платформа Эра — это новая информационно-коммуникационная платформа, на базе которой можно строить распределенные IP-АТС, омниканальные контакт-центры и другие корпоративные системы для обработки информационных и коммуникационных процессов. Сервисы GPT В Платформе Эра появилось новое приложение — искусственный интеллект. В одной системе может быть несколько сервисов GPT — как локальных, так и облачных. Сервис определяется адресом сервера и токеном, умеет получать список доступных моделей, позволяет задать настройки по умолчанию для чатов и индексирования. Как минимум, это выбор моделей (так как один сервис часто содержит несколько моделей каждого типа) и температура для генерации текста. Базы знаний Мы можем создавать базы знаний, добавлять к ним документы и индексировать. Поддерживаются наиболее распространенные форматы файлов. Иногда имеет смысл потратить некоторое время на подготовку документов для базы знаний. Например, красивая презентация в формате пдф может некоторыми моделями индексироваться плохо — в качестве контекста будут выбираться страницы, содержащие только заголовок и бесполезную картинку. В таких случаях простые команды Ctrl+A, Ctrl+C, Ctrl+V и построение базы знаний на основе текстового файла существенно повышают качество подготовки контекста. Здесь у нас есть две базы знаний — одна локальная и одна ChatGPT на основе 30-страничного буклета по платформе Эра. Скоро мы посмотрим на практике, как нейросеть отвечает на вопросы по этому файлу.

https://habr.com/ru/articles/899580/

#gpt #ai #коллцентр #контактцентр #кейсы_автоматизации #itкомпании #llmмодели #nlp #nlu #rag

Как технологии ИИ трансформируют работу контактного центра на Платформе Эра

В данной статье расскажем про ключевые процессы обслуживания клиентов, и смежные процессы управления — контроль качества и аналитику. Основной акцент сделаем...

Хабр