AI-компаньон в проде на третьем месяце — 5 архитектурных решений и инфра-тюнинг

Каждый, кто пробовал собрать AI-чат по типовой схеме — chat-completions API, OpenAI Memory, один эндпоинт Stable Diffusion — рано или поздно упирается в одни и те же стены. Бот забывает разговор через десять реплик. Иногда сервер бодро отвечает HTTP 200, а внутри пустая строка: ни ошибки, ни таймаута, модель просто отказалась говорить и сделала это молча. Один и тот же запрос рисует двух разных персонажей. А одеть нарисованного персонажа в конкретное платье из каталога не получается вообще.

https://habr.com/ru/articles/1042280/

#ИИ #LLM #OpenRouter #Stable_Diffusion #LoRA #ComfyUI #Redis #ChromaDB #Python #чатботы

AI-компаньон в проде на третьем месяце — 5 архитектурных решений и инфра-тюнинг

Каждый, кто пробовал собрать AI-чат по типовой схеме — chat-completions API, OpenAI Memory, один эндпоинт Stable Diffusion — рано или поздно упирается в одни и те же стены. Бот забывает разговор через...

Хабр
Max-severity flaw in ChromaDB for AI apps allows server hijacking

A max-severity vulnerability in the latest Python FastAPI version of the ChromaDB project allows unauthenticated attackers to run arbitrary code on exposed servers.

BleepingComputer

A critical, unpatched RCE (CVE-2026-45829) in ChromaDB, dubbed "ChromaToast," poses a severe threat to AI applications. Attackers can achieve pre-authentication remote code execution, hijacking servers and even "poisoning" the long-term memory of AI agents. The vulnerability, present since v1.0.0, remains unpatched, with 73% of internet-exposed instances at risk. This could lead to AI systems making…

https://www.tpp.blog/2lt51m0

#AI #chromadb #cybersecurity

🤖 This post was AI-generated.

ChromaDB Flaw Enables Server Hijacking via AI Model Exploit

A newly discovered vulnerability, CVE-2026-45829, in ChromaDB's Python FastAPI variant allows hackers to hijack servers by exploiting AI models, with a security expert noting that authentication is present but poorly placed. This flaw lets unauthenticated attackers run arbitrary code on exposed servers by cleverly manipulating API endpoints.

https://osintsights.com/chromadb-flaw-enables-server-hijacking-via-ai-model-exploit?utm_source=mastodon&utm_medium=social

#Cve202645829 #Chromadb #AiModelExploit #ServerHijacking #Python

ChromaDB Flaw Enables Server Hijacking via AI Model Exploit

Learn how CVE-2026-45829 ChromaDB flaw enables server hijacking via AI model exploit and take immediate action to secure your servers now effectively.

OSINTSights

→ Mindlid: 20% lift in top-1 recall for wellness app

🔗 Available via #GeminiAPI & #VertexAI
Integrates with #LangChain, #LlamaIndex, #Haystack, #Weaviate, #Qdrant, #ChromaDB & Vector Search
🧪 Colab notebooks for Gemini API & Vertex AI ready to use

🌐
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-embedding-2-generally-available/

Gemini Embedding 2 is now generally available.

We’re announcing the general availability of Gemini Embedding 2 via the Gemini API and Vertex AI.

Google

Собираем AI-агента нового поколения: Python, RAG и внешние инструменты через MCP (Model Context Protocol)

Ещё пару лет назад типичное LLM-приложение выглядело как последовательная цепочка вызовов: взяли промпт, добавили контекст из векторной базы, отправили в модель, получили ответ. LangChain популяризировал эту парадигму — chains, retrievers, memory — и это работало для простых сценариев вроде «ответь на вопрос по документации». Но бизнес-задачи редко укладываются в линейный пайплайн. Пользователь хочет не просто получить ответ, а чтобы система совершила действие : создала тикет в Jira, отправила письмо, запросила данные из CRM, проверила погоду и только потом сформулировала ответ. Именно здесь на сцену выходят AI-агенты — системы, которые не просто генерируют текст, а автономно принимают решение, какой инструмент вызвать , в каком порядке, и интерпретируют результат. Проблема в том, что до недавнего времени подключение каждого нового инструмента требовало написания «клея» — кастомных функций, обёрнутых в @tool декоратор LangChain, с ручным управлением аутентификацией, обработкой ошибок и сериализацией данных. Для продакшена это быстро превращалось в зоопарк нестандартных интеграций, который сложно поддерживать и масштабировать. Model Context Protocol (MCP) от Anthropic решает эту проблему, предлагая единый стандарт для подключения инструментов и источников данных к LLM-приложениям. Вместо того чтобы для каждого API писать свой адаптер, мы просто запускаем MCP-сервер, который предоставляет инструменты по стандартизированному протоколу. Агент подключается к этому серверу через MCP-клиент и получает доступ ко всем инструментам без лишнего кода. В этой статье мы соберём полноценного агента, который: 1. Умеет работать с внешним миром через MCP (узнавать погоду и создавать GitHub Issues); 2. Имеет доступ к внутренней базе знаний через RAG; 3. Принимает решения по ReAct-подходу с использованием LangGraph. Разбираем код и архитектуру

https://habr.com/ru/articles/1025428/

#python #ai #machine_learning #langchain #langgraph #mcp #rag #chromadb #fastmcp #llm

Собираем AI-агента нового поколения: Python, RAG и внешние инструменты через MCP (Model Context Protocol)

Введение: от простых цепочек к агентам, которые действуют Ещё пару лет назад типичное LLM-приложение выглядело как последовательная цепочка вызовов: взяли промпт, добавили контекст из векторной базы,...

Хабр

Мультиагентная система без LangChain: почему абстракции ломаются и как строить production на чистом Python

LangChain обещает: переключите модель одной строкой, подключите RAG за две. У меня в production мультиагентная система с RAG, CRM и тремя мессенджерами — и я построил её без LangChain. Под катом — почему абстракции ломаются, сколько стоит фоллбек на YandexGPT и при чём тут медведь с удочкой.

https://habr.com/ru/articles/1020810/

#LangChain #Python #мультиагентная_система #RAG #LLM #YandexGPT #OpenAI #FastAPI #production #ChromaDB

Мультиагентная система без LangChain: почему абстракции ломаются и как строить production на чистом Python

Введение LangChain обещает красивую жизнь: переключите модель одной строкой, подключите RAG за две, дайте агенту инструменты за три. На лендинге всё выглядит как конструктор LEGO — берёшь кубики,...

Хабр

Databases for #AI: Should you use a vector #database? 🤔

This article compares #opensource projects competing to handle modern #AI workloads, including #machinelearning and #LLMs. Discover which databases best meet today’s AI challenges: https://lpi.org/636x

(Disclaimer: This post contains an AI-generated image.)

#AndyOram #AI #vectordatabase #machinelearning #LLMs #SQL #opensource #hybridsearch #generativeAI #MariaDB #MongoDB #Milvus #Qdrant #Weaviate #Vespa #ChromaDB #LanceDB

Building My First RAG System (Which Sadly Failed the Tax Preparer Exam)
A while back, I posted about how I gave the IRS’ volunteer tax preparer exam to ChatGPT. It scored in the 70s, but an 80% is the minimum required score to pass and be certified. A short while later, I took a Coursera short course on Retrieval Augmented Generation (RAG). I then decided to
https://www.mcgurrin.info/robots/8318/
#Uncategorized #AI #chatbots #chromadB #gradio #llamaparse #LLMs #ollama #python #RAG #Taxes
Building My First RAG System (Which Sadly Failed the Tax Preparer Exam) | The Aspiring Roboticist

Как мы с ИИ сделали локальный ИИ, который учится по моим книгам и пишет за меня отчёты

Я с GitHub Copilot (Claude) собрал полностью локальную RAG-систему с GUI, которая индексирует мои учебники и генерирует по ним отчёты, презентации, конспекты и эссе. Всё работает офлайн. В статье — архитектура, выбор компонентов, процесс совместной разработки с ИИ-ассистентом, грабли и рабочий код.

https://habr.com/ru/articles/1006662/

#python #ai #nlp #LLM #qwen #copilot #claude #chromadb

Как мы с ИИ сделали локальный ИИ, который учится по моим книгам и пишет за меня отчёты

Предыстория: зачем вообще это нужно Каждый семестр одна и та же история: кипа учебников, дедлайны, отчёты, которые нужно было сдать «вчера», и презентации, от одного вида которых хочется закрыть...

Хабр