Ruby 개발자를 위한 시맨틱 검색 및 RAG 구현 가이드
시맨틱 검색과 RAG(Retrieval Augmented Generation)는 임베딩과 벡터 데이터베이스를 활용하여 키워드 기반이 아닌 의미 기반의 검색 및 응답 생성을 가능하게 합니다.
Ruby 개발자를 위한 시맨틱 검색 및 RAG 구현 가이드
시맨틱 검색과 RAG(Retrieval Augmented Generation)는 임베딩과 벡터 데이터베이스를 활용하여 키워드 기반이 아닌 의미 기반의 검색 및 응답 생성을 가능하게 합니다.
Retrieval в 2026: как RAG переехал с энкодеров на LLM (и что с этим делать в своём проекте)
Если вы строили RAG в 2023, ваш стек выглядел плюс-минус одинаково. BERT-семейство (BGE, e5) для семантики, BM25 для буквальных совпадений, cross-encoder для реранкинга, какой-нибудь Qdrant сверху. Этим жили два года, и многие до сих пор так живут. Но если посмотреть, кто реально гоняется в продакшене у команд, которые ушли вперёд, ландшафт другой. Энкодеров там почти нет. Эмбеддит файнтюненная LLM. Реранкер — тоже LLM. Инференс на SGLang, а не на ONNX. И вся обвязка перестроилась под это. Эта статья про то, что поменялось и как переиспользовать этот стек у себя. Особенно если вы работаете в узком домене, где готовых датасетов нет.
https://habr.com/ru/articles/1049872/
#RAG #эмбеддинги #embeddings #retrieval #LLM #Qwen3 #Qdrant #vector_search #hard_negatives #LLM2Vec
Word embeddings seem basic, but they power surprisingly strong results.
Jak komputer czyta tekst - od liczenia słów do wektorów
Od tokenizacji przez TF-IDF i łańcuchy Markowa, aż po Word2Vec. Jak komputer zamienia tekst w liczby...
https://gruszka.dev/jak-komputer-czyta-tekst.html
#llm #ai #nlp #tokenizacja #word2vec #embeddings #tfidf #markow #bayes #languagemodels
🚨 NEWS: LangChain e LLM per Sviluppatori: la Pillar Guide per Costruire Applicazioni AI in Produzione
Ecco i punti chiave in breve:
💡 Il problema: state costruendo un prototipo che non reggerà mai il traffico realeAvete un LLM che risponde, una chiamata API che funziona in console e un entusiasmo che dura fino al primo caricamento l...
Chrome-расширение для Upwork: архитектура, метрики и опыт разработки с помощью ИИ
В свободное время я периодически захожу на Upwork, чтобы посмотреть, какие проекты там сейчас появляются и как устроен рынок изнутри. Если убрать фильтры и посмотреть общий поток вакансий, довольно быстро становится видно типичную картину: большое количество разработчиков конкурируют за очень стандартные и недорогие задачи. В таких условиях основная проблема смещается не на поиск интересных проектов, а на скорость их обработки и подачи предложений. Это особенно заметно в сегменте разработчиков, которые работают на массовом рынке: важно быстро отсекать нерелевантные предложения и экономить connects. Именно это стало отправной точкой для идеи Chrome-расширения, которое добавляет слой аналитики поверх списка проектов Upwork и позволяет быстрее принимать решение, стоит ли откликаться на вакансию.
https://habr.com/ru/articles/1045212/
#ChromeExtension #Upwork #LLM #AIAssistedDevelopment #TypeScript #Rust #PostgreSQL #Embeddings #SystemArchitecture
Heat maps reveal how similar word embeddings look, beyond cosine scores.
Зачем backend разработчику Python, если он не собирается становиться data scientist
Долго воспринимал Python как язык из соседнего мира. Где то там data science, pandas, ноутбуки, модели, эксперименты. А у меня обычный backend: API, микросервисы, Kafka, БД, CI/CD и продакшен. C# и Java для этого хватало. Но когда начал разбираться с LLM быстро понял, вызвать модель можно из любого языка, а вот руками потрогать RAG, embeddings, локальные модели, чанкинг и evaluation проще всего через Python. И ещё быстрее стало понятно другое, LLM это не просто "отправить prompt и получить ответ". Как только речь заходит о реальной системе появляются привычные backend вопросы "доступы, логи, стоимость, latency, качество ответа, безопасность данных и сопровождение". Поэтому для меня Python стал не заменой C# или Java, а инструментом который помогает быстрее зайти в новый слой backend задач. Зачем backend разработчику Python
https://habr.com/ru/articles/1038712/
#python #backend #llm #rag #ai #fastapi #embeddings #api #production #enterprise
Как мы боремся с галлюцинации AI Master: гибридный Guard на Embedding + LLM Extractor на примере AI-RPG «Стирая Грань»
Каждый, кто пробовал создавать текстовые RPG или симуляторы на базе LLM (будь то GPT-4, DeepSeek или локальная 70B), сталкивался с проблемой «Yes-And» проклятия . По своей природе современные языковые модели — это идеальные импровизаторы. Они обучены поддакивать пользователю и развивать его мысль. В контексте игры это превращается в легальные читы. Игрок пишет: «Я достаю из кармана дымовую шашку и кидаю в охрану» или «Вообще-то я полковник ФСБ, пропустите» . Что делает классический AI GM? Он послушно кивает: «Охрана кашляет в дыму, вы проходите» , даже если по Game State игрок — бродяга в одних трусах, у которого в инвентаре только ржавый гвоздь. Меня зовут Алексей, я профессиональный 1С-разработчик, но в свободное время создаю архитектуру инди-системы на Flutter и Python. Сейчас я развиваю проект нарративной AI-driven RPG " Стирая Грань" (анг. — Beyond the Verge ).
https://habr.com/ru/articles/1042402/
#LLM #gamedev #NLP #embeddings #python #deepseek #геймдизайн #искусственный_интеллект #rpg #архитектура

Каждый, кто пробовал создавать текстовые RPG или симуляторы на базе LLM (будь то GPT-4, DeepSeek или локальная 70B), сталкивался с проблемой «Yes-And» проклятия . По своей природе современные языковые...
Раннее завершение KNN-поиска в Manticore Search
Современные поисковые системы уже не просто сопоставляют ключевые слова. Когда вы ищете «уютный детектив, действие которого происходит в Париже», а получаете результаты вроде «атмосферный детективный роман во Франции», это векторный поиск в действии: документы и запросы превращаются в списки чисел — эмбеддинги, — а поисковый движок находит документы, чьи векторы ближе всего к вектору запроса. Manticore Search поддерживает это из коробки. Внутри используется структура данных HNSW: граф, который соединяет близкие векторы и позволяет быстро находить ближайших соседей без сканирования каждого документа. Благодаря этому векторный поиск по миллионам документов выполняется за миллисекунды.
https://habr.com/ru/articles/1042064/
#knn #knnsearch #векторный_поиск #семантический_поиск #hnsw #embeddings #oversampling #полнотекстовый_поиск