We built and trained our own embedding model from scratch today.

#ai #embeddings #machinelearning

RAG в enterprise: 70-80% проблем не в модели, а в данных

Эта статья родилась из работы над

https://habr.com/ru/companies/alpinadigital/articles/1036196/

#RAG #enterprise_AI #retrieval_augmented_generation #embeddings #GraphRAG #Agentic_RAG #BM25 #chunking #LLM #AlpinaGPT

RAG в enterprise: 70-80% проблем не в модели, а в данных

Жемал Хамидун, Head of AI Alpina Digital , CPO AlpinaGPT , автор тг-канала «Готовим ИИшницу» . Эта статья родилась из работы над AlpinaGPT . Мы недавно зарелизили в нём по-настоящему крутых...

Хабр
PaperCall.io

We started with nothing, built an embedding model, and will fix it.

#pytorch #embeddings #machinelearning

Notion + RAG + Telegram: архитектура AI-копирайтера для сети ресторанов

В таком сценарии копирайтеру недостаточно просто писать тексты. Ему нужно помнить факты о каждом заведении: часы работы, фирменные блюда, формат кухни, имена шеф-поваров, особенности интерьера, правила коммуникации, ограничения по формулировкам и стиль бренда. Если ресторанов девять, эта задача быстро перестаёт быть только творческой и превращается в задачу управления знаниями. У заказчика была именно такая проблема: сеть ресторанов по России, у каждого заведения отдельная концепция и свой стиль общения с гостями. Большая часть ресурсов уходила на ежедневную текстовую работу: описания ресторанов, переводы на разные языки, пресс-релизы, рассылки, описания блюд, мероприятий, посты для социальных сетей и тексты в Tone of Voice каждого бренда. Задача заключалась не в том, чтобы заменить редактора, а в том, чтобы вынести рутинную часть генерации текстов в AI-систему. Один-два редактора должны были управлять контентом всей сети: ставить задачи, получать черновики, проверять факты, корректировать стиль и доводить материалы до публикации.

https://habr.com/ru/articles/1035628/

#llm #rag #автоматизация #telegramбот #генерация_контента #notion_ai #embeddings #векторная_база_данных #prompt_engineering

Notion + RAG + Telegram: архитектура AI-копирайтера для сети ресторанов

В ресторанной сети с несколькими заведениями контент быстро становится отдельным операционным процессом. Нужно регулярно готовить описания блюд, тексты для социальных сетей, рассылки, пресс-релизы,...

Хабр

Клиент — это тоже вектор? Как мы хотели улучшить ML-модель, а построили similarity engine

Поговорим о том, как превращать последовательности пользовательских событий в векторы, зачем обучать BERT на "языке" клиентского поведения и почему embedding-пространство может неожиданно начать отражать будущую ценность пользователей

https://habr.com/ru/articles/1034880/

#машинное_обучение #анализ_данных #bert #deep_learning #machine_learning #embeddings #transformers

Клиент — это тоже вектор? Как мы хотели улучшить ML-модель, а построили similarity engine

Привет, Хабр! В этой статье я расскажу, как решение одной прикладной ML-задачи привело нас сразу к нескольким неожиданным результатам. Статья будет полезна в первую очередь специалистам, работающим с...

Хабр

Show HN: Chat with UFO Files

GitHub에 공개된 'Chat with UFO Files'는 사전 임베딩된 SQLite 데이터베이스를 활용해 UFO 관련 문서들과 대화할 수 있는 UI를 제공하는 프로젝트입니다. 사용자는 직접 채팅 인터페이스를 통해 데이터에 접근할 수 있으며, 데모는 제한된 시간과 요청 동시성으로 운영됩니다. OpenRouter와 Cloudflare 프록시를 활용해 서비스가 배포되어 있습니다.

https://news.ycombinator.com/item?id=48067733

#sqlite #embeddings #chatui #openrouter #cloudflare

Show HN: Chat with UFO Files | Hacker News

CancionesCortasIA (@CancionesChorri)

Zipf 법칙과 인간 언어의 중복성이 임베딩 붕괴를 유발한다면, 기하 구조를 제어할 수 있는 상징적 프로토콜을 설계해 사실, 행동, 논리 구조를 분리한 요인화 표현을 만드는 것이 좋겠다는 아이디어를 제시한다. AI 표현학습과 임베딩 설계에 관한 기술적 제안이다.

https://x.com/CancionesChorri/status/2052869230614261916

#embeddings #representationlearning #llm #symbolicai #nlp

CancionesCortasIA (@CancionesChorri) on X

@anirudhbv_ce @OpenAI @GeminiApp @sentra_app “If the collapse comes from Zipf and human-language redundancy, wouldn’t it make sense to design a symbolic protocol for embeddings where geometry is controlled? Something like a factored representation: 🌀 Concept ↗️ Action 🔷 Logical structure

X (formerly Twitter)

Akshay (@akshay_pachaar)

RAG 시스템의 검색 성능이 5천 개 문서에서는 90%였지만 50만 개 문서로 확장하자 50%로 급락하는 사례를 제시하며, 동일한 임베딩 모델과 리트리버를 써도 문서 규모 증가가 성능 저하를 유발할 수 있음을 짚는다. 대규모 RAG 설계의 핵심 문제를 묻는 LLM 인터뷰 질문이다.

https://x.com/akshay_pachaar/status/2052371239520629243

#rag #llm #embeddings #retrieval #nlp

Akshay 🚀 (@akshay_pachaar) on X

A tricky LLM interview question: Your RAG system scores 90% retrieval accuracy on 5k company docs. But scaling to 500k docs drops the accuracy to just 50%, with the same embedding model and retriever. Why did this happen? The simplest answer is that more documents mean more

X (formerly Twitter)

GitHub Projects Community (@GithubProjects)

CocoIndex는 코드베이스, 문서, PDF, Slack, 회의 노트, 영상까지 AI 에이전트용 최신 컨텍스트로 변환한다. 전체 RAG 파이프라인을 매번 재구축하지 않고 변경분(delta)만 재계산해 fresh embeddings와 summaries를 유지하는 것이 핵심이다.

https://x.com/GithubProjects/status/2052445636637888932

#rag #aiagents #contextengineering #embeddings #opensource

GitHub Projects Community (@GithubProjects) on X

CocoIndex turns your codebase, docs, PDFs, Slack, meeting notes, and even videos into continuously fresh context for AI agents. Instead of rebuilding the entire RAG pipeline every time something changes, it only recomputes the delta. Fresh embeddings. Fresh summaries. Fresh

X (formerly Twitter)