Tengo publicado en YouTube un tutorial de instalación de PGVector en Windows. Esta herramienta es bastante popular en el ámbito de la Inteligencia Artificial.
#AI #Embedding #SiguemeYTeSigo #followback
Nota: imagen generada con IA.
Tengo publicado en YouTube un tutorial de instalación de PGVector en Windows. Esta herramienta es bastante popular en el ámbito de la Inteligencia Artificial.
#AI #Embedding #SiguemeYTeSigo #followback
Nota: imagen generada con IA.
EFF To Court: Don’t Make Embedding Illegal
https://fed.brid.gy/r/https://www.techdirt.com/2026/03/11/eff-to-court-dont-make-embedding-illegal/
Малоресурсный язык ломает коммерческие embedding: R@1 0,83 (LaBSE) vs 0,21 (OpenAI) на армянском EPG
Платные модели embedding не гарантируют качество на малоресурсных языках. На задаче кроссязыкового сопоставления EPG-заголовков (EN/RU/HY) бесплатная LaBSE набирает R@1 = 0,83, а OpenAI text-embedding-3-large -- 0,21. Протестировано 19 моделей, код и данные открыты.
https://habr.com/ru/articles/1008422/
#embedding #openai #малоресурсный_язык #sentencetransformers #tokenizer #iptv #epg #benchmark #эмбеддинг

Текст написан автором и отредактирован с помощью ИИ TL;DR: Платные модели embedding плохо работают с малоресурсными языками. OpenAI text-embedding-3-large набирает R@1 = 0,21 на армянском -- уровень...
If you are building an application that requires search, I recommend using Elasticsearch early on. In addition to the usual full-text search, Elasticsearch allows you to perform a hybrid search: combine the results of text and vector search.
Of course, for small amounts of data, you can use PostgreSQL tsvector with the pgvector extension, but in the long term, Elasticsearch will provide good performance.
#Elasticsearch #Search #tsvector #pgvector #KNN #Embedding #SentenceTransformers #AI
RE: https://mastodon.social/@eff/116196024145324586
Emmerich Newspapers wants the Fifth Circuit Court of Appeals to scrap the Server Test, something that's been legal precedent for almost two decades.
Emmerich Newspapers also argues that altering a URL, via something like a link shortener, should constitute copyright infringement under the DMCA ("Prohibition on changing or deleting copyright management information").
In short, they want to make link embedding and link shortening essentially illegal (or least very legally gray). Copyright maximalists are batshit insane.
#FreeSpeech #Censorship #Embedding #Links #Internet #Copyright #CopyrightNonsense
Научил ИИ-агента помнить важное и забывать лишнее в SQLite
Я делаю локально работающего ИИ-агента и столкнулся с тем, что стандартный подход «закинуть текст в векторную базу, достать по косинусу» для долгоживущего агента не работает: контекст замусоривается, факты конфликтуют, ничего не забывается. Вместо этого реализовал графовую когнитивную память поверх одного файла SQLite: эпизодические и семантические узлы, типизированные рёбра, именованные сущности, гибридный поиск (FTS5 + vector + graph) с Reciprocal Rank Fusion, кривую забывания Эббингауза и фоновую LLM-консолидацию. В статье — полная архитектура с кодом, SQL-схемой и формулами. Код и минимальный пример — в репозитории . Дальше long-read
https://habr.com/ru/articles/1006622/
#ai_agent #ai #ии #ииагенты #память #sqlite #vector #embedding