AI без Python: как исправить документацию и внедрить RAG в JVM-стеке

Даже для опытных пользователей системы (продукт-оунеры, техлиды, CTO, руководители уровня B-1, сотрудники кост-менеджмента) это не всегда просто, тем более для новых. Значительная часть времени уходит не на работу в системе, а на поиск информации в разрозненных источниках: Excel-таблицы, письма, локальные заметки или уточнение деталей у коллег. Отсюда и появилась идея AI-ассистента как удобного способа получать ответы в одном месте, обычным человеческим языком. Python почти стандарт для AI-проектов, но мы, как и большинство продуктовых команд в банке, используем JVM-стек: Kotlin, Java, Spring Boot. Поэтому осознанно выбрали развивать AI-ассистента в уже знакомом стеке. Это не просто техническое предпочтение. Мы хотели сохранить поддержку и масштабируемость внутри команды и не привлекать новые компетенции, которых у нас пока нет. Наш опыт может быть полезен командам, которые работают в JVM-среде и хотят внедрить AI без перехода на другой стек.

https://habr.com/ru/companies/raiffeisenbank/articles/1012666/

#ai #kotlin #spring_ai #rag #backend #LLM #JVM #pgVector #langchain4j #чанкинг

AI без Python: как исправить документацию и внедрить RAG в JVM-стеке

Привет, Хабр! Меня зовут Дмитрий Вдовин, я техлид команды Budget Tool. Мы отвечаем за продукт, через который в банке проходят процессы планирования и контроля расходов. Это внутренняя система, в...

Хабр

Thor 雷神 (@thorwebdev)

Gemini로 멀티모달 임베딩을 생성한 뒤 pgvector와 Supabase에 저장·검색할 수 있다는 안내입니다. 텍스트·이미지·비디오·오디오·문서 등 여러 모달리티에 대해 유사도 검색을 수행하는 개발자용 워크플로우 통합 사례를 소개합니다.

https://x.com/thorwebdev/status/2031747774174183776

#gemini #pgvector #supabase #multimodal #embeddings

Thor 雷神 ⚡️ (@thorwebdev) on X

Generate multimodal embeddings with Gemini, then store and search them with pgvector in @supabase 🔎 Perform similarity search across text, images, video, audio, and documents! 🚀

X (formerly Twitter)

If you are building an application that requires search, I recommend using Elasticsearch early on. In addition to the usual full-text search, Elasticsearch allows you to perform a hybrid search: combine the results of text and vector search.
Of course, for small amounts of data, you can use PostgreSQL tsvector with the pgvector extension, but in the long term, Elasticsearch will provide good performance.

#Elasticsearch #Search #tsvector #pgvector #KNN #Embedding #SentenceTransformers #AI

Векторный поиск в PostgreSQL: PGVector, SQLAlchemy и FastAPI

Реализуем сервис семантического поиска на базе PostgreSQL с расширением PGVector. В статье: настройка БД через Docker, миграции Alembic, асинхронный слой на SQLAlchemy и API на FastAPI. Иллюстрация на обложке - нейрослоп для привлечения внимания

https://habr.com/ru/articles/1006364/

#PGVector #SQLAlchemy #FastAPI

Векторный поиск в PostgreSQL: PGVector, SQLAlchemy и FastAPI

Привет Хабр! Меня зовут Владимир и я алкоголик решил выйти из зоны комфорта и начать чего-нибудь писать. В этом материале я хочу поделиться своими наработками по организации векторного хранилища в...

Хабр

[Перевод] Обратная сторона массивов в PostgreSQL

Начать работу с массивами в PostgreSQL проще простого: объявили колонку как integer[] , вставили значения — и готово. Или вообще собрали массив на лету. Официальная документация дает неплохую базу. Но за этим простым интерфейсом скрывается куда более сложная механика, чем многие привыкли думать. Массивы в PostgreSQL — это не просто «списки, которые можно засунуть в поле таблицы». У них своя стратегия работы с памятью, собственная логика индексации и целый ворох граничных случаев. В статье подробно разберем аспекты работы с массивами, которые могут неожиданно создать проблемы в продакшене.

https://habr.com/ru/companies/magnus-tech/articles/990146/

#массивы_в_PostgreSQL #базы_данных #PostgreSQL #работа_с_массивами_PostgreSQL #intarray #pgvector #документная_модель_данных

Обратная сторона массивов в PostgreSQL

Начать работу с массивами в PostgreSQL проще простого: объявили колонку как integer[] , вставили значения — и готово. Или вообще собрали массив на лету: SELECT '{1,2,3}'::int[]; SELECT array[1,2,3];...

Хабр
OpenAI helped popularize pgvector: embeddings like text-embedding-3-small generate vectors stored in Postgres. It’s a strong push, but reflecting on the data is necessary. #OpenAI #pgvector #embeddings #PostgreSQL
OpenAI ha contribuito alla popolarità di pgvector: embedding come text-embedding-3-small generano vettori salvati in Postgres. È una spinta forte, ma riflettere sui dati è necessario. #OpenAI #pgvector #embeddings #PostgreSQL
To #PostgreSQL experts: Is there a downside on having *a lot* of tables (hundreds, maybe thousands in future) where they all have foreign keys with ON DELETE CASCADE to 4 central tables? The tables are #PGVector (#PGVectorScale) datasets, separated because #SQL WHERE is applied by PGVectorScale only after the vector search. Also the different datasets might have different vector dimensions in the future. (Also never did any clustering and wonder if its good or bad for that.)

✍️ Sign up for POSETTE News to stay current on POSETTE: An Event for Postgres. Only a small number of emails are sent each year announcing speakers, event schedule, and next year’s event dates. POSETTE is happening Jun 16–18. 🗓️

Sign-up here: https://posetteconf.com/subscribe/

#PosetteConf #Postgres #PostgreSQL #Citus #Patroni #pgvector #Azure #DBA #AppDev #CFP

Subscribe | POSETTE: An Event for Postgres

Subscribe to receive email updates about POSETTE: An Event for Postgres—a free and virtual developer event with talks about PostgreSQL, extensions & tools in the Postgres ecosystem, and Azure Database for PostgreSQL too. We’ll send you emails when POSETTE is announced, when the CFP is opening/closing, when we post t...

POSETTE

Buenas tardes, he publicado la parte 66 del tutorial "Creando Aplicaciones con Spring Boot y su Ecosistema". Hoy, mostramos como usar los datos cargados en la base de datos vectorial #PgVector usando un modelo de #Embedding.
#AI

https://youtu.be/IcIUIugaZJ0

Nota: imagen generada con IA generativa.