[Перевод] Agentis Memory — Redis-совместимое хранилище со встроенным векторным поиском и локальными эмбеддингами

В наше время уже никого не удивишь разработкой агентов, очередной оптимизацией, новой моделью или новой инфраструктурой для нейронок. Всё это в порядке вещей. Однако одно дело читать в Twitter «мы написали агента X и он оптимизировал нам процессы на 300000%», и совсем другое — начать копать чуть глубже. Копнёшь — а «агентом» называют скилл с одним промптом. Разработка настоящих агентов — задача не тривиальная. Достаточно посмотреть на утёкшие исходники Claude CLI — это не просто CLI, а целая инфраструктура бизнес-логики вокруг LLM. Я бы сравнил разработку агентов с разработкой типичных бэкенд-компонентов. Аналогия такая: если вы пишете каноничный бэкенд-сервис — вам нужна СУБД. Если Web3-сервис — блокчейн. Но на СУБД или блокчейне происходит в лучшем случае 50% всей логики. Вся магия крутится именно на бэкенде. С агентами то же самое: подключаешь AI SDK, конфигурируешь мыслительное ядро и пишешь вокруг него всю обвязку — мониторинги, AIOps, оркестрацию, memory management. Вот про memory management и пойдёт речь.

https://habr.com/ru/articles/1018784/

#Redis #AI_agents #GraalVM #ONNX #embeddings #HNSW #Java_Vector_API #SIMD #Project_Loom #LLM

Agentis Memory — Redis-совместимое хранилище со встроенным векторным поиском и локальными эмбеддингами

Примечание: это перевод моей же статьи https://scrobot.substack.com/p/agentis-memory-redis-compatible-store , так что автор точно доносит свою мысль, без потери контекста при переводе :) В наше время...

Хабр
ブラウザ上で動作する運転免許証OCRデモを作ってみた - Qiita

はじめに 2024年にはマイナンバーカードの読み取りがスマートフォンのNFCで可能になり、2025年にはiPhoneへの運転免許証搭載も始まりました。正直なところ、免許証の画像をOCRで読み取るというアプローチには「今更感」があります。 とはいえ、実務ではまだ免許証の画...

Qiita

Уязвимости в Spring AI и ONNX: как дыры в ИИ‑фреймворках превращаются в утечки данных и чужие модели

ИИ‑фреймворки давно въехали в прод, но к ним часто относятся как к «научной приблуде», а не к ещё одному входу в ваши данные и инфраструктуру. Spring AI и ONNX крутятся где‑то между ML‑командами, продуктами вендоров и внутренними ассистентами, и на определённом этапе за ними перестают успевать архитектура и безопасность. В марте в обзорах уязвимостей рядом всплыли несколько критичных багов именно в этих штуках. Там есть и SQL‑инъекции, и JSONPath‑инъекции, и обход проверки доверия при загрузке моделей. В статье разбираю, что это значит для тех, кто уже тащит ИИ в прод, и даю чек‑лист, который можно прямо отнести своей команде.

https://habr.com/ru/articles/1014606/

#onnx #spring #spring_framework #spring_security #cve #vulnerability #vulnerability_management #уязвимости #уязвимости_и_их_эксплуатация #уязвимость_нулевого_дня

Уязвимости в Spring AI и ONNX: как дыры в ИИ‑фреймворках превращаются в утечки данных и чужие модели

TL;DR В марте нашли критичные уязвимости в Spring AI и ONNX. В Spring AI всплыли SQL‑инъекции и JSONPath‑инъекции в сценариях работы с БД и данными. В ONNX можно обойти проверку доверия при загрузке...

Хабр
🌖 GitHub - KittenML/KittenTTS:25MB 以下的頂尖文字轉語音(TTS)模型 😻
➤ 擺脫 GPU 束縛:為邊緣設備打造的高效能語音合成引擎
https://github.com/KittenML/KittenTTS
KittenTTS 是一款針對邊緣運算優化的開源文字轉語音庫。它憑藉 ONNX 技術,實現了在不依賴 GPU 的情況下,僅透過 CPU 即可進行高品質語音合成。該專案提供 15M 到 80M 參數不等的多種模型規格,體積最小可壓縮至 25MB,並內建 8 種預設聲音供選擇。對於需要在硬體資源受限的環境中導入語音功能的開發者而言,這是一套極具效率的解決方案。
+ 太神奇了!終於能把 TTS 塞進樹莓派或嵌入式設備裡跑,而且還有 8 種聲音選擇,這對產品落地非常有幫助。
+ 雖然模型小巧,但還是希望能看到對中文或其他多語言的支援,目前的 API 雖然簡潔,但若能處理更複雜的標點符號與語調會更好。
#人工智慧 #文字轉語音 #輕量化模型 #ONNX
GitHub - KittenML/KittenTTS: State-of-the-art TTS model under 25MB 😻

State-of-the-art TTS model under 25MB 😻 . Contribute to KittenML/KittenTTS development by creating an account on GitHub.

GitHub

Как я учил компьютер понимать 122 000 фотографий — и почему сложностью оказались не нейронки, а слова

Я крайне редко на фрилансе получал заказы связанные с DS/ML, специалистов для таких задач обычно ищут не там. Причины разные: они требуют долгой интеграции, заказчик сам не понимает задачу, DS более конфиденциален, DS часто возникают внутри продукта, да и в последнее время этот сегмент на фрилансе съедается при помощи LLM: AI integration, RAG боты например. Но, внезапно, мне в личку постучались с таким проектом.

https://habr.com/ru/articles/1010932/

#computer_vision #machine_learning #clip #embeddings #классификация_изображений #zeroshot_learning #уменьшение_размерности_данных #фриланс #продуктовая_разработка #onnx

Как я учил компьютер понимать 122 000 фотографий — и почему сложностью оказались не нейронки, а слова

Как я вообще туда попал Я крайне редко на фрилансе получал заказы связанные с DS/ML, специалистов для таких задач обычно ищут не там. Причины разные: они требуют долгой интеграции, заказчик сам не...

Хабр
Windows App SDK 2.0 release notes - Windows apps

Provides information about what's new in Windows App SDK 2.0.

Ultralytics (@ultralytics)

Ultralytics v8.4.22가 출시되었습니다. 이번 릴리스는 Huawei Ascend NPU 지원 추가, ONNX 및 TensorRT 내보내기 보안성 향상, 다중 GPU DDP 분산 학습의 신뢰성 개선 등을 포함합니다. YOLO 관련 워크플로우에서 NPU 가속 및 모델 변환/배포 안정성이 향상되어 연구·개발과 실운영 환경에서 활용도가 높아집니다.

https://x.com/ultralytics/status/2033171683045937444

#ultralytics #yolo #onnx #tensorrt #npu

Ultralytics (@ultralytics) on X

Ultralytics v8.4.22 is here 🚀 Huawei Ascend NPU support, safer ONNX/TensorRT exports, and more reliable multi-GPU DDP training ⚡ #Ultralytics #YOLO #AI https://t.co/0XxsGsHtNO

X (formerly Twitter)

Oracle AI DB 26aiが高精度EmbeddingモデルのONNXインポートに対応したので試してみた (23.26.1 新機能)
https://qiita.com/ssfujita/items/bc5860e558acef135a22?utm_campaign=popular_items&utm_medium=feed&utm_source=popular_items

#qiita #oracle #Database #ONNX #ベクトル検索 #26ai

Oracle AI DB 26aiが高精度EmbeddingモデルのONNXインポートに対応したので試してみた (23.26.1 新機能) - Qiita

Oracle AI Database 26aiは RU23.4 の頃から、ONNXフォーマットでエクスポートされた埋め込みモデルのインポート機能を提供してきました。 本機能により、埋め込みモデルを提供する外部サービスを使わずとも、DB内でベクトル化ができます。 主にクラウド...

Qiita

inference4j: Java Inference API for Onnx models. Run AI models in Java. Three lines of code, zero setup.

#ai #inference #java #models #onnx

https://github.com/inference4j/inference4j

GitHub - inference4j/inference4j: Java Inference API for Onnx models

Java Inference API for Onnx models. Contribute to inference4j/inference4j development by creating an account on GitHub.

GitHub