Уязвимости в Spring AI и ONNX: как дыры в ИИ‑фреймворках превращаются в утечки данных и чужие модели

ИИ‑фреймворки давно въехали в прод, но к ним часто относятся как к «научной приблуде», а не к ещё одному входу в ваши данные и инфраструктуру. Spring AI и ONNX крутятся где‑то между ML‑командами, продуктами вендоров и внутренними ассистентами, и на определённом этапе за ними перестают успевать архитектура и безопасность. В марте в обзорах уязвимостей рядом всплыли несколько критичных багов именно в этих штуках. Там есть и SQL‑инъекции, и JSONPath‑инъекции, и обход проверки доверия при загрузке моделей. В статье разбираю, что это значит для тех, кто уже тащит ИИ в прод, и даю чек‑лист, который можно прямо отнести своей команде.

https://habr.com/ru/articles/1014606/

#onnx #spring #spring_framework #spring_security #cve #vulnerability #vulnerability_management #уязвимости #уязвимости_и_их_эксплуатация #уязвимость_нулевого_дня

Уязвимости в Spring AI и ONNX: как дыры в ИИ‑фреймворках превращаются в утечки данных и чужие модели

TL;DR В марте нашли критичные уязвимости в Spring AI и ONNX. В Spring AI всплыли SQL‑инъекции и JSONPath‑инъекции в сценариях работы с БД и данными. В ONNX можно обойти проверку доверия при загрузке...

Хабр
🌖 GitHub - KittenML/KittenTTS:25MB 以下的頂尖文字轉語音(TTS)模型 😻
➤ 擺脫 GPU 束縛:為邊緣設備打造的高效能語音合成引擎
https://github.com/KittenML/KittenTTS
KittenTTS 是一款針對邊緣運算優化的開源文字轉語音庫。它憑藉 ONNX 技術,實現了在不依賴 GPU 的情況下,僅透過 CPU 即可進行高品質語音合成。該專案提供 15M 到 80M 參數不等的多種模型規格,體積最小可壓縮至 25MB,並內建 8 種預設聲音供選擇。對於需要在硬體資源受限的環境中導入語音功能的開發者而言,這是一套極具效率的解決方案。
+ 太神奇了!終於能把 TTS 塞進樹莓派或嵌入式設備裡跑,而且還有 8 種聲音選擇,這對產品落地非常有幫助。
+ 雖然模型小巧,但還是希望能看到對中文或其他多語言的支援,目前的 API 雖然簡潔,但若能處理更複雜的標點符號與語調會更好。
#人工智慧 #文字轉語音 #輕量化模型 #ONNX
GitHub - KittenML/KittenTTS: State-of-the-art TTS model under 25MB 😻

State-of-the-art TTS model under 25MB 😻 . Contribute to KittenML/KittenTTS development by creating an account on GitHub.

GitHub

Как я учил компьютер понимать 122 000 фотографий — и почему сложностью оказались не нейронки, а слова

Я крайне редко на фрилансе получал заказы связанные с DS/ML, специалистов для таких задач обычно ищут не там. Причины разные: они требуют долгой интеграции, заказчик сам не понимает задачу, DS более конфиденциален, DS часто возникают внутри продукта, да и в последнее время этот сегмент на фрилансе съедается при помощи LLM: AI integration, RAG боты например. Но, внезапно, мне в личку постучались с таким проектом.

https://habr.com/ru/articles/1010932/

#computer_vision #machine_learning #clip #embeddings #классификация_изображений #zeroshot_learning #уменьшение_размерности_данных #фриланс #продуктовая_разработка #onnx

Как я учил компьютер понимать 122 000 фотографий — и почему сложностью оказались не нейронки, а слова

Как я вообще туда попал Я крайне редко на фрилансе получал заказы связанные с DS/ML, специалистов для таких задач обычно ищут не там. Причины разные: они требуют долгой интеграции, заказчик сам не...

Хабр
Windows App SDK 2.0 release notes - Windows apps

Provides information about what's new in Windows App SDK 2.0.

Ultralytics (@ultralytics)

Ultralytics v8.4.22가 출시되었습니다. 이번 릴리스는 Huawei Ascend NPU 지원 추가, ONNX 및 TensorRT 내보내기 보안성 향상, 다중 GPU DDP 분산 학습의 신뢰성 개선 등을 포함합니다. YOLO 관련 워크플로우에서 NPU 가속 및 모델 변환/배포 안정성이 향상되어 연구·개발과 실운영 환경에서 활용도가 높아집니다.

https://x.com/ultralytics/status/2033171683045937444

#ultralytics #yolo #onnx #tensorrt #npu

Ultralytics (@ultralytics) on X

Ultralytics v8.4.22 is here 🚀 Huawei Ascend NPU support, safer ONNX/TensorRT exports, and more reliable multi-GPU DDP training ⚡ #Ultralytics #YOLO #AI https://t.co/0XxsGsHtNO

X (formerly Twitter)

Oracle AI DB 26aiが高精度EmbeddingモデルのONNXインポートに対応したので試してみた (23.26.1 新機能)
https://qiita.com/ssfujita/items/bc5860e558acef135a22?utm_campaign=popular_items&utm_medium=feed&utm_source=popular_items

#qiita #oracle #Database #ONNX #ベクトル検索 #26ai

Oracle AI DB 26aiが高精度EmbeddingモデルのONNXインポートに対応したので試してみた (23.26.1 新機能) - Qiita

Oracle AI Database 26aiは RU23.4 の頃から、ONNXフォーマットでエクスポートされた埋め込みモデルのインポート機能を提供してきました。 本機能により、埋め込みモデルを提供する外部サービスを使わずとも、DB内でベクトル化ができます。 主にクラウド...

Qiita

inference4j: Java Inference API for Onnx models. Run AI models in Java. Three lines of code, zero setup.

#ai #inference #java #models #onnx

https://github.com/inference4j/inference4j

GitHub - inference4j/inference4j: Java Inference API for Onnx models

Java Inference API for Onnx models. Contribute to inference4j/inference4j development by creating an account on GitHub.

GitHub

Как я снизил WER с 33% до 3.3% для русской речи на CPU: сравнение GigaAM, Whisper и Vosk

За два месяца я перепробовал три ASR-движка, шесть моделей Whisper, адаптивное чанкование, T5-коррекцию и ансамблевое голосование — и большая часть идей оказалась тупиком. В статье — подробный разбор шести тупиков и одной находки: почему GigaAM от Сбера на обычном CPU показывает 3.3% WER на русском, обходя Whisper large-v3-turbo на RTX 4090 (7.9%) в 2.4 раза. С бенчмарками, кодом и честными оговорками.

https://habr.com/ru/articles/1002260/

#speechtotext #gigaam #whisper #vosk #onnx #распознавание_речи #WER #голосовой_ввод #ASR #python

Как я снизил WER с 33% до 3.3% для русской речи на CPU: сравнение GigaAM, Whisper и Vosk

Мне нужен был офлайновый голосовой ввод для Windows — push‑to‑talk, без облака, с хорошим распознаванием русского. Звучит просто? Я тоже так думал. За два месяца...

Хабр

Ускоряем инференс в Python с ONNX

Привет! Если у вас когда‑либо был опыт деплоя нейросетки, вы знаете, что обучение — это полдела, а вот добиться шустрого инференса — целое искусство. Часто обученная в PyTorch модель дает замечательные метрики, но стоит попытаться запустить её в приложении начинаются всякие проблемки. Одно из решений, которое часто выручает — ONNX и ONNX Runtime. Если эти буквы для вас пока ничего не значат — не беда, сейчас разберёмся что к чему. А если вы уже слышали про ONNX, то, возможно, задавались вопросом: «А реально ли ускорить инференс, заморочившись с этой технологией?» Еще как! Ускорить инференс

https://habr.com/ru/companies/otus/articles/991542/

#python #ONNX #инференс #ускорение_моделей #бенчмаркинг

Ускоряем инференс в Python с ONNX

Привет! Если у вас когда‑либо был опыт деплоя нейросетки, вы знаете, что обучение — это полдела, а вот добиться шустрого инференса — целое искусство. Часто обученная...

Хабр