GLiNER Guard (GLiGuard): один schema-driven энкодер вместо зоопарка LLM-гардрейлов

Деплоите LLM? Значит, обвешиваете её гардами. Сначала safety, потом PII, потом prompt injection, потом toxic BERT - и в один прекрасный день обнаруживаете, что у вас 5 классификаторов на каждой ноде и 20 forward-ов на один пользовательский запрос. GLiNER Guard (GLiGuard) - возможность схлопнуть этот стек в единый schema-driven энкодер. И да, его можно тоже промптить: через zero-shot + description.

https://habr.com/ru/companies/raft/articles/1037116/

#GLiNER_Guard #GLiGuard #GLiNER_2 #guardrails #PII #zeroshot #безопасность_LLM #обработка_ПД #модерация #schemadriven

GLiNER Guard (GLiGuard): один schema-driven энкодер вместо зоопарка LLM-гардрейлов

Эта статья - адаптация моего материала, опубликованного на Towards AI , и одновременно продолжение  предыдущего поста про эволюцию GLiNER от UniNER до GLiNER 2 . Там мы остановились на том, что...

Хабр

Тихая эволюция zero-shot энкодеров. От UniNER до GLiNER 2

Пока все говорят про LLM агентов, есть целый класс задач где 205M энкодер делает ту же работу что ChatGPT - быстрее, дешевле, без vendor lock-in. Я хочу рассказать про эволюцию энкодеров, которую вы возможно пропустили: начиная от UniNER, заканчивая GLiNER 2, с ключевыми инсайтами на каждом шаге.

https://habr.com/ru/companies/raft/articles/1010028/

#gliner #ai #ml #llm #nlp #gliner2 #zeroshot #encoder

Тихая эволюция zero-shot энкодеров. От UniNER до GLiNER 2

Эта статья является адаптацией моей статьи , опубликованной в Towards AI Intro Большие языковые модели показывают впечатляющую обобщающую способность, причём не только в задачах генерации текста вроде...

Хабр

@TexJoachim Ja, ok. Kann man so sehen.

Wenn ich (gerade mit Bildungsbezug) etwas generieren möchte habe ich eine Idee, die ich umsetzen will. In der Regel mit einem methodischen oder didaktischen Gedanken oder einer Idee zur Illustration.

Vielleicht ist das der Grund dafür das #Metaprompting bei mir exzellent funktioniert. Dann kann ich die Idee in natürlicher Sprache verfassen und die KI erstellt mir einen funktionalen #Bildprompt für das gewünschte Bildmodell. Klar dauert das etwas. Es ist aber auch kein Selbstläufer gute Bilder zu generieren (nicht fotografieren)!

Solche #Zeroshot-Prompts funktionieren bei mir mit Bildergenerierung fast nie wie gewünscht. Dafür ist mir persönlich dann einfach die Energie zu schade, die verbraucht wird für Datenmüll.

Zeroshots funktionieren m.E. nur gut bei Veränderung von Bildern oder passenden Kontextdateien. Farben tauschen von Objekten in bestehenden Bild oder sowas, dafür passt das prima!

Akkoma

Thảo luận: Giá LLM nên dựa trên “zero‑shot intelligence”. Hiện nhiều công ty tính phí token đầu ra gấp 4‑5× token đầu vào, ngầm cho rằng đầu ra chứa “trí tuệ”. Nếu vậy, mức giá nền tảng cần phản ánh chất lượng trí tuệ – mô hình zero‑shot mạnh hơn nên có mức phí cao hơn. Bạn nghĩ sao? #LLM #AI #Pricing #TríTuệ #ZeroShot #AIVietnam

https://www.reddit.com/r/LocalLLaMA/comments/1qivp84/llms_value/

🤖 #Zeroshot creates autonomous engineering teams for #ClaudeCode #AI #DevTools #opensource

🔧 Point at a #GitHub issue, walk away, and return to verified, production-ready PRs
🛡️ Multiple isolated agents check each other's work - validators didn't write the code, so they can't lie about tests
🔄 Smart task classification: TRIVIAL (1 agent) → CRITICAL (7 agents with security, adversarial testing)

🧵 👇

Sopro TTS: A 169M model with zero-shot voice cloning that runs on the CPU

https://github.com/samuel-vitorino/sopro

#HackerNews #SoproTTS #ZeroShot #VoiceCloning #CPU #Model #AI #Technology

GitHub - samuel-vitorino/sopro: A lightweight text-to-speech model with zero-shot voice cloning

A lightweight text-to-speech model with zero-shot voice cloning - samuel-vitorino/sopro

GitHub

Mô hình TTS mã nguồn mở Sopro (169M tham số) vừa ra mắt! Sopro hỗ trợ chuyển văn bản thành giọng nói thời gian thực và nhân bản giọng nói zero-shot (chỉ cần 3-12s mẫu). Dù chỉ hỗ trợ tiếng Anh và chưa phải SOTA, mô hình đạt tốc độ nhanh 0.25 RTF trên CPU, giúp tạo 30s audio chỉ trong 7.5s.

#Sopro #TTS #AI #ZeroShot #VoiceCloning #MãNguồnMở #TríTuệNhânTạo #CôngNghệ

https://www.reddit.com/r/LocalLLaMA/comments/1q6sp4b/sopro_a_169m_parameter_realtime_tts_model_with/

Чистая правда: как компьютерное зрение помогает делать мир чище

Компьютерное зрение развивается стремительно: задачи, которые ещё недавно требовали собственных датасетов и долгого обучения моделей, теперь решаются готовыми инструментами. Всем привет! Меня зовут Алина, я инженер‑исследователь в Центре искусственного интеллекта СФУ. В этой статье расскажу, как мы применяем методы компьютерного зрения для анализа фотографий уборок в проекте «Чистые игры», как подошли к задаче автоматической оценки качества уборок и какие технические решения легли в основу MVP. В конце поделюсь выводами и тем, что удалось сделать, а что ещё предстоит улучшить.

https://habr.com/ru/articles/968952/

#Object_Detection #zeroshot #grounding_dino #LightGlue

Чистая правда: как компьютерное зрение помогает делать мир чище

В целях защиты персональных данных участников «Чистых игр» вместо оригинальных фотографий использовались стилизованные иллюстрации, сгенерированные с помощью технологий ChatGPT....

Хабр

I do not want to hear another word from anyone how useless #AI is...

... after a 5 hour (compute burn not RT), at the bottom of a very very deep rabbit hole...there was this magnificent conclusion that made me laugh out loud.

"The universe is just really efficient at disappointing itself." 🤡
~ Claude

I guess its one of those "You had to be there moments".

#LLM #ZeroShot

MultiADS: Defect-aware Supervision for Multi-type Anomaly Detection and Segmentation in Zero-Shot Learning

In manufacturing, quality control remains a critical yet complex task, especially when multiple defect types are involved. MultiADS introduces a system capable of detecting and segmenting a wide range of anomalies (e.g., scratches, bends, holes), even in zero-shot settings.

By combining visual analysis with descriptive textual input and using a curated Knowledge Base for Anomalies, MultiADS generalizes to unseen defect types without requiring prior visual examples and consistently outperforms state-of-the-art models across several benchmarks, offering a robust and scalable solution for industrial inspection tasks.

Sadikaj, Y., Zhou, H., Halilaj, L., Schmid, S., Staab, S., & Plant, C. MultiADS: Defect-aware Supervision for Multi-type Anomaly Detection and Segmentation in Zero-Shot Learning. International Conference on Computer Vision, ICCV 2025, Hawai, Oct 19-23, 2025, #ICCV2025. https://arxiv.org/abs/2504.06740.

#AI #AIResearch #ComputerVision #AnomalyDetection #ZeroShot

MultiADS: Defect-aware Supervision for Multi-type Anomaly Detection and Segmentation in Zero-Shot Learning

Precise optical inspection in industrial applications is crucial for minimizing scrap rates and reducing the associated costs. Besides merely detecting if a product is anomalous or not, it is crucial to know the distinct type of defect, such as a bent, cut, or scratch. The ability to recognize the "exact" defect type enables automated treatments of the anomalies in modern production lines. Current methods are limited to solely detecting whether a product is defective or not without providing any insights on the defect type, nevertheless detecting and identifying multiple defects. We propose MultiADS, a zero-shot learning approach, able to perform Multi-type Anomaly Detection and Segmentation. The architecture of MultiADS comprises CLIP and extra linear layers to align the visual- and textual representation in a joint feature space. To the best of our knowledge, our proposal, is the first approach to perform a multi-type anomaly segmentation task in zero-shot learning. Contrary to the other baselines, our approach i) generates specific anomaly masks for each distinct defect type, ii) learns to distinguish defect types, and iii) simultaneously identifies multiple defect types present in an anomalous product. Additionally, our approach outperforms zero/few-shot learning SoTA methods on image-level and pixel-level anomaly detection and segmentation tasks on five commonly used datasets: MVTec-AD, Visa, MPDD, MAD and Real-IAD.

arXiv.org