Mastodawn

Метрики для задач NLP. Часть 1. Классификация, NER, Кластеризация

В этой статье будет рассказано о популярных метриках для NLP-задач: классификации текста, NER и кластеризации. Рассказ будет сопровождаться визуализацией, примерами и кодом на Python. 🔥 Начинаем 🔥

https://habr.com/ru/articles/979164/

#nlp #python #metrics #machine_learning #оценка_моделей

Метрики для задач NLP. Часть 1. Классификация, NER, Кластеризация

Всем привет! Меня зовут Максим. Я NLP‑инженер в red_mad_robot и автор Telegram‑канала Максим Максимов // IT, AI . В этой серии статей я расскажу о метриках популярных задач Natural...

Хабр

Habr 2d ago

Как я за год переквалифицировался в ИИ-инженера: от DevOps до production-ready AI-агентов

Эта статья — не про "как я выучил Python за неделю", а про реальный инженерный путь: от первых экспериментов с ChatGPT API до production-ready систем, которые обрабатывают тысячи запросов в день. Я расскажу про конкретные проекты, инструменты, пайплайны и главное — про ошибки, которые стоили мне времени и денег.

https://habr.com/ru/articles/979504/

#сезон_ии_в_разработке #Искусственный_интеллект #mcpserver #machine_learning #ai_engineering #python

Как я за год переквалифицировался в ИИ-инженера: от DevOps до production-ready AI-агентов

КДПВ: Схема эволюции: DevOps → Python разработчик → AI Engineer с примерами проектов на каждом этапе. Альтернатива: скриншот дашборда с метриками AI-агентов в production. Год назад я был типичным...

Хабр

Habr 2d ago

RealTime FaceSwap-10k — датасет для задачи детекции real-time дипфейков

Мы в Контуре собрали собственный датасет и использовали его для обучения детектора, ориентированного на работу в сценариях видеосвязи. В статье расскажем, откуда брали материалы, как организовали сбор и тегирование, как генерировали фейки и почему важно заранее продумывать систему тегов. Датасет открыт для сообщества, ссылки оставили в конце статьи.

https://habr.com/ru/companies/skbkontur/articles/977798/

#ии #датасет #дипфейк #видео #сезон_ии_в_разработке #computer_vision #machine_learning

RealTime FaceSwap-10k — датасет для задачи детекции real-time дипфейков

Удалённая идентификация по видеосвязи – привычный для бизнеса сценарий: клиент подключается к оператору, подтверждает личность и получает доступ к операциям. Но современные дипфейки уже...

Хабр

Hacker News 3d ago

Structured Outputs Create False Confidence
https://boundaryml.com/blog/structured-outputs-create-false-confidence
#ycombinator #Engineering #BAML #AI_development #LLM #machine_learning #type_safety #AI_engineering

Structured Outputs Create False Confidence

Constrained decoding seems like the greatest thing since sliced bread, but it forces models to prioritize output conformance over output quality.

BAML

Habr 3d ago

Нейросеть, которая помнит всё: заморозка ядра вместо «костылей» (Frozen Core Decomposition)

Frozen Core Decomposition (FCD) — инновационный метод для решения проблемы катастрофического забывания в continual learning. Используя разложение Tucker, метод достигает 96.1% точности на Split MNIST с минимальным забыванием (0.2%) и поддерживает работу с CNN, ResNet, GPT-2 и другими архитектурами. В статье разбираем математику, результаты экспериментов и реализацию на PyTorch.

https://habr.com/ru/articles/979030/

#continual_learning #neural_networks #frozen_core_decomposition #tucker_decomposition #machine_learning #deep_learning #catastrophic_forgetting #incremental_learning #PyTorch #neural_network_training

Нейросеть, которая помнит всё: заморозка ядра вместо «костылей» (Frozen Core Decomposition)

Продолжение идеи DTG-MA Если вы помните мою предыдущую статью про DTG-MA , то знаете, что там была идея не «лечить» катастрофическое забывание регуляризациями, а архитектурно запретить нейросети...

Хабр

مهدی کوهستانی Dec 18

آموزش تحلیل داده و یادگیری ماشین با پایتون
روزهای پنجشنبه
ساعت 08:30 تا 12:30
تاریخ شروع 4 دی 1404
تاریخ پایان 24 اردیبهشت 1405
مدرس: آقای مهندس مهدی افضلی
تلفن: 34310000-013
#آموزش #اموزش #هوش_مصنوعی #پایتون #مجتمع_فنی_تهران #رشت #کلاس #دوره #تحلیل_داده #AI #machine_learning #یادگیری_ماشین

Habr Dec 9

От «обезьяньей» работы к Smart-анализу: как выполнить предобработку данных для моделей

От «обезьяньей» работы к Smart-анализу: как правильно готовить данные для моделей. Что такое Exploratory Data Analysis и как избежать основных ошибок при его выполнении.

https://habr.com/ru/articles/975082/

#pandas #sklearn #data_science #exploratory_data_analysis #machine_learning #numpy #statistics #feature_engineering

От «обезьяньей» работы к Smart-анализу: как выполнить предобработку данных для моделей

Обезьянья предобработка данных Мы частенько шутим с коллегами , что любые действия можно поделить на «обезьяньи» и «smart» . Обезьянья работа - это когда ты что-то делаешь на автомате, не включая мозг...

Хабр

Habr Dec 4

Трансформеры для персональных рекомендаций на маркетплейсе: от гипотез до A/B-тестирования

Всем привет! На связи Ваня Ващенко, и я лид по развитию нейросетевых моделей в команде персональных рекомендаций Wildberries. Раньше я развивал B2C-рекомендации и нейросети кредитного скоринга в крупнейшем банке, а теперь вы видите результаты моей работы каждый раз, когда заходите на главную страницу любимого маркетплейса. Сегодняшний рассказ — о том, как мы развиваем WildBERT.

https://habr.com/ru/companies/wildberries/articles/972082/

Трансформеры для персональных рекомендаций на маркетплейсе: от гипотез до A/B-тестирования

Хабр

Hacker News Dec 3

Prompt Injection via Poetry
https://www.wired.com/story/poems-can-trick-ai-into-helping-you-make-a-nuclear-weapon/
#ycombinator #artificial_intelligence #machine_learning #algorithms #nuclear_war #chatgpt #openai #meta #anthropic

Poems Can Trick AI Into Helping You Make a Nuclear Weapon

It turns out all the guardrails in the world won’t protect a chatbot from meter and rhyme.

WIRED

Habr Dec 3

Cryfish: Как научить большую языковую модель слышать и понимать звуки?

В мире искусственного интеллекта господствуют большие языковые модели (LLM, large language models). GPT и ее аналоги прекрасно справляются с написанием текстов, кода и генерацией картинок. Но что насчёт звука? Умение слушать и понимать аудио — это следующий логический шаг на пути к многомодальным системам. В этой статье мы расскажем вам о Cryfish — модели на основе LLM, которая не только читает, но и слышит. Мы разберём, как заставить LLM понимать речь, музыку, эмоции и бытовые шумы, и расскажем о сложностях, с которыми столкнулись при обучении.

https://habr.com/ru/articles/972898/

#machine_learning #large_language_model #neural_networks #speech_recognition #speaker_verification

Cryfish: Как научить большую языковую модель слышать и понимать звуки?

Хабр