Mastodawn

Habr Jul 31, 2025

Когда несколько пикселей решают всё: One Pixel атака и способы защиты от неё

Удивительно, но факт: несколько изменений в изображении могут полностью поменять вывод нейросети, что ломает заложенную разработчиком логику. В данной статье мы не просто подсветим факт существования One Pixel атаки, но и комплексно разберём архитектурные факторы, которые влияют на устойчивость CV-систем к данному семейству атак.

https://habr.com/ru/articles/932934/

#one_pixel_attack #computer_vision #alexnet #resnet #efficientnet #inceptionv3 #visual_transformer

Когда несколько пикселей решают всё: One Pixel атака и способы защиты от неё

Удивительно, но факт: несколько изменений в изображении может полностью изменить вывод нейросети, что ломает заложенную разработчиком логику. В данной статье мы не просто подсветим факт существования...

Хабр

Habr Jul 25, 2025

Как мы построили embedding-модель уха на Vision Transformers: от идеи до 88% точности

Пока весь мир гонится за распознаванием лиц и отпечатков пальцев, мы в решили взглянуть на человека чуть сбоку — буквально. Пришел клиент, принес проект. Система поиска родственных связей по фото. Все работает, все ищется, но хочется, чтобы было еще точнее, еще глубже. «А что если сравнивать…уши», – подумали мы. Почему уши? Потому что они, как и лица, обладают уникальной формой, но в отличие от лица — не меняются с возрастом, не маскируются бородой и не хмурятся на паспортном контроле. Идеальный кандидат для дополнительного биометрического сигнала. Но не все так просто. Нам предстоял полный цикл разработки модуля распознавания и сравнения ушей:

https://habr.com/ru/articles/931070/

#биометрическая_аутентификация #биометрия #распознавание_изображений #эмбеддинги #embeddings #visual_transformer #датасет #cnn #искусственный_интеллект #компьютерное_зрение

Как мы построили embedding-модель уха на Vision Transformers: от идеи до 88% точности

Хабр

Habr Jun 28, 2025

Часть 2: Vision Transformer (ViT) — Когда трансформеры научились видеть

Представьте, что лингвист внезапно стал экспертом по живописи. Именно это произошло в 2020 году, когда архитектура для обработки текста — трансформеры — научилась "видеть" изображения. Vision Transformer (ViT) доказал: для понимания картинок не обязательны свёртки! Разберем "на пальцах" как она устроена и как изображения превращаются в предсказания.

https://habr.com/ru/articles/922868/

#visual_transformer #vit #transformer #computervision #разбор_статьи

Часть 2: Vision Transformer (ViT) — Когда трансформеры научились видеть

Обо мне Привет, меня зовут Василий Техин, и последние 6 лет я живу в мире машинного обучения — от первых шагов с линейной регрессией до экспериментов с современными VLm. Когда я только начинал, мне не...

Хабр