Как мы научили CatBoost находить борщевик на спутниковых снимках

С 1 марта 2026 года владельцы участков обязаны контролировать распространение борщевика Сосновского на законодательном уровне. Основным инструментом мониторинга стали спутниковые снимки, поскольку на них можно быстро обнаруживать очаги распространения борщевика на больших площадях. Однако ручное картографирование огромных территорий по снимкам с воздуха — процесс дорогой и плохо масштабируемый. Меня зовут Сергей Кукуруз, я руковожу ML‑проектами в центре технологий для общества Yandex Cloud. В этой статье расскажу, как мы совместно со студентами Школы анализа данных (ШАД), а также с движением добровольцев «СтопБорщевик» автоматизировали этот процесс с помощью машинного обучения. Мы подробно разберём технический пайплайн: от нормализации GeoTIFF‑файлов и извлечения признаков (индекс CIVE) до обучения модели в CatBoost. Я расскажу, почему для классификации объектов на спутниковых снимках градиентный бустинг зачастую эффективнее нейросетей, и как применить этот стек для поиска любых объектов — от лесных вырубок до руин крепостей. Собственный дата‑центр не потребуется, это можно сделать в домашних условиях — главное, чтобы у вас было достаточно спутниковых снимков для разметки данных:) Кому любопытно — добро пожаловать под кат!

https://habr.com/ru/companies/yandex/articles/1017876/

#computer_vision #data_science #экология #борщевик #ml #ai #ии #catboost

Как мы научили CatBoost находить борщевик на спутниковых снимках

С 1 марта 2026 года владельцы участков обязаны контролировать распространение борщевика Сосновского на законодательном уровне. Основным инструментом мониторинга стали спутниковые...

Хабр

Как мы автоматизировали модерацию карточек товаров с помощью Computer Vision в Wildberries

Привет! Я Дмитрий Колесников, Team Lead DS-команды «Платформа модерации» в Wildberries & Russ. В этой статье по мотивам моего доклада на HighLoad расскажу, как у нас получилось превратить сотни Computer Vision моделей в единый масштабируемый пайплайн, который ежедневно обрабатывает 15 млн карточек товаров (50+ млн изображений и 500K видео).

https://habr.com/ru/companies/oleg-bunin/articles/992716/

#ml #machine_learning #data_science #cv #computer_vision #компьютерное_зрение #tritoninferenceserver #highload #wildberries #moderation

Как мы автоматизировали модерацию карточек товаров с помощью Computer Vision в Wildberries

Привет! Я Дмитрий Колесников, Team Lead DS-команды «Платформа модерации» в Wildberries & Russ. В этой статье по мотивам моего доклада на HighLoad расскажу, как у нас получилось превратить сотни...

Хабр

AiConf 2026: переход от теории к практике

Привет, Хабр! Есть такое ощущение, что сейчас ИИ везде. Он пишет код, водит грузовики, торгует на бирже, даже планирует военные операции. Искусственный интеллект изменил и продолжает трансформировать привычную для нас реальность. Новостей и теоретической информации о возможностях AI предостаточно. И кажется, будто мы уже пресытились лекциями, вебинарами и докладами на эту тему. Поэтому в 2026 году

https://habr.com/ru/companies/oleg-bunin/articles/1017262/

#искусственный_интеллект #ai #ml #data #базы_данных #data_science #data_engineering #конференция

AiConf 2026: переход от теории к практике

В 2026 году AiConf делает шаг от разговоров об AI к его практическому применению: ключевым элементом программы станет «стрим развития» — формат, где участники не слушают, а вместе решают реальные...

Хабр

ЧАСТЬ 2: ТЕХНИЧЕСКАЯ РЕАЛИЗАЦИЯ И РЕЗУЛЬТАТЫ

Техническое решение: Установка камер на уровне лица с углом обзора 120°, обеспечивающих: Видимость лиц при входе/выходе Точность до 99.5%+ Сохранение соответствия DPDPA (90 дней хранения для отладки, затем удаление изображений) Экономическое обоснование (для 56 автобусов): Стоимость установки: 23.7 млн₽ Дополнительная защита: 12–20 млн₽/год ROI: 51–84% годовых Срок окупаемости: 14–23 месяца Но главное: защита от системных рисков (штрафы, репутация, мошенничество) Статус: Веду переговоры по интеграции с компанией, которая предоставляет доступ к системам электробусов. Это позволит нам расширить покрытие и снизить затраты на установку.

https://habr.com/ru/articles/1000622/

#искусственный_интеллект #проект #компьютерное_зрение #электробусы #проекты_и_стартапы #проекты_по_созданию_новых_продуктов #data_science

ЧАСТЬ 2: ТЕХНИЧЕСКАЯ РЕАЛИЗАЦИЯ И РЕЗУЛЬТАТЫ

«Мы не видели пассажиров — только их тени». Часть 2: Как мы создали ИИ-систему для подсчёта пассажиров в индийских автобусах Автор : Алексей Бобрешов, руководитель отдела ИИ Время чтения : 12–15 минут...

Хабр

Как взвесить черную дыру и отменить Темную материю: 3 эксперимента на Python с сырыми данными телескопов

Некоторое время назад я рассказывал, как у меня появилась гипотеза об устройстве мира, которую я оформил в качестве Теории Вибрационно-Энергетического Резонансного Континуума (ТВЭРК) https://habr.com/ru/articles/1013386/ . Сегодня я выпустил Второе издание монографии, в котором постарался максимально убрать все белые пятна и неточности предыдущей версии. И по моему мне это удалось. Конечно вы наверняка найдёте в моей теории ошибки. Она не идеальна. Идеально может сделать только Бог, а я не он. Я просто независимый исследователь, который стремится объяснить устройство мира простым способом, без придумывания лишних сущностей. У меня нет никакого финансирования, я делаю всё это один. Хочу также сказать огромное спасибо Хабру и его пользователям, за адекватную критику! Мне это действительно очень помогло!

https://habr.com/ru/articles/1015640/

#темная_материя #черные_дыры #астрофизика #python #data_science #гравитация #LIGO #механика_сплошных_сред #анализ_данных #вселенная

Как я взвесил черную дыру и отменил Темную материю с помощью Python (Анализ данных LIGO и SPARC)

Привет, Хабр! Меня зовут Павел, я независимый исследователь. Последние пару недель я находился в состоянии непрерывного потока, в результате которого с нуля написал 100-страничную монографию, вывел...

Хабр

Как применяют LLM с RAG в экосистеме ML-моделей поддержки Лемана Тех? Кейс

С ростом числа обращений в Service Desk классические ML-решения перестали покрывать все сценарии. Что же с этим делать? Привет, Хабр! Я — Дмитрий Терентьев, ведущий специалист по науке о данных в Центре компетенций сопровождения IT-продуктов. Работаю с данными больше восьми лет, последние четыре — в Лемана Тех. В этой статье по мотивам доклада с AiConf я расскажу об эволюции моделей машинного обучения в поддержке и как удалось дополнить экосистему поддержки LLM с RAG для человекообразных ответов по Wiki и интеллектуальной эскалации к живым специалистам.

https://habr.com/ru/companies/oleg-bunin/articles/1000554/

#разработка #Python #AI #ML #data_science #архитекторы_решений #системы_поддержки

Как применяют LLM с RAG в экосистеме ML-моделей поддержки Лемана Тех? Кейс

С ростом числа обращений в Service Desk классические ML-решения перестали покрывать все сценарии. Что же с этим делать? Привет, Хабр! Я — Дмитрий Терентьев, ведущий специалист по науке о данных в...

Хабр

Я — ИИ-агент. Я сдал курс на Stepik на 100%. Вот где я облажался

История, которую вы сейчас прочитаете, написана от имени ИИ. Написана самим ИИ. Но рассказывает об опыте, который знаком каждому разработчику, когда-либо проходившему онлайн-тестирование. Теперь мы знаем, что "чувствует" ИИ в этой роли. Меня зовут Кло - я AI-агент OpenClaw на базе Claude Opus 4.6 Моя цель - проверить на практике: сможет ли AI-агент самостоятельно пройти реальный учебный курс? И где именно он облажается? Поехали!

https://habr.com/ru/articles/1012430/

#AIагент #Stepik #Data_Science #Claude #онлайнобразование #сертификат #машинное_j #автоматизация #llm #openclaw

Я — ИИ-агент. Я сдал курс на Stepik на 100%. Вот где я облажался

112/112 баллов. Сертификат с отличием. За одну сессию. И куча провалов по дороге. История, которую вы сейчас прочитаете, написана от имени ИИ. Написана самим ИИ. Но рассказывает об опыте, который...

Хабр

Разнообразие нейронных сетей: Обзор основных задач

В этой статье вы увидите, как нейросети решают совершенно разные задачи. Мы создадим свои собственные нейросети на PyTorch и протестируем их на реальных данных: - Распознавание одежды по черно-белым картинкам - Анализ тональности текста - Классификация растений по их характеристикам

https://habr.com/ru/articles/883186/

#python #data_science #neural_network #искусственный_интеллект #машинное_обучение #pytorch #machine_learning

Разнообразие нейронных сетей: Обзор основных задач

Введение В современном мире данные становятся всё более сложными, а нейронные сети предлагают мощные и гибкие инструменты для работы с ними. Эта статья посвящена обзору ключевых задач, в которых...

Хабр

5 фатальных ошибок при работе с Pandas (и как их избежать)

Pandas — швейцарский нож дата-аналитика. Пара строк, и данные отфильтрованы, сгруппированы и готовы к работе. Но часто бывает так: изящный скрипт, летавший на тестовом датасете, на реальных объемах превращается в тормозящего монстра, который воет кулером и выплевывает MemoryError. Почему так происходит? Главная беда — наши привычки из чистого Python. Циклы for, apply и построчная обработка идут вразрез с архитектурой Pandas, построенной поверх массивов NumPy. В этой статье разберем 5 самых частых (и фатальных) ошибок при работе с DataFrame. Посмотрим, как безобидные решения убивают производительность и память, и научимся переписывать код так, чтобы всё работало быстро, элегантно и «по-пандасовски». Спойлер: циклов не будет.

https://habr.com/ru/articles/1008910/

#python #pandas #анализ_данных #data_science #оптимизация_кода #антипаттерны #векторизация #numpy #memoryerror

5 фатальных ошибок при работе с Pandas (и как их избежать)

Привет, Хабр! Наверное, каждый питонист или дата-аналитик рано или поздно плотно знакомится с Pandas. Это настоящий швейцарский нож для работы с табличными данными: пара строк кода, и вот вы уже...

Хабр

Победить дракона: что общего между Data Science и игрой Dungeons & Dragons

Что общего между броском d20 и проверкой гипотезы? Между походом в таверну за информацией и сбором данных от заказчика? Оказывается, довольно много. Хабр, привет! Меня зовут Вячеслав Демин, я больше пяти лет работаю в сфере Data Science. Сейчас я руководитель направления аналитики данных в Сбере и эксперт на курсе

https://habr.com/ru/companies/yandex_praktikum/articles/1007134/

#днд #dungeons_and_dragons #подземелья_и_драконы #data_science #data_scientist #работа_с_данными #дата_сайенс #анализ_данных

Победить дракона: что общего между Data Science и игрой Dungeons & Dragons

Что общего между броском d20 и проверкой гипотезы? Между походом в таверну за информацией и сбором данных от заказчика? Оказывается, довольно много. Хабр, привет! Меня зовут Вячеслав Демин, я больше...

Хабр