Mastodawn

Я выяснил, что Яндекс Музыка на треть состоит из нейрослопа

Возможно вы уже знаете, что в чарт «Яндекс Музыки» залетают треки, сгенерированные ИИ. Например, перепевка стихотворения Есенина «Сыпь, гармоника», которая сейчас на 16 месте чарта. Или трек «Ярмарка судеб» исполнителя Alena, который был даже спет в эфире телеканала Россия 1 . Мне нравились алгоритмы «Яндекс Музыки». Благодаря им в своё время я открыл много малоизвестных артистов, которых слушаю до сих пор. Но с появлением Suno, Lyria, Udio, алгоритмами рекомендаций Яндекса пользоваться стало невозможно. Мне то и дело подсовывались низкокачественные ИИ-треки. В какой-то момент меня это достало. Я провёл своё расследование и получил неутешительные результаты. В базе «Яндекс Музыки» сейчас как минимум 77 тысяч ИИ-исполнителей . Ежемесячно они загружают от 100 тысяч ИИ-треков , что составляет примерно треть от всех загружаемых треков. А каждый 10-й трек в чарте – сгенерирован ИИ . И «Яндекс» ничего с этим не делает. Читать результаты расследования

https://habr.com/ru/articles/1036166/

#ии #нейросети #музыка #машинное_обучение #xgboost #расширения_браузеров #python #typescript

Я выяснил, что Яндекс Музыка на треть состоит из нейрослопа

Теория Практика мёртвого интернета Возможно вы уже знаете, что в чарт «Яндекс Музыки» залетают треки, сгенерированные ИИ. Например, перепевка стихотворения Есенина «Сыпь, гармоника», которая сейчас на...

Хабр

Habr May 5

Книга: «Машинное обучение на табличных данных: XGBoost, глубокое обучение и ИИ»

Привет, Хаброжители! Машинное обучение может ускорить выполнение повседневных бизнес-задач, таких как сверка счетов, прогнозирование спроса или автоматизация обслуживания клиентов, не говоря уже о более сложных задачах, например выявление мошенничества, прогнозное техническое обслуживание и персонализированный маркетинг. Извлекайте важную информацию из электронных таблиц, реестров, баз данных и других источников, используя градиентный бустинг, глубокое обучение и генеративный ИИ.

https://habr.com/ru/companies/piter/articles/1028646/

#анализ #данные #data #ИИ #машинное #обучение #xgboost

Книга: «Машинное обучение на табличных данных: XGBoost, глубокое обучение и ИИ»

Хабр

💧🌏 Greg Cocks Apr 8

Comparative Analysis Of Seagrass Biophysical Properties Mapping Using Multi-Resolution Satellite Imagery And Machine Learning In The Shallow Waters Of Teluk Pandan, Lampung, Indonesia
--
https://doi.org/10.1016/j.rsase.2026.102002 <-- shared paper
--
#GIS #spatial #mapping #Seagrass #monitoring #conservation #accuracy #vegetation #biophysical #benthic #habitat #composition #carbonmapping #Randomforest #ExtremeGradientBoosting #XGBoost algorithms #Sentinel2 #remotesensing #sensor #shallowwater #sentinel #PlanetScope #satellite #TelukPandan #Lampung #Indonesia #AI #deeplearning #machinelearning #model #modeling #water #marine #ocean #habitat #ecosystem #spatialanalysis

Habr Apr 1

Симулятор JWST на Python: как критика Хабра заставила выучить астрофизику и почему мы сделаем открытие раньше NASA

Некоторое время назад я пришел на Хабр с простеньким ML-скриптом, который искал обитаемые экзопланеты. Я ждал похвалы, но вместо этого получил в комментариях ведро ледяной воды: "Где валидация? Что будет при сдвиге распределения? Машинное обучение без физических лимитов — это декорация!" . Вызов был принят. Я выбросил наивный подход, запер XGBoost в клетку суровых законов термодинамики и переписал всё с нуля. Спустя недели разработки и чтения научных статей я представляю ExoLogica AI 2.0 . Теперь это не табличный калькулятор, а 14-ступенчатый астрофизический конвейер. Он считает долю железного ядра, оценивает гидродинамическое сдувание атмосферы и — самое главное — генерирует синтетические спектры для телескопа Джеймса Уэбба (JWST) на лету . Под катом: почему знаменитый индекс подобия Земле (ESI) безнадежно устарел, за что наш скрипт выбросил в мусорку кандидатов от Корнеллского университета, и почему гаражный опенсорс с Хабра имеет все шансы сделать великое открытие раньше, чем бюрократы из NASA.

https://habr.com/ru/articles/1017754/

#экзопланеты #JWST #машинное_обучение #астрофизика #python #XGBoost #NASA #биосигнатуры #открытая_наука #спектроскопия

Симулятор JWST на Python: как критика Хабра заставила выучить астрофизику и почему мы сделаем открытие раньше NASA

Некоторое время назад я опубликовал статью о том, как написал ML-скрипт для поиска потенциально обитаемых экзопланет. Я был воодушевлен результатами (алгоритм бодро находил кандидатов), но в...

Хабр

Habr Mar 29

Как мы сломали индекс обитаемости экзопланет: Парадокс ESI, Physics-Informed ML и 9600 фейковых «Земель»

В прошлой нашей статье мы рассказывали, как написали программу ExoLogica AI для анализа экзопланет. В комментариях Senior Data Scientist'ы справедливо разнесли нас за то, что наша нейросеть ничего не знала об уравнении состояния вещества (не хватало inductive bias ). Мы признали критику, ушли переписывать архитектуру и внедрили полноценный Physics-Informed ML. Но когда мы запустили гибридную модель v2.0, мы обнаружили нечто пугающее. Оказалось, что главный астрономический Индекс Подобия Земле (ESI) систематически лжет . Рассказываем, как мы открыли «Парадокс ESI», ввели собственный индекс физической реализуемости (PRI) и математически доказали, что 71% так называемых «вторых Земель» — это просто куски раскаленного чугуна. И о том, как пара строк кода на Python сократила каталог из 9600 планет до 37 реальных миров, утерев нос популярным спискам обсерваторий.

https://habr.com/ru/articles/1016666/

#экзопланеты #машинное_обучение #астрофизика #jwst #анализ_данных #xgboost #nasa #физика

Как мы сломали индекс обитаемости экзопланет: Парадокс ESI, Physics-Informed ML и 9600 фейковых «Земель»

В прошлой нашей статье мы рассказывали, как написали программу ExoLogica AI для анализа экзопланет, и неосторожно бросили фразу: «Машинное обучение без законов физики — это просто генератор случайных...

Хабр

Habr Mar 29

Космос из школьного кабинета: Как мы научили ИИ законам Кеплера после «разноса» от ученых

Существует стереотип, что современная наука об экзопланетах — это прерогатива NASA и ученых с миллионными грантами. Мы — команда обычных школьников и наш наставник — решили доказать, что для открытия новых миров достаточно ноутбука, Python и понимания того, что Машинное Обучение (ML) без физики — это просто генератор случайных чисел. Это история проекта ExoLogica AI : путь от сокрушительного провала на конференции до создания гибридного интеллекта, который видит то, что иногда пропускают профессиональные телескопы.

https://habr.com/ru/articles/1016416/

#экзопланеты #Астрофизика #машинное_обучение #Python #XGBoost #ExoLogica_AI #Kepler #NASA #KOI4878_b_масса #KOI4878_b

Космос из школьного кабинета: Как мы научили ИИ законам Кеплера после «разноса» от ученых

Существует стереотип, что современная наука об экзопланетах — это прерогатива NASA, ESA и ученых с миллионными грантами. Мы — команда обычных школьников и наш наставник — решили доказать, что для...

Хабр

Kemal Jan 24

How I Built a Machine Learning Tool to Predict Drug Manufacturing Failures

A bioprocess engineer's journey into machine learning and why the pharmaceutical industry desperately needs this bridge When I tell people I work in bioprocess engineering, I usually get blank stares. When I explain that I help manufacture proteins in giant tanks for therapeutic use, the response is often: "Oh, like brewing beer?" Not quite. But close enough. What I don't usually mention is that I've been teaching myself machine learning on nights and weekends. Not because it's trendy, but […]

https://kemal.yaylali.uk/from-bioreactors-to-ai-how-i-built-a-machine-learning-tool-to-predict-drug-manufacturing-failures/

How I Built a Machine Learning Tool to Predict Drug Manufacturing Failures – Kemal's

💧🌏 Greg Cocks Jan 18

Improving Forest Loss Mapping In Nepal Using Landtrendr Time-Series And Machine Learning
--
https://doi.org/10.1016/j.rsase.2025.101864 <-- share paper
--
“HIGHLIGHTS:
• ViT-based forest mask, multispectral ensemble LandTrendr and terrain shadow mask.
• District-level RF/XGBoost model training with expert-weighted validation.
• Outperformed GFC and REDD + AI benchmarks in accuracy and F1 performance.
• RF excelled in High Mountains/Himalayas; XGBoost in the lower Mountain regions.
• NBR contributed the most; snow-impacted forest loss uncertainty was observed..."
#Forestdisturbance #forest #disturbance #remotesensing #LandTrendr #workflow #timeseries #ViT #RF #XGBoost #GEE #Nepal #ForestNepal #spatial #GIS #mapping #earthobservation #landsat #Himalayas #mountains #alpine #vegetation #AI #multispectral #monitoring #spatialanalysis #spatiotemporal #loss #change #machinelearning #NDR #conservation #planning #policy #mitagion #ecology #Karnali #Bagmati, #Darchula #Siwalik #GlobalForestChange #Degradation

sayzard Jan 8

Quan Nguyen (@qnguyen3)

mlx-boosting은 MLX를 활용해 Gradient Boost Tree 및 XGBoost의 학습·예측을 가속화하는 라이브러리로, Apple M3 Max 환경에서 scikit-learn 대비 최대 3.5배 빠른 성능을 제공한다고 보고했습니다. pip로 설치(uv pip install mlx-boosting)하여 바로 사용해볼 수 있다고 안내합니다.

https://x.com/qnguyen3/status/2009272804324073643

#mlx #xgboost #acceleration #performance

Quan Nguyen (@qnguyen3) on X

A fun project I did yesterday, mlx-boosting. Leveraging MLX to train and predict with Gradient Boost Tree, XGBoost, up to 3.5x faster when compared to scikit-learn on M3 Max. Get Started: uv pip install mlx-boosting

X (formerly Twitter)

Zachari Dec 27

I wonder... #xgboost + #neat