Mastodawn

Откуда в обучении берётся nan: численная нестабильность в ML и почему всё считают в логарифмах

Многие ML‑инженеры знают, что нужно использовать CrossEntropyLoss , log_softmax и logsumexp . Гораздо меньше людей могут объяснить, что именно они спасают и почему без них обучение модели периодически превращается в генератор nan . Именно об этом и поговорим.

https://habr.com/ru/companies/otus/articles/1044824/

#численная_стабильность #машинное_обучение #нейронные_сети #softmax #logsumexp #float32 #градиенты #переполнение #underflow #PyTorch

Откуда в обучении берётся nan: численная нестабильность в ML и почему всё считают в логарифмах

Модель обучается, loss падает, метрики растут. На какой‑то эпохе loss внезапно становится nan и больше не восстанавливается, как бы вы ни понижали learning rate. Или инференс...

Хабр

Edwin Groothuis Mar 18

Graphing historical statistics of counters of an application.

No idea how to deal with these values yet....

[edwin.groothuis@sg-shared ~]$ printf "%x\n" 18446744073709551492
fffffffffffffff3
[edwin.groothuis@sg-shared ~]$ printf "%x\n" 9223372036854775807
7fffffffffffffff

#overflow #underflow #visualisation

Games Japan Dec 2, 2024

https://www.wacoca.com/games/958495/ 【アークナイツ】星5重装 – 哨戒衛士『アンダーフロー(Underflow)』オペレーター紹介/解説 Vol.214【Arknights/明日方舟】 #Arknights #FreeGames #GameNoSaihate #Gryphline #hypergryph #MobileGames #Underflow #Yostar #アークナイツ #アークナイツ攻略 #アークナイツ考察 #アークナイツ解説 #アビサルハンター #アンダーフロー #エーギル #ゲーム #ゲームのサイハテ #サイハテ #スマホゲームアプリ #タワーディフェンス #ヨースター #哨戒衛士 #明日方舟 #無料のスマホゲームアプリ #生存航路 #명일방주

【アークナイツ】星5重装 – 哨戒衛士『アンダーフロー(Underflow)』オペレーター紹介/解説 Vol.214【Arknights/明日方舟】

今回の動画はサイドストーリー「生存航路」と同時に実装される★5重装 - 哨戒衛士オペレーター『アンダーフロー(Underflow)』のプロフィールやスキル、ステータス等を解説した動画となっています。動画へのコメントやチャンネル登録、グッドボタンを頂けると嬉しいです。▼チャンネル登録 - Subscribe to my channel!https://www.youtube.com/@GF_Saihate▼Blog - Check out my blog!!https://smartgamecap.net/▼Twitter - Follow Me!!https://twitter.com/GF_Saihate▼タイムライン0:00 はじめに0:45 プロフィールの紹介6:01 素質やスキルなどの紹介と解説8:31 基地スキルの紹介と解説9:07 実プレイ動画12:30 終わり#アークナイツ#Arknights#明日方舟#명일방주

WACOCA GAMES

Show thread

claude Sep 3, 2019

I think I fixed it!

When Xr and Xi are small, (Xr * Xi) can #underflow to 0, so ((Xr * Xi) * S) is 0 already, Changing the multiplication order to ((Xr * S) * Xi) seems to work much better!

The risk of #overflow to infinity in (Xr * S) is probably none, because Xr is small (less than escape radius) but I should double-check deep zooms near the 1e600 threshold for switching from scaled double to long double.

#FloatingPoint