🌘 偏差累積與方差抵銷:隨機捨入在模型訓練中的關鍵作用
➤ 透過隨機捨入突破低精度計算的效能瓶頸
https://convergentthinking.sh/posts/bias-compounds-variance-washes-out/
在神經網絡訓練中,數值精度往往受限於浮點數格式。作者指出,傳統的「四捨五入」(Round-to-Nearest, RNE)在進行微小數值累加時,會因為固定偏差而導致誤差累積,使得模型訓練停滯;相較之下,「隨機捨入」(Stochastic Rounding, SR)能確保誤差均值為零,利用統計特性讓誤差相互抵銷。透過將優化器狀態存儲在 BF16 格式並結合隨機捨入,模型能在節省顯存的同時,達到與 FP32 高精度存儲相媲美的訓練效果。
+ 這篇分析非常透徹,解釋了為什麼有些 BF16 訓練會無故停滯,隨機捨入簡直是低精度計算的救星。
+ 技術細節很扎實,特別是關於隨機行走(Random Walk)帶來的誤差增長差異對比,非常有說服力。
#機器學習 #數值計算 #優化器 #BF16
Bias Compounds, Variance Washes Out

Round-to-nearest makes the same error every time. Stochastic rounding doesn't. Over long runs, that's everything.

Convergent Thinking

Có công cụ chẩn đoán mới cho Strix Halo ComfyUI giúp xác định vấn đề chính xác về độ chính xác bf16 trong hệ thống bộ nhớ thống nhất. Công cụ này hữu ích cho người dùng trên bộ nhớ thống nhất hoặc card đồ họa cũ gặp vấn đề về độ chính xác. #ComfyUI #StrixHalo #bf16 #DebuggingTools #HệThốngBộNhớThốngNhất #CôngCụChẩnDoán #MachineLearning #AI #TríTuệNhânTạo

https://www.reddit.com/r/LocalLLaMA/comments/1qrb7xu/strix_halo_comfyui_debugging_tools_bf16_precision/

FP32, FP16, BF16 и FP8 — разбираемся в основных типах чисел с плавающей запятой

Привет, Хабр! Сегодня давайте поговорим о том, как современные вычисления на GPU стали более гибкими и эффективными благодаря различным форматам чисел с плавающей запятой ( FP64 , FP32 , FP16 , BFLOAT16 и FP8 ). Эти форматы не просто числа — за каждым из них стоит конкретная область применения. В разных ситуациях мы сталкиваемся с задачами, где важны либо скорость, либо точность, и правильно выбранный тип floating point помогает оптимизировать ресурсы. Давайте разберём всё это на примерах и поймём, в каких задачах каждый из этих форматов будет наиболее полезен.

https://habr.com/ru/companies/serverflow/articles/847068/

#FP16 #fp32 #FP64 #BF16 #floating_point #плавающая_запятая #fp8 #числа_с_плавающей_запятой #формат_с_плавающей_запятой

FP32, FP16, BF16 и FP8 — разбираемся в основных типах чисел с плавающей запятой

Привет, Хабр! Сегодня давайте поговорим о том, как современные вычисления на GPU стали более гибкими и эффективными благодаря различным форматам чисел с плавающей запятой ( FP64 , FP32 , FP16 ,...

Хабр