Mastodawn

🌘 編譯器優化何時損害效能：分支判斷勝過查找表
➤ 透過禁用編譯器自動生成的查找表，揭示分支判斷的潛在效能優勢
✤ https://nemanjatrifunovic.substack.com/p/when-compiler-optimizations-hurt
作者在比較計算 UTF-8 字串長度不同方法時，發現使用 C++20 `<bit>` 標頭檔中的 `std::countl_one` 函式，儘管利用了硬體加速，其效能卻不如「樸實」的分支判斷法。深入分析後，發現編譯器（clang++）為優化 `switch` 語句，將其轉換為查找表，這在某些情況下反而導致效能下降。禁用查找表選項後，效能顯著提升，證明瞭分支判斷在特定場景下能帶來更好的表現，並引述了其他研究也發現類似的現象。
+ 這真是個有趣的發現！我從沒想過編譯器為了優化，反而會降低效能，尤其是在處理像 UTF-8 這種常見的字串操作時。禁用查找表的做法聽起來是個值得嘗試的技巧。
+ 文章很深入，點出了編譯器優化的盲點。雖然查找表通常能提升效能，但並非所有情況都適用。作者的實驗
#效能優化 #編譯器 #C++ #UTF-8

When Compiler Optimizations Hurt Performance

Branches can perform better than table lookups

Programming at the right level