➤ 你以為 emoji 只有一個字元?程式語言的 Unicode 字串長度大不同
✤ https://hsivonen.fi/string-length/
本文深入探討不同程式語言如何處理包含 emoji 的字串長度計算,揭示 JavaScript、Python 3、Rust 和 Swift 在此方面的技術差異。作者透過實際範例展示,指出 JavaScript 將 emoji 視為多個 UTF-16 編碼單元,Python 3 則因其 Unicode 處理方式導致結果混亂,而 Rust 和 Swift 則分別採用 UTF-8 編碼單元和延伸字位叢集來計算長度,其中 Swift 更能精確地將複雜 emoji 視為單一字元。文章也提及語言在 Unicode 版本更新上的演進,以及第三方函式庫可能帶來的差異。
+ 終於有人把 emoji 字串長度的亂象講清楚了,我一直覺得 JavaScript 這樣處理很奇怪。
+ 看了這篇才知道
#程式語言 #Unicode #字串處理 #emoji