🌗 「strtod」莫測高深!
➤ 關於浮點數轉換及任意精度算術的觀念。
https://festina-lente-productions.com/articles/strtod-is-wild/
「strtod」是 C 標準庫中一個看似無辜的函數,接受十進位表示的數字,如「10.35」,返回最接近的浮點二進位數(雙精度 C 類型)。然而,實現 100% 正確性其實相當困難,需使用任意精度算術。路程頗為艱辛,優秀的現代實現包括 Grisu 算法和 fast_float 等。創建者如 David M. Gay 在上世紀已為此做出貢獻,其代碼龐大且需處理大量記憶體,不過在一些實現中也沒有過多的記憶體分配。加強版本甚至能無縫處理無限縮放,類似於處理任意精度數字。
+ 有趣的文章,我對任意精度算術有了更深入的瞭解。
+ 讀起來很有挑戰性,實現這樣的函數確實不簡單。
#數字轉換 #精度 #浮點數 #二進位 #十進位
strtod Is Wild!

Example article format

🌘 計算機和電腦告訴我的謊言
➤ 計算機和電腦的限制和錯誤
https://www.stewartcalculus.com/data/default/upfiles/LiesCalcAndCompTold.pdf
本文介紹了口袋計算機和電腦的限制,包括精度和數值範圍。此外,還介紹了一些常見的計算機和電腦錯誤,以及如何通過符號運算和不等式來解決這些問題。
+ 這篇文章讓我更瞭解計算機和電腦的限制,以及如何解決這些問題。
+ 很有趣的一篇文章,讓我對計算機和電腦的運作原理有了更深入的瞭解。
#計算機 #電腦 #限制 #精度 #誤差
🌘 我們對向量存儲的看法完全錯了嗎?
➤ 向量存儲的精度和初始召回集
https://hachyderm.io/@softwaredoug/111000936722843110
在搜索中,我們關心增加初始召回集,然後通過更智能的模型(BM25、數據的數值特徵、餘弦相似度等)提高精度。為什麼我們會對向量數據庫中前10個的完美準確性著迷?建立符合這些基準的數據結構會產生外部性,使其難以更新和管理。
+ 這篇文章提供了有關向量存儲的有趣見解,讓我重新思考了搜索的方法。
+ 很好的文章,提供了有關數據結構的重要信息,這對於數據庫管理員來說非常有用。
#向量存儲 #搜索 #精度 #數據結構
Doug Turnbull (@softwaredoug@hachyderm.io)

Do we think about vector storage completely wrong? For search, we care about increasing the initial recall set. Which often can be 100s or 1000s. Then we want to improve the precision over that with a smarter model that can use many things (BM25, numeric features of the data, cos similarity, etc) Why do we obsess over perfect accuracy in top 10 for vector dbs? Building to those benchmarks have externalities making data structures that are hard to update and manage?

Hachyderm.io