➤ 大型語言模型加速選舉資料的數位化
✤ https://thescoop.org/archives/2025/06/09/how-openelections-uses-llms/index.html
OpenElections 專案致力於將官方選區選舉結果轉換成資料,過去最大的挑戰在於將圖片形式的結果轉換成 CSV 檔案。傳統的手動資料輸入成本高昂且容易出錯,而傳統的光學字元辨識 (OCR) 軟體也難以處理複雜的 PDF 格式。作者 Derek Willis 發現 Google 的 Gemini 大型語言模型在處理這些任務上表現出色,尤其在準確性、處理大文件以及理解格式方面具有優勢。透過提供範例和簡單的指示,Gemini 能夠高效率地將圖片 PDF 轉換為 CSV 檔案,大幅加快了資料處理速度,並將傳統 OCR 和人工資料輸入所需的時間縮短至數小時。儘管仍需要進行人工校驗,但 LLM 顯著提升了 OpenElections 的工作效率,使其能夠處理更多選
#資料科學 #選舉 #大型語言模型 #自動化 #OpenElections

