GitHub - google-deepmind/searchless_chess: Grandmaster-Level Chess Without Search
Link📌 Summary: 本文介紹了一種「無搜尋的國際象棋大師級別」模型的實施,該模型是以270M參數的變壓器模型,針對1000萬個國際象棋對弈資料集進行監督學習,並使用強大的Stockfish 16引擎進行註解。結果顯示,模型在與人類對弈時象棋等級可達2895,且成功解決了一系列挑戰性棋局,性能超越了AlphaZero與GPT-3.5。在模型與數據集的規模分析中,強大的象棋表現僅在足夠的規模下出現。大量的設計選擇與超參數的剖析亦證實了這一成果。🎯 Key Points:
- 實施了一個270M參數的變壓器模型,用於國際象棋。
- 訓練資料來自1000萬局棋賽,擁有約150億數據點。
- 模型在與人類對弈的Elo等級可達2895,無需特定搜尋算法。
- 證實模型優於AlphaZero和GPT-3.5的策略與價值網路。
- 模型與資料集的大小分析顯示,性能強在足夠規模下才能達成。
🔖 Keywords:
#國際象棋 #模型 #Stockfish #機器學習 #大規模