Goodhart’s Law in action 🙄:
“More! More! More! Tech Workers Max Out Their A.I. Use.”, The New York Times (https://www.nytimes.com/2026/03/20/technology/tokenmaxxing-ai-agents.html?unlocked_article_code=1.UlA.Wda2.-3Rz1wP8LBVw&smid=url-share).
H/T: Dare Obasanjo
#AI #AITokenUsage #GoodhartsLaw #Metric #TokenMaxing #LLMs #Measure #FakeProductivity #Waste #Dashboard #Leaderboard #Work
Vision AI Checkup은 51개 비전·언어 모델을 수십 개의 실사용 과제(총 89개 프롬프트)로 평가한 리더보드입니다. 1위는 Gemini 3.1 Pro(84.1%)이며 Gemini 3 Flash, Gemini 3.1, OpenAI O4 Mini/GPT-5.4 등이 상위권에 포진해 있습니다. 벤치마크·평가 코드는 오픈소스이며 누구나 프롬프트를 추가해 기여할 수 있습니다.
How I Topped the HuggingFace Open LLM Leaderboard on Two Gaming GPUs
https://dnhkng.github.io/posts/rys/
#HackerNews #HuggingFace #LLM #Leaderboard #Gaming #GPUs #AI #Research #Machine #Learning