Artificial Analysis (@ArtificialAnlys)

Alibaba가 0.8B부터 9B 파라미터까지 범위의 Qwen3.5 모델 4종을 공개했습니다. 트윗에 따르면 9B 모델은 10B 이하에서 가장 높은 지능지수(Reasoning, 32)를 기록했고, 4B 모델은 5B 이하에서 가장 높은 점수(Reasoning, 27)를 기록했으며, 두 모델 모두 인텔리전스 지수 산출에 2억+ 출력 토큰을 사용한다고 언급했습니다.

https://x.com/ArtificialAnlys/status/2029496068615057758

#alibaba #qwen3.5 #llm #intelligenceindex

Artificial Analysis (@ArtificialAnlys) on X

Alibaba has released 4 new Qwen3.5 models from 0.8B to 9B. The 9B (Reasoning, 32 on the Intelligence Index) is the most intelligent model under 10B parameters, and the 4B (Reasoning, 27) the most intelligent under 5B, but both use 200M+ output tokens to run the Intelligence Index

X (formerly Twitter)

Wes Roth (@WesRothMoney)

Artificial Analysis가 범용 AI 모델 지능을 측정하는 지표인 Intelligence Index v4.0을 발표했다. 이번 업데이트는 상위 모델 점수의 포화현상을 줄여 최고 점수를 이전 v3.0의 73에서 50으로 조정했으며, 평가 항목에 새로 3가지 항목을 도입하는 등 지표 체계를 갱신함으로써 모델 비교·평가의 정밀도를 높였다고 설명함.

https://x.com/WesRothMoney/status/2008984482020274482

#intelligenceindex #benchmark #aimetrics #artificialanalysis #evaluation

Wes Roth (@WesRothMoney) on X

Artificial Analysis has released Intelligence Index v4.0, their most advanced and rigorous synthesis metric yet for measuring generalist AI model intelligence. The updated index: 🔹Reduces score saturation top models now score 50 (down from 73 in v3.0) 🔹Introduces 3 new

X (formerly Twitter)

Artificial Analysis (@ArtificialAnlys)

Artificial Analysis가 Intelligence Index v4.0을 발표했습니다. 이번 버전은 3개의 신규 평가를 도입해 실사용 사례에 더 정렬하고 포화(saturation)를 줄이도록 설계되었습니다. 해당 지표는 범용(Generalist) 모델의 성능을 종합적으로 평가하기 위한 합성 메트릭으로 소개됩니다.

https://x.com/ArtificialAnlys/status/2008570646897573931

#artificialanalysis #intelligenceindex #benchmark #aievaluation

Artificial Analysis (@ArtificialAnlys) on X

New year, new Artificial Analysis Intelligence Index! Announcing Intelligence Index v4.0: incorporating 3 new evaluations, further aligning to real-word use and reducing saturation The Artificial Analysis Intelligence Index is our synthesis metric for assessing generalist model

X (formerly Twitter)