1M context is now generally available for Opus 4.6 and Sonnet 4.6
https://claude.com/blog/1m-context-ga
#HackerNews #1MContext #Opus4.6 #Sonnet4.6 #TechNews #AIUpdates
1M context is now generally available for Opus 4.6 and Sonnet 4.6
https://claude.com/blog/1m-context-ga
#HackerNews #1MContext #Opus4.6 #Sonnet4.6 #TechNews #AIUpdates
📰 Opus4.6でdraw.io図を生成したらもはやLLMの前提が崩れてた件 (👍 77)
🇬🇧 Opus 4.6 shatters assumptions about LLM spatial reasoning by generating complex draw.io diagrams perfectly without MCP servers or plugins.
🇰🇷 Opus 4.6가 MCP 서버나 플러그인 없이 복잡한 draw.io 다이어그램을 완벽히 생성하며 LLM 공간 추론의 한계를 깨뜨림.
📰 Opus4.6でdraw.io図を生成したらもはやLLMの前提が崩れてた件 (👍 57)
🇬🇧 Opus 4.6 shatters assumptions about LLM spatial reasoning—generating complex draw.io diagrams without MCP or tools, purely on model capability
🇰🇷 Opus 4.6가 LLM의 공간 추론 한계를 깨다—MCP나 도구 없이 순수한 모델 성능만으로 복잡한 draw.io 다이어그램 생성
📰 Opus4.6でdraw.io図を生成したらもはやLLMの前提が崩れてた件 (👍 36)
🇬🇧 Opus 4.6 generates complex draw.io diagrams natively without MCP or plugins, challenging the assumption that LLMs struggle with spatial reasoning.
🇰🇷 Opus 4.6가 MCP나 플러그인 없이 복잡한 draw.io 다이어그램을 생성, LLM의 공간 추론 능력이 약하다는 기존 전제를 뒤엎음.
新清士@(生成AI)インディゲーム開発者 (@kiyoshi_shin)
조사를 할 때 GPT5.2와 ClaudeCode의 Opus4.6을 조합하면 매우 강력하다는 경험 공유입니다. GPT는 집요하게 조사하지만 메모리 유지가 약하고 응답이 길어질 수 있어, 그 로그를 정리해 다른 관점으로 검토시키면 Opus(Opus4.6)가 강력하게 작동한다는 내용입니다.
Artificial Analysis (@ArtificialAnlys)
Claude Sonnet 4.6이 Artificial Analysis Intelligence Index에서 Opus 4.6에 이어 2위를 차지했다는 보고입니다. Sonnet 4.6은 최대 노력 모드에서 4.5보다 출력 토큰을 약 3배 더 사용했으며, GDPval-AA와 TerminalBench에서는 모든 모델을 선도해 Opus 4.6을 근소하게 앞서는 결과를 보였습니다. 성능·효율 비교 정보입니다.

Claude Sonnet 4.6 takes second place in the Artificial Analysis Intelligence Index (behind Opus 4.6), but used ~3x more output tokens than Claude Sonnet 4.5 in its max effort mode. Sonnet 4.6 leads all models in GDPval-AA and TerminalBench, including a slight lead over Opus 4.6
Alex Finn (@AlexFinn)
계획 중인 로컬 AI 구성 노트: Exolabs를 통해 두 대의 Mac Studio에서 Kimi K2.5를 구동하고, 동시에 MiniMax 2.5도 운영합니다. Opus 4.6는 'Henry'라는 메인 오케스트레이터를 구동하며, Mac Mini에서는 로컬 MiniMax가 에이전트를 담당하는 구조로 각 모델의 역할을 분산시킨 설정을 설명하고 있습니다.

Notes on my planned setup: Kimi K2.5 running across both Mac Studios using @exolabs Also will have MiniMax 2.5 running at the same time. Opus 4.6 will power Henry, the main orchestrator. The local MiniMax will power the agent on the Mac Mini. Kimi K2.5 will power the 2nd Studio
Theo - t3.gg (@theo)
작성자가 한 달간 매일 사용해 본 결과를 바탕으로 Opus 4.6과 Codex 5.3을 비교한 영상을 올렸으니 관심 있으면 보라는 추천입니다. 특정 버전(Opus 4.6, Codex 5.3) 비교라는 점이 핵심입니다.
Itamar Golan (@ItakGol)
새로운 Turing Test 결과 공개: 예시 문장(세차장을 걸어갈지 운전할지)을 기준으로 평가한 결과 GPT-5.2 Thinking, Opus 4.6, Gemini 3 Pro는 'Passed'로, GPT-5.2 Instant, GPT-4o, Haiku 4.5, Sonnet 4.5, Gemini는 'Failed'로 표기되어 모델별 성능·추론 차이를 보여주는 벤치마크 발표입니다.

New Turing Test just dropped: “The car wash is 40 m from my home. I want to wash my car. Should I walk or drive there?” Simple. Real-world. No tricks. Passed 🟢 •GPT-5.2 Thinking •Opus 4.6 •Gemini 3 Pro Failed 🔴 •GPT-5.2 Instant •GPT-4o •Haiku 4.5 •Sonnet 4.5 •Gemini