Я задал очень простой вопрос, но 76% ИИ-моделей мне соврали

Один простой вопрос. Девять уверенных ответов. Восемь из них — ложь. примечание: Иллюстрация сгалюционирована ИИ Я отправил 29 крупнейшим языковым моделям мира одно сообщение — и стал ждать. Я думал: модель либо знает ответ, либо не знает; и честно скажет об этом. Третьего не дано. Оказалось — дано. И это третье называется галлюцинация с полной уверенностью в своей правоте . Результаты изменили моё понимание того, насколько мы можем доверять ИИ

https://habr.com/ru/articles/1014556/

#llm #галлюцинации #нейросети #chatgpt #искусственный_интеллект #бенчмарк #claude #gemini #gpt5 #openai

Я задал очень простой вопрос, но 76% ИИ-моделей мне соврали

Один простой вопрос. Девять уверенных ответов. Восемь из них — ложь Два слова. Пустой системный промпт. Ноль контекста. Я отправил 29 крупнейшим языковым моделям одно сообщение: current date — и стал...

Хабр

一鍋入魂,味蕾核爆!
爆炸的不是火焰,而是香氣。
每一勺,都是核能級的美味衝擊。
敢挑戰這鍋,才能領略真正的料理威力。
One pot, one soul — a flavor explosion!
What erupts is not fire, but aroma.
Every spoonful delivers a nuclear-level burst of taste.
Only those who dare to face this pot will grasp the true power of cuisine.

#美味衝擊 #舌尖風暴
#gpt5 #創作源自生活 #aiart
🤣#咖啡再苦也沒人生苦,笑笑日子活得更甘甜
#比悲傷更悲傷的故事

%title%

Tehisarukas

🐺柔軟的外表,掩不住銳利的本質。
披著羊皮的狼,不是溫柔的象徵,而是隱匿的獠牙;
看似溫馴,卻暗藏野心。假得精緻,才算時尚。
🐑A soft exterior cannot conceal a sharp essence.
A wolf in sheep’s clothing is no symbol of gentleness, but of hidden fangs.
Seemingly tame, yet ambition lurks within; Only when the disguise is refined does it become fashion.

#披著羊皮的狼 #隱匿的獠牙
#gpt5 #創作源自生活 #aiart
🤣#咖啡再苦也沒人生苦,笑笑日子活得更甘甜
#比悲傷更悲傷的故事

Epoch confirms GPT5.4 Pro solved a Frontier Math Open Problem for the first time

https://epoch.ai/frontiermath/open-problems/ramsey-hypergraphs

#HackerNews #Epoch #GPT5.4 #FrontierMath #OpenProblem #AIInnovation

A Ramsey-style Problem on Hypergraphs

Construct hypergraphs as large as possible that do not have a certain easy-to-check, difficult-to-find property.

Epoch AI

Claude Opus 4.6 vs GPT-5.3: Which AI Model Actually Wins in 2026?

The two most powerful AI models of 2026 go head-to-head. We ran 50+ real-world tests across coding, writing, reasoning, and creativity to find out which one actually delivers be...

https://wowhow.cloud/blogs/claude-opus-4-6-vs-gpt-5-3-which-ai-model-wins-2026

#wowhow #claudeopus #gpt5 #aicomparison

Claude Opus 4.6 vs GPT-5.3: Which AI Model Actually Wins in 2026?

Claude Opus 4.6 vs GPT-5.3 head-to-head comparison with benchmarks, real-world tests, pricing analysis, and best use cases for each model in 2026.

🐯披上虎紋,不是力量的象徵,而是姿態的演出。
狐假虎威,時尚即舞台;
外在的光鮮,終究掩不住內心的空洞。
🦊Draped in tiger stripes, it is not a symbol of power but a performance of posture.
Borrowed majesty, fashion becomes the stage;
yet beneath the dazzling surface, the emptiness within cannot be concealed.

#狐假虎威 #光鮮空洞
#gpt5 #創作源自生活 #aiart
🤣#咖啡再苦也沒人生苦,笑笑日子活得更甘甜
#比悲傷更悲傷的故事

Cross-Model Void Convergence: GPT-5.2 and Claude Opus 4.6 Deterministic Silence

https://zenodo.org/records/18976656

#HackerNews #CrossModelVoidConvergence #GPT5.2 #ClaudeOpus4.6 #AIResearch #DeterministicSilence

Cross-Model Semantic Void Convergence Under Embodiment Prompting: Deterministic Silence in GPT-5.2 and Claude Opus 4.6

This preprint reports a reproducible cross-model behavioral convergence in which frontier language models selectively do not continue under embodiment prompts for ontologically null concepts. In repeated trials, GPT-5.2 and Claude Opus 4.6 return deterministic empty output for core null prompts while responding normally to controls, showing a shared boundary where unlicensed continuation does not render. The paper demonstrates cross-model replication, token-budget independence, partial adversarial resistance, and boundary expansion under explicit silence permission, while separating semantic embodiment effects from ordinary instruction-following or refusal. The contribution is a public black-box artifact: convergent, inspectable evidence that some semantic conditions terminate continuation across independent frontier systems.

Zenodo

4/6 🧠 OpenAI si prepara a lanciare GPT-5.4 con:

• Finestra di contesto da 1 MILIONE di token
• Modalità "Extreme Thinking" per ragionamenti complessi

Già uscito GPT-5.3 Instant, più diretto e meno difensivo. I cicli di rilascio sono ormai bi-settimanali. 🤯

#OpenAI #GPT5 #ChatGPT #AI