Lately, when I see a labor of love, I've been inclined to let the AI's endearingly immortalize them.

#MetaAI #GeminiAI #OpenAI #ChatGPT #AnthropicClaude #xAIGrok #Lumo #DeepSeek #xoxo

🌘 GitHub - huggingface/open-r1:DeepSeek-R1 的完全開源復刻專案
➤ 實現 AI 推理透明化:Open-R1 的開源復刻之旅
https://github.com/huggingface/open-r1
Open-R1 專案致力於打破黑箱,為社羣提供一套完整的 DeepSeek-R1 訓練管道復刻方案。該專案簡潔明瞭,整合了監督式微調(SFT)與羣體相對策略優化(GRPO)演算法,並提供了一套基於 Distilabel 的合成資料生成工具。開發者可以透過這些標準化的腳本,從零開始進行高效能推理模型的訓練,並複現 DeepSeek 在數學、程式碼及邏輯推理方面的卓越表現。
+ 終於有開源社羣來做這件事了!DeepSeek-R1 的論文雖然詳盡,但實作細節太多,有了這個 repo 學習起來會容易得多。
+ 對於想深入研究 GRPO(羣體相對策略優化)的人來說,這簡直是寶庫。期待後續關於 RL(強化學習)階段的更多實作細節更新。
#人工智慧 #開源模型 #深度學習 #DeepSeek-R1
GitHub - huggingface/open-r1: Fully open reproduction of DeepSeek-R1

Fully open reproduction of DeepSeek-R1. Contribute to huggingface/open-r1 development by creating an account on GitHub.

GitHub
GitHub - huggingface/open-r1: Fully open reproduction of DeepSeek-R1

Fully open reproduction of DeepSeek-R1. Contribute to huggingface/open-r1 development by creating an account on GitHub.

GitHub
🤓 Oh, look! Yet another #GitHub repo promising to revolutionize the world with an "open reproduction" of DeepSeek-R1. Because nothing screams cutting-edge #innovation like a glorified clone fest of #AI code that's about as original as instant coffee ☕.
https://github.com/huggingface/open-r1 #Clones #OpenReproduction #DeepSeek #HackerNews #ngated
GitHub - huggingface/open-r1: Fully open reproduction of DeepSeek-R1

Fully open reproduction of DeepSeek-R1. Contribute to huggingface/open-r1 development by creating an account on GitHub.

GitHub
GitHub - huggingface/open-r1: Fully open reproduction of DeepSeek-R1

Fully open reproduction of DeepSeek-R1. Contribute to huggingface/open-r1 development by creating an account on GitHub.

GitHub

Модели почти год, а она всё ещё №1 по цене/качеству. Прогнал свежий батл-тест — и опять не сдвинул

Я собрал четыре модели в один батч — две Gemma, DeepSeek V4 Flash и Qwen3-235B — потому что не поверил кросс-сессионным данным: выходило, что маленькая Gemma обошла большую. В честной очной ставке сюрприз развеялся, обе Gemma оказались вровень. Зато всплыло другое. DeepSeek V4 Flash, который у меня числился на 83, выдал 89 — был недооценён на 6 баллов. А Qwen3-235B-A22B-2507 — модель, вышедшая 21 июля 2025 года, — снова взяла первое место по цене/качеству. Почти год прошёл: Gemini прыгнул с 57 до 97, DeepSeek я перетестировал трижды, MiniMax все хвалят как ровню Opus. А этот июльский чекпойнт просто держит трон, и я уже почти обижаюсь за прогресс. В статье: разбор очной ставки, хронология ретестов одной модели за год, новый критерий — скорость генерации, ещё восемь моделей июня, непопулярное мнение про раскрутку MiniMax и две новые колонки на лидерборде.

https://habr.com/ru/articles/1046582/

#LLM #Qwen #DeepSeek #Gemma #Benchmarks #OpenRouter #Quality_Assessment #Methodology #Russian_NLP

Модели почти год, а она всё ещё №1 по цене/качеству. Прогнал свежий батл-тест — и опять не сдвинул

Собрал четыре модели в один батч — одна сессия, один судья, те же пять тем. Сравнивать баллы из разных тестов нельзя: разница в пару баллов между сессиями — это шум, а не сигнал....

Хабр

Мы вскрыли трафик ChatGPT, Gemini и DeepSeek, чтобы понять, откуда берутся «источники» в ответах

Когда нейросеть отвечает на вопрос и показывает блок «источников», кажется, что у всех систем это одно и то же — список ссылок, на которые модель опиралась. На деле за этим блоком в каждой системе стоит своя реализация: свой способ обмена с сервером, свой формат ответа, свои поля, из которых интерфейс достаёт цитаты. Мы разобрали сетевой обмен веб-клиентов трёх систем — ChatGPT, Gemini и DeepSeek — и параллельно прогнали через них один и тот же набор запросов по 10 раз, чтобы понять не только техническое устройство цитирования, но и что эти системы реально цитируют. Сразу оговорка: я основатель RankCaster AI — платформы, которая управляет видимостью брендов в ответах нейросетей. То есть мы изучаем категорию, в которой сами работаем. Чтобы не подыгрывать себе, мы исключили собственный домен из всех таблиц ещё до подсчётов, а ограничения методики описали в полном тексте исследования. Здесь — техническая часть: разбор механики цитирования.

https://habr.com/ru/articles/1046259/

#ChatGPT #Gemini #DeepSeek #GEO #LLM #цитирование #SSE #Protobuf

Мы вскрыли трафик ChatGPT, Gemini и DeepSeek, чтобы понять, откуда берутся «источники» в ответах

Когда нейросеть отвечает на вопрос и показывает блок «источников», кажется, что у всех систем это одно и то же — список ссылок, на которые модель опиралась. На деле за этим блоком в каждой системе...

Хабр

Мы вскрыли трафик ChatGPT, Gemini и DeepSeek, чтобы понять, откуда берутся «источники» в ответах

Когда нейросеть отвечает на вопрос и показывает блок «источников», кажется, что у всех систем это одно и то же — список ссылок, на которые модель опиралась. На деле за этим блоком в каждой системе стоит своя реализация: свой способ обмена с сервером, свой формат ответа, свои поля, из которых интерфейс достаёт цитаты. Мы разобрали сетевой обмен веб-клиентов трёх систем — ChatGPT, Gemini и DeepSeek — и параллельно прогнали через них один и тот же набор запросов по 10 раз, чтобы понять не только техническое устройство цитирования, но и что эти системы реально цитируют. Сразу оговорка: я основатель RankCaster AI — платформы, которая управляет видимостью брендов в ответах нейросетей. То есть мы изучаем категорию, в которой сами работаем. Чтобы не подыгрывать себе, мы исключили собственный домен из всех таблиц ещё до подсчётов, а ограничения методики описали в полном тексте исследования. Здесь — техническая часть: разбор механики цитирования.

https://habr.com/ru/articles/1046259/

#ChatGPT #Gemini #DeepSeek #GEO #LLM #цитирование #SSE #Protobuf

Мы вскрыли трафик ChatGPT, Gemini и DeepSeek, чтобы понять, откуда берутся «источники» в ответах

Когда нейросеть отвечает на вопрос и показывает блок «источников», кажется, что у всех систем это одно и то же — список ссылок, на которые модель опиралась. На деле за этим блоком в каждой системе...

Хабр
Niko McCarty. (@NikoMcCarty) on X

Notes on DeepSeek: We visited the company HQ last Tuesday. It was founded in 2023 by Liang Wenfeng and operated out of his hedge fund, High-Flyer, until somewhat recently. The company released their R1 model in January 2025, so it was interesting to see what they’ve been doing

X (formerly Twitter)