Mastodawn

Huawei Cloud incorpora nova geração da IA DeepSeek no Brasil

https://fed.brid.gy/r/https://convergenciadigital.com.br/governo/huawei-cloud-incorpora-nova-geracao-da-ia-deepseek-no-brasil/

Habr 25+2h ago

Миф о «равных весах»: что на самом деле скрывается внутри малых моделей

Последние годы развитие LLM шло по пути экстенсивного масштабирования: считалось, что чем больше весов и данных, тем умнее модель. В индустрии даже сложилась жесткая классификация по количеству параметров: 7B, 8B, 32B. Она же создает иллюзию, что модели одной весовой категории обладают сопоставимыми аналитическими, генеративными и логическими характеристиками, что в корне противоречит современным эмпирическим наблюдениям. Но действительно ли «вес» модели все еще определяет ее качество в 2026 году? Или компактная архитектура способна конкурировать с гигантами, требующими H100 и сотни гигабайт VRAM? В этой статье мы не будем рассуждать об этом абстрактно: возьмем реальные модели из каталога FMC и посмотрим на практике, как размер влияет на качество reasoning, генерации и прикладную эффективность — и влияет ли вообще.

https://habr.com/ru/companies/selectel/articles/1043278/

#mlops #selectel #llmмодели #qwen #phi4 #mistral #gptoss #deepseek #ai #aiагенты

Миф о «равных весах»: что на самом деле скрывается внутри малых моделей

Последние годы развитие LLM шло по пути экстенсивного масштабирования: считалось, что чем больше весов и данных, тем умнее модель. В индустрии даже сложилась жесткая классификация по количеству...

Хабр

Habr 5h ago

Миф о «равных весах»: что на самом деле скрывается внутри малых моделей

Последние годы развитие LLM шло по пути экстенсивного масштабирования: считалось, что чем больше весов и данных, тем умнее модель. В индустрии даже сложилась жесткая классификация по количеству параметров: 7B, 8B, 32B. Она же создает иллюзию, что модели одной весовой категории обладают сопоставимыми аналитическими, генеративными и логическими характеристиками, что в корне противоречит современным эмпирическим наблюдениям. Но действительно ли «вес» модели все еще определяет ее качество в 2026 году? Или компактная архитектура способна конкурировать с гигантами, требующими H100 и сотни гигабайт VRAM? В этой статье мы не будем рассуждать об этом абстрактно: возьмем реальные модели из каталога FMC и посмотрим на практике, как размер влияет на качество reasoning, генерации и прикладную эффективность — и влияет ли вообще.

https://habr.com/ru/companies/selectel/articles/1043278/

#mlops #selectel #llmмодели #qwen #phi4 #mistral #gptoss #deepseek #ai #aiагенты

Миф о «равных весах»: что на самом деле скрывается внутри малых моделей

Последние годы развитие LLM шло по пути экстенсивного масштабирования: считалось, что чем больше весов и данных, тем умнее модель. В индустрии даже сложилась жесткая классификация по количеству...

Хабр

Habr 7h ago

Как и зачем мы сделали собственный OCR-бенчмарк

Однажды нам понадобилось выбрать OCR-модель для RAG-пайплайна. Казалось бы, задача простая: смотришь на лидерборды, берешь лучшую, PROFIT. Но быстро выяснилось, что, во-первых, то, что прекрасно срабатывает на каких-нибудь английских юридических документах, может не потянуть такие штуки как научные формулы, паспортные данные и таблицы на русском языке. А во-вторых, даже если крутой по всем параметрам бенчмарк для оценки качества распознавания говорит, «всё прочитали правильно, я проверил», точность ответов пользователю, который совершает запрос к чат-боту с RAG под капотом, может страдать. Почему так происходит, зачем мы потратили время на сборку собственного OCR-бенчмарка и пожалели ли мы об этом, рассказываю дальше.

https://habr.com/ru/companies/cloud_ru/articles/1043144/

#ocr #rag #LLM #deepseek #glm #markdown #векторный_поиск #data_science #computer_vision

Как и зачем мы сделали собственный OCR-бенчмарк

Однажды нам понадобилось выбрать OCR-модель для RAG-пайплайна. Казалось бы, задача простая: смотришь на лидерборды, берешь лучшую, PROFIT. Но быстро выяснилось, что, во-первых, то, что прекрасно...

Хабр

Webno 9h ago

DeepSeek теперь участвует сразу в трёх гонках ИИ. https://webno.ru/novosti-i-stati/deepseek-teper-uchastvuet-srazu-v-tryoh-gonkah-ii/

#deepseek #искусственныйинтеллект

YAYAFA 18h ago

Anthropic、IPO申請直前に旗艦モデルが大炎上——Claude Opus 4.8、アイデンティティ混乱と天文学的コストで批判殺到 — BigGo ファイナンス https://www.yayafa.com/2814557/ #AgenticAi #AI #Anthropic #ArtificialGeneralIntelligence #ArtificialIntelligence #ClaudeOpus48 #DeepSeek #DeepSWE #GPT55 #OpenAI #エージェント型AI #グレッグ・ブロックマン #ダイナミック・ワークフロー #ダリオ・アモデイ #人工知能 #汎用人工知能 #米証券取引委員会（SEC）

BGDon 🇨🇦 🇺🇸 👨‍💻21h ago

DeepSeek takes first BIG step to move to commercialize its low cost AI offerings.

This a cannon blast across the bow of OpenAI, Antrpoic, Google and the other guys!

DeepSeek is finalizing its first external fundraising round of ~ US$7.4B at a valuation of ~ US$60B.

Big question - how/when will US VCs try to get in on this action without triggering red flags in outbound investing and/or export control regulations??? https://www.scmp.com/tech/big-tech/article/3355818/deepseek-nears-us7b-haul-first-ever-funding-round-backing-tencent-catl #AI #DeepSeek #LiangWenfeng #China #USA #Investing #FundRaising #VentureCapital #VCs #EquityMarkets #Competition #Valuation #High-FlyerQuant #OpenModels #Commercialization

Asifnawaz 1d ago

DeepSeek targets $7B fundraising round in major AI expansion move
#DeepSeek #AI #Funding #TechNews
https://meyka.com/blog/deepseek-targets-7-billion-in-first-ever-fundraising-round-sources-say/

DeepSeek Targets $7 Billion in First-Ever Fundraising Round, Sources Say | Meyka

DeepSeek targets $7.4 billion in its first funding round on June 3, 2026. Tencent and CATL lead externally. Valuation hits $52–59 billion. Full investor breakdown and context inside.

Show thread

JonNobleUK 1d ago

KDE is on gnome apparently.

#gellmanamnesia #deepseek #kde #gnome

didib_photo 📷1d ago

👉 Ein (1) Tool für alle KI-Modelle! 🤖
Und das aus der sicheren Schweiz!🇨🇭

#MONO ist die #KI Oberfläche für alle KI-Modelle und ermittelt das beste KI-Modell automatisch anhand deiner jeweiligen Anfrage. Oder du wählst es selbst. Wirklich cool!

Kostenloses Probeabo über diesen Link:
https://mono.chat/didi-bachmann

Nutze DIESEN Link für die Anmeldung und erhalte 2 Wochen Gratis-Nutzung. Viel Spass!

#OpenAI #ChatGPT #Claude #Grok #Gemini #Perplexity #Mistral #DeepSeek #NanoBanana #Moonshot #ZAI

Mono - The world's best AI in one place

The world's best AI in one place. Mono brings together the best models, pricing, and workflows in one product.

Mono