Mastodawn

ChatGPT 5 вышел! Что нового, бенчмарки и как получить доступ из России

В четверг, 7 августа, в 20:00 по мск состоялось долгожданное событие в мире ИИ — OpenAI представила ChatGPT 5. В этой статье я собрал всю важную информацию из прошедшей демонстрации — это поможет понять, что же нового случилось в GPT 5 и чего ожидать от этой нейросети. Эта модель не просто эволюционный шаг, а качественный скачок, позиционируемый как «разговор с экспертом». В статье мы разберем ключевые нововведения презентации, впечатляющие результаты в бенчмарках и практические возможности (вплоть до генерации приложений!).

https://habr.com/ru/companies/bothub/articles/935430/

#chatgpt_5 #openai #сэм_альтман #agi #вайбкодинг #бенчмарки

ChatGPT 5 вышел! Что нового, бенчмарки и как получить доступ из России

В четверг, 7 августа, в 20:00 по мск состоялось долгожданное событие в мире ИИ — OpenAI представила ChatGPT 5. В этой статье я собрал всю важную информацию из прошедшей...

Хабр

Habr Jul 21

Grok 4 — самая умная модель? Обзор новой нейросети от Илона Маска

В июле этого года Илон Маск и команда xAI выпустили Grok 4 — свою новую «самую умную модель в мире». Компания называет Grok 4 флагманской моделью с «непревзойденной производительностью в языке, математике и рассуждениях». По словам Маска, 4-я версия разумнее, чем учёные в степени кандидата наук: «Многие обладатели PhD завалились бы там, где Grok справился». В этом обзоре — всё об особенностях Grok 4, его характеристики и рекорды в бенчмарках, а также информация, где воспользоваться моделью.

https://habr.com/ru/companies/bothub/articles/929688/

#grok_4 #xai #бенчмарки #тесты #илон_маск

Grok 4 — самая умная модель? Обзор новой нейросети от Илона Маска

В июле этого года Илон Маск и команда xAI выпустили Grok 4 — свою новую «самую умную модель в мире». Компания называет Grok 4 флагманской моделью с «непревзойденной...

Хабр

Habr Jul 19

Бенчмарки и метрики сравнения с продуктами-конкурентами как инструменты повышения качества приложения

Привет, Хабр. Я всё тот же разработчик, приложения для поиска и сравнения цен по маркетплейсам, интернет‑магазинам и классифайдам. В прошлый раз я рассказал, как привлек бесплатно несколько тысяч новых пользователей. Но просто привлечь пользователей это одно, а вот сделать так, чтобы они регулярно начали пользоваться приложением и рекомендовали его другим — это задача со звездочкой. Расскажу в этой статье, как я ее решал.

https://habr.com/ru/articles/929192/

#бенчмарки #сравнение_цен #поиск_товаров #маркетплейсы #качество_поиска #product_market_fit #product_management

Бенчмарки и метрики сравнения с продуктами-конкурентами как инструменты повышения качества приложения

Привет, Хабр. Я всё тот же разработчик, приложения для поиска и сравнения цен по маркетплейсам, интернет‑магазинам и классифайдам. В прошлый раз я рассказал, как привлек...

Хабр

Habr Jun 28

[Перевод] На сколько же медленнее произвольный доступ на самом деле?

Как вы, наверно, знаете, из-за наличия в компьютере различных кэшей (L1, L2, L3...) и того, что операции с памятью выполняются с линиями кэша размером примерно 64 байт каждая, для обеспечения максимальной производительности мы должны писать программы, обеспечивающие локальность . (Разумеется, диск здесь не показан) Но насколько хорошо вы это осознаёте? Допустим, у нас есть массив чисел с плавающей запятой и массив индексов первого массива. Есть программа, складывающая числа из первого массива в порядке, определяемом вторым массивом. То есть в этом примере мы будем складывать ε + α + δ + ζ + β + γ в таком порядке: Давайте рассмотрим всего два случая: индексы идут в порядке от первого до последнего или в произвольном порядке . До того, как я начал писать этот пост, я не мог ответить ни на один из следующих вопросов: 1. Насколько большим должен быть массив, чтобы разница производительности вычисления в двух порядках стала заметной? 2. Сколько в среднем тратится на каждый элемент в порядке от первого до последнего? 3. Насколько медленнее произвольный порядок последовательного в случае массивов, умещающихся в RAM? 4. Насколько медленнее произвольный порядок последовательного в случае массивов, не умещающихся в RAM? 5. Достаточно ли стандартного тасования Фишера-Йейтса для массивов перемешанных индексов для получения произвольного порядка? 6. Насколько медленнее порядок от первого до последнего в случае массивов, не умещающихся в RAM, при использовании файлов с отображением в память? 7. Максимально ли быстры файлы с отображением в память? Если вы уже знаете ответы на эти вопросы, то это замечательно! Если же нет, то делайте ваши предположения и проверьте их, прочитав пост.

https://habr.com/ru/articles/922800/

#кэш #memory_mapped_files #бенчмарки

На сколько же медленнее произвольный доступ на самом деле?

Как вы, наверно, знаете, из-за наличия в компьютере различных кэшей (L1, L2, L3...) и того, что операции с памятью выполняются с линиями кэша размером примерно 64 байт каждая, для обеспечения...

Хабр

Habr 25+Jun 19

Что умеет RTX 4090 в 2025 году и как ее использовать для облачного рендеринга анимаций

RTX™ 4090 — не новинка, но одна из самых сбалансированных карт по цене и производительности. Под катом — не просто обзор железа. Показываем, как 4090 раскрывается в задачах 3D и рендеринга, включая специфичный, но показательный кейс по headless-визуализации с трассировкой лучей и сборкой видео через FFmpeg.

https://habr.com/ru/companies/selectel/articles/919778/

#selectel #видеокарты #nvidia #бенчмарки #железо #3dрендеринг

Что умеет RTX 4090 в 2025 году и как ее использовать для облачного рендеринга анимаций

RTX™ 4090 — не новинка, но одна из самых сбалансированных карт по цене и производительности. Под катом — не просто обзор железа. Показываем, как 4090 раскрывается в задачах 3D и рендеринга,...

Хабр

Habr Jun 19

Что умеет RTX 4090 в 2025 году и как ее использовать для облачного рендеринга анимаций

https://habr.com/ru/companies/selectel/articles/919778/

#selectel #видеокарты #nvidia #бенчмарки #железо #3dрендеринг

Что умеет RTX 4090 в 2025 году и как ее использовать для облачного рендеринга анимаций

RTX™ 4090 — не новинка, но одна из самых сбалансированных карт по цене и производительности. Под катом — не просто обзор железа. Показываем, как 4090 раскрывается в задачах 3D и рендеринга,...

Хабр

Habr Jun 16

ChatGPT o3 Pro: новый флагман OpenAI или маркетинговый ход? Разбираемся

OpenAI снова удивляет: новая модель ChatGPT o3 Pro обещает революцию в аналитике, науке и разработке. Но так ли она хороша? Читайте разбор архитектуры, тестов и подводных камней «самого вдумчивого ИИ» 2025 года. В этом обзоре: бенчмарки (93% точности в математике, 84% в прочих областях), генерация 3D‑шейдеров, сравнение с DeepSeek R1–0528, Gemini 2.5 Pro, Claude Opus 4. А ещё мы проверили, как o3 Pro справляется с написанием рефератов и кодингом. Узнайте, стоит ли подписка за 200 $/мес своих денег и кому o3 Pro реально нужен.

https://habr.com/ru/companies/bothub/articles/918690/

#chatgpt_o3_pro #openai #бенчмарки #aime #gpqa #codeforces #chatbot_arena #nyt_connections #roboflow #рассуждающие_модели

ChatGPT o3 Pro: новый флагман OpenAI или маркетинговый ход? Разбираемся

OpenAI снова удивляет: новая модель ChatGPT o3 Pro обещает революцию в аналитике, науке и разработке. Но так ли она хороша? Читайте разбор архитектуры, тестов и подводных камней...

Хабр

Habr Jun 12

ChatGPT o1 pro: Обзор бенчмарков и тест модели

Доброго времени суток, «Хабр»! Сегодня мы детально разберём, протестируем и раскроем все секреты языковой модели от OpenAI — ChatGPT‑o1 Pro. Первая версия появилась еще 5 декабря 2024 года, однако полноценный релиз состоялся 19 марта 2025 года. Готовы к погружению? Отправляемся в самое сердце GPT — держитесь крепче!

https://habr.com/ru/companies/bothub/articles/917928/

#o1pro #обзор #бенчмарки

ChatGPT o1 pro: Обзор бенчмарков и тест модели

Доброго времени суток, «Хабр»! Сегодня мы детально разберём, протестируем и раскроем все секреты языковой модели от OpenAI — ChatGPT‑o1 Pro. Первая версия появилась еще 5 декабря...

Хабр

Habr Jun 11

Кто быстрее? Тестируем скорость языков программирования на Эльбрусе

Приветствую! Я разработчик в компании НИЦ ЦТ . Мы разрабатываем операционную систему , адаптированную под российские процессоры Эльбрус. Процессоры Эльбрус имеют свою ориггииальную архитектуру которая имеет свои преимущества и недостатки. В частности, интерпретируемые языки программирования не блещут производительностью. Вот мы и решили провести сравнительное тестирование различных языков, компиляторов и интерпретаторов чтобы выяснить, что лучше использовать для разработки под Эльбрус. В статье представлены результаты бенчмарка Programming language benchmark , основанного на решении набора задач идентичными алгоритмами, реализованными на разных языках. Это позволяет оценить эффективность генерируемого компиляторами (или интерпретаторами) кода для выбранной архитектуры, поскольку скорость выполнения напрямую зависит от архитектурных особенностей процессора. Учитывая использование одного ядра процессора в тестах, результаты отражают потенциал оптимизации кода на низком уровне для каждого языка программирования в рамках заданной аппаратной платформы. Полученные данные позволят разработчикам делать более обоснованный выбор языка программирования для задач, критичных к производительности, с учетом специфики целевой архитектуры.

https://habr.com/ru/companies/nic_ct/articles/917490/

#эльбрус #тестирование #сравнение_производительности #linux #бенчмарки

Кто быстрее? Тестируем скорость языков программирования на Эльбрусе

Приветствую! Я разработчик в компании НИЦ ЦТ . Мы разрабатываем операционную систему , адаптированную под российские процессоры Эльбрус. Процессоры Эльбрус имеют свою ориггииальную архитектуру которая...

Хабр

Habr Jun 10

Claude Opus 4 за 75 $/млн токенов vs Sonnet 4 за 15 $: стоит ли переплачивать? Тесты внутри

Май 2025-го выдался жарким на ИИ‑новости: Anthropic наконец запустила долгожданный Claude 4 — сразу в двух вариантах, Opus 4 и Sonnet 4 . Это не просто апдейт, а гибридные рассуждающие модели, которые обещают совместить скорость ответов с глубоким анализом. Разработчики уже грезят ИИ, который программирует днями и ночами , а Anthropic называет это «новым рубежом для кодинга и автономных агентов». Скромничают? Возможно. Но факт: релиз важный. Зачем это всё? Opus 4 способен неустанно кодить и решать многомодальные и агентные задачи, а Sonnet 4 призван поднять планку в массовых сценариях.

https://habr.com/ru/companies/bothub/articles/917042/

#claude #opus_4 #sonnet_4 #anthropic #ииагенты #бенчмарки #гибридные_рассуждения #создание_презентаций

Claude Opus 4 за 75 $/млн токенов vs Sonnet 4 за 15 $: стоит ли переплачивать? Тесты внутри

Привет, «Хабр»! Май 2025-го выдался жарким на ИИ‑новости: Anthropic наконец запустила долгожданный Claude 4 — сразу в двух вариантах, Opus 4 и Sonnet 4 . Это не просто апдейт,...

Хабр