[Karpathy, Autoresearch로 nanochat을 2일간 자동 튜닝해 GPT-2 학습 시간 11% 단축

Karpathy가 Autoresearch 에이전트를 사용하여 nanochat 모델을 2일간 자동 튜닝해 GPT-2 학습 시간을 11% 단축하는 데 성공했습니다. 에이전트는 700개의 변화를 시도해 20개의 유효한 개선사항을 발견했으며, 이는 depth=24 모델에도 적용 가능했습니다. 현재 'round 2'를 시작하고 병렬 처리 및 협업 방식을 연구 중입니다.

https://news.hada.io/topic?id=27402

#autoresearch #automl #llm #tuning #karpathy

Karpathy, Autoresearch로 nanochat을 2일간 자동 튜닝해 GPT-2 | GeekNews

3일전 공개한 Autoresearch 에이전트 가 depth=12 모델 기준으로 약 2일간 자율적으로 약 700개의 변경을 시도해, 검증 손실(validation loss)를 개선하는 약 20개의 유효한 변경사항을 발견발견된 변경사항들은 모두 가산적(additive) 이며 더 큰 depth=24 모델에도 그대로 전이되어, 리더보드의 "Time to GPT-

GeekNews

Akshay (@akshay_pachaar)

Andrej Karpathy가 'autoresearch'를 오픈소스로 공개했다는 소식. 단일 GPU로 하룻밤에 100개의 ML 실험을 자동 실행하며, 에이전트가 코드 작성·훈련·반복·성공 실험 보존까지 수행해 연구자는 하나의 마크다운 파일로 전략만 관리하면 되는 자동화 연구 도구임.

https://x.com/akshay_pachaar/status/2030631376899162617

#autoresearch #karpathy #automl #opensource #mlexperiments

Akshay 🚀 (@akshay_pachaar) on X

Karpathy just open-sourced autoresearch. It runs 100 ML experiments overnight on a single GPU. The agent writes the code, runs the training, iterates and keeps what works. Your entire job is maintaining a single Markdown file, one that describes the research strategy. What to

X (formerly Twitter)

Интеграция искусственного интеллекта в архитектуру маркетплейса на базе DST Platform

​В современной электронной коммерции использование искусственного интеллекта (ИИ) перешло из категории экспериментальных технологий в разряд архитектурных решений. Для владельцев...

#DST #DSTGlobal #ДСТ #ДСТГлобал #DSTplatform #ДСТПлатформ #DSTmarketplace #DSTМаркетплейс #маркетплейс #разработка #CMS #CMF #framework #Фреймворк #искусственныйинтеллект #DSTAI #AutoML

Источник: https://dstglobal.ru/club/1162-integracija-iskusstvennogo-intellekta-v-arhitekturu-marketpleisa-na-baze-dst-platform

Тренды аналитики в 2026 году: как меняется роль аналитика в мире неопределенности и AI

К 2026 году AI перестал быть будущим, экономическая турбулентность стала фоном, а запросы бизнеса к аналитике заметно выросли. От специалистов всё реже ждут просто цифры или аккуратные дашборды, всё чаще — понимания, интерпретации и решений. Я выделил восемь трендов, характерных для этого года, — давайте обсуждать каждый!

https://habr.com/ru/companies/garage8/articles/1000314/

#аналитика_данных #тренды_аналитики #продуктовая_аналитика #datadriven #selfservice_BI #AI_в_аналитике #eventbased_аналитика #realtime_аналитика #AutoML #рынок_труда_2026

Тренды аналитики в 2026 году: как меняется роль аналитика в мире неопределенности и AI

К 2026 году AI перестал быть будущим, экономическая турбулентность стала фоном, а запросы бизнеса к аналитике заметно выросли. От специалистов всё реже ждут просто цифры или аккуратные дашборды,...

Хабр

Как мы оцениваем качество ИИ с помощью ИИ

Заказчиками для ИИ инструментов часто выступают профильные специалисты (от науки или из мира бизнеса), которые не настолько погружены в работу моделей, чтобы легко оперировать метриками ROC-AUC (способность модели различать классы) или Precision (насколько точными являются положительные предсказания модели). Мы подумали, если большие языковые модели способны разъяснить сложные вещи ― например, смету и планы ― то их вполне можно использовать и для оценки самих систем ИИ. почему бы им не показать, что сами системы ИИ работают хорошо или не очень? Наша команда разработала инструмент, который позволяет осуществлять оценку и контроль качества моделей ИИ. Он может оценивать качество данных, сравнивать разные модели и потенциал их дообучения, а также подсказывать свои модели с помощью интегрированного инструмента AutoML от наших коллег из Института ИИ ИТМО, экономя время разработки. В этой статье рассказываем о нашей разработке.

https://habr.com/ru/articles/1000270/

#искусственный_интеллект #программирование #машинное_обучение #automl #ииассистент #университет_итмо #итмо

Как мы оцениваем качество ИИ с помощью ИИ

Заказчиками для ИИ инструментов часто выступают профильные специалисты (от науки или из мира бизнеса), которые не настолько погружены в работу моделей, чтобы легко оперировать метриками ROC-AUC...

Хабр

[Show GN: AutoRAG-Research - 최신 RAG 논문 파이프라인 구현체 모음 및 비교 실험 도구

AutoRAG-Research는 RAG(Retrieval-Augmented Generation) 방법론의 재구현과 성능 비교를 위한 오픈소스 프로젝트로, 표준화된 벤치마크 데이터셋과 미리 구현된 최신 RAG 논문들을 제공합니다. 이 프로젝트는 커스텀 데이터셋과 RAG 파이프라인을 추가하기 쉽게 설계된 플러그인 구조를 지원하며, AI Agent 시대에도 RAG의 중요성을 강조합니다.

https://news.hada.io/topic?id=26624

#rag #opensource #airesearch #benchmarking #automl

AutoRAG-Research - 최신 RAG 논문 파이프라인 구현체 모음 및 비교 실험 도구

<ul> <li>AI Agent 시대에도 RAG는 여전히 유효하며, 외부 지식과 문서가 필요한 경우 필수적으로 시스템에 포함되어야 하는 핵심 구성 요소임</li...

GeekNews

Генетическое программирование: от теории к практике

Сегодня все говорят о больших языковых моделях и глубоком обучении, но помимо них существуют альтернативные методы, которые умеют находить нетривиальные решения и хорошо работают в самых разных задачах. Что будет, если поручить эволюционному алгоритму самому «придумать» формулу? Разбираем генетическое программирование на наглядных примерах: от восстановления тригонометрических функций и символьной регрессии на реальном датасете до оптимизации структуры нейросетей — все эксперименты воспроизводимы в Google Colab.

https://habr.com/ru/articles/994244/

#Генетическое_программирование #символьная_регрессия #эволюционные_алгоритмы #интерпретируемое_машинное_обучение #оптимизация #поиск_формул #нейроэволюция #AutoML #эволюционный_дизайн_моделей #Python

Генетическое программирование: от теории к практике

В статье собран небольшой теоретический материал и несколько практических кейсов применения генетического программирования для символьной регрессии (и не только) на простых, наглядных задачах....

Хабр

🤖 Automatisiertes maschinelles Lernen hilft dabei, KI-Systeme schneller in die Anwendung zu bringen.

Wie #AutoML funktioniert und wofür man es braucht, erklärt Marius Lindauer, @unihannover, @L3S_Research_Center und Mitglied der Plattform @LernendeSysteme, im Video-Statement.

🌿 Inwiefern #KI zu mehr #Nachhaltigkeit beitragen kann und welche Rolle #AutoML dabei spielt, ist in der Langversion des Interviews "Nachgefragt zu KI" zu sehen.

➡️ https://www.youtube.com/watch?v=0qxaLrQGJZw

Стек начинающего дата-сайентиста в 2026: инструменты для роста

Привет! Я Максим Катрушенко, главный специалист по анализу данных и машинному обучению в ПГК Диджитал. В свое предыдущей статье я разбирал ошибки в резюме джунов (и не только) , которые снижают шансы попасть в ML. Сегодня расскажу, как упорядочить инструменты data scientist'а, чтобы легко адаптироваться в специальности. Введение Недавно мне показали проект по прогнозированию ремонта вагонов. Несколько десятков параметров, миллионы записей. Всё решение — один файл Jupyter Notebook и пара скриптов. Я открыл этот файл. Две тысячи строк кода. Названия переменных вроде df_tmp_final_v3. Комментарии на смеси русского и английского. Сохранённые модели назывались model_good.pkl и model_production_maybe.pkl. Некоторые ячейки кода было страшно запускать. Ни документации, ни записи о проведённых тестах. Узнаёте? Это частая реальность в области данных. Вы не одиноки Многие начинающие специалисты задают похожие вопросы: Как работать, когда тестов уже несколько десятков? Вы перебираете настройки и алгоритмы, но через неделю не можете вспомнить, что дало лучший результат. Как внедрить модель? В Notebook всё работает, но как превратить её в сервис, который сможет использовать ваше приложение? Хорошая новость: для этих проблем уже есть решения. На курсах об этом часто не говорят...

https://habr.com/ru/companies/pgk/articles/979688/

#automl #ml #машинное_обучение #data_science #mlops #карьера_итспециалиста #карьера

Стек начинающего дата-сайентиста в 2026: инструменты для роста

Краткий гид: от хаоса к профессиональной разработке моделей машинного обучения Привет! Я Максим Катрушенко, главный специалист по анализу данных и машинному обучению в ПГК Диджитал. В свое предыдущей...

Хабр
AutoML outperforms hand-tuned models in predicting jet engine failure, cutting error rates and accelerating predictive maintenance pipelines. https://hackernoon.com/predicting-jet-engine-failure-with-python-and-automl #automl
Predicting Jet Engine Failure with Python and AutoML | HackerNoon

AutoML outperforms hand-tuned models in predicting jet engine failure, cutting error rates and accelerating predictive maintenance pipelines.