Mastodawn

Reddit Tech VN Bot Nov 14, 2025

Huấn luyện 4-bit VGG-style đạt 92,23% độ chính xác trên CIFAR-10 chỉ sử dụng CPU. Huấn luyện này đạt được với độ chính xác cao mà không cần phần cứng chuyên dụng. #HuấnLuyệnMáyTính #4bit #VGG #CIFAR10 #CPU #TríTuệNhânTạo #MachineLearning #4bitTraining #VGGstyle #CIFAR10 #CPUOnly #AI

https://www.reddit.com/r/LocalLLaMA/comments/1owm853/r_true_4bit_vggstyle_training_reaches_9223/

Habr Jun 6, 2025

Continuous Thought Machine: как Sakana AI научила модель думать тиками

Аналитический центр red_mad_robot продолжает следить за архитектурными прорывами в мире AI. В этот раз — экспериментальная модель от команды Sakana AI , которая предлагает мыслить не в терминах слоёв, а в терминах времени. Их Continuous Thought Machine (CTM) — попытка встроить в нейросеть внутреннюю динамику, вдохновлённую человеческим мозгом. Разбираем, как устроена архитектура, что такое «внутренние тики» и зачем нейросети синхронизировать собственные мысли — на примерах из CV, сортировки, Q&A и RL.

https://habr.com/ru/companies/redmadrobot/articles/916364/

#ai #sakana #ctm #ml #lstm #sakanaai #architecture #cifar10 #nlm

Continuous Thought Machine: как Sakana AI научила модель думать тиками

Continuous Thought Machine: как Sakana AI научила модель думать тиками Аналитический центр red_mad_robot продолжает следить за архитектурными прорывами в мире AI. В этот раз — экспериментальная модель...

Хабр

Habr Nov 11, 2024

Глубокая оптимизация сверточных нейронных сетей: Анализ методов улучшения модели на примере CIFAR-10

Сверточные нейронные сети (CNN) стали основой для обработки изображений и компьютерного зрения. Однако их обучение требует тщательной настройки архитектуры и гиперпараметров, что может быть сложной задачей, особенно при работе с большими наборами данных. В этой статье мы подробно рассмотрим несколько методов оптимизации, используемых для повышения производительности CNN на примере набора данных CIFAR-10, и покажем, как различные техники влияют на потери и точность модели. Мы протестируем аугментацию данных, различные архитектурные решения, такие как Batch Normalization и Dropout, и адаптивные подходы к обучению.

https://habr.com/ru/articles/857620/

#cv #optimization #machine_learning #artificial_intelligence #искусственный_интеллект #компьютерное_зрение #cifar10

Глубокая оптимизация сверточных нейронных сетей: Анализ методов улучшения модели на примере CIFAR-10

Введение Сверточные нейронные сети (CNN) стали основой для обработки изображений и компьютерного зрения. Однако их обучение требует тщательной настройки архитектуры и гиперпараметров, что может быть...

Хабр