Mastodawn

Максимально эффективная интеграция ИИ в робототехнику

OpenGrall — модульный фреймворк для роботов на LLM, который решает три главные проблемы «тормознутых» проектов: 1. LLM принимает решения только высокого уровня. 2. Сенсоры работают асинхронно, никто не ждёт «отстающих». 3. Массив данных структурируется в тщательно выверенный, короткий промпт с весами и возрастом. И другие решения насущных проблем. В статье: архитектура SensorMemory и WeightCalculator, реальные промпты, кэширование решений, эпизодическая память инструкций человека и автономное целеполагание. Всё на GitHub, работает на слабом железе и с LLM почти любых размеров. Узнать, что под капотом →

https://habr.com/ru/articles/1023564/

#LLM #ROS #TinyML #робототехника #OpenGrall #ИИ #Python #WebSocket #Vikhr #DeepSeek

Максимально эффективная интеграция ИИ в робототехнику

Каждую неделю появляется видео: «Я подключил GPT‑4 к своему роботу!». Робот слушает команду, «думает», затем выполняет действие. Всё выглядит впечатляюще… пока вы не замечаете, что робот выполняет...

Хабр

Saemon Zixel Jun 22, 2025

Запустил llama.cpp на другой материнке с процессором AMD E2-3000. Это хоть и аналог Intel Atom, но посовременнее.

Разбор промпта и генерация ответа стали чуть-чуть быстрее. На 10 процентов примерно. Хотя память DDR3 работает на шине 1600МГц и быстрее в 1,5 раза, чем предыдущая DDR2 на 1066МГц шине. Зато процессор был на 2,6ГГц. А у этого всего лишь 1,6ГГц.

Перекомпилировал llama.cpp на этом процессоре, и скорость прям удвоилась.
Vikhr-Llama-3.2-1B-Q8_0 выдаёт 2 токена в секунду.
А QwQ-500M.Q8_0 выдаёт 6 токенов в секунду и прям так бодренько пишет ответ. Правда, моделька глупенькая, склонна рассуждать и редко правильно отвечает.

Как я понял, это всё из-за поддержки процессором AVX1 и FP16C. А скорость оперативной памяти, к сожалению, тут почти не играет роли.

#llamacpp #vikhr #qwq #amd

Saemon Zixel Apr 30, 2025

А llama.cpp достаточно легко и просто скомпилировалась в моей 32битной altlinux. Зависимостей мизер. Ничего не потребовалось доустанавливать, компилить. При этом работает стабильно, не ругается, не сегфолтиться.

Тестил с Vikhr-Llama-3.2-1B-Q8_0.gguf, которая на 1,2ГБ и знает русский язык. Скорость "чтения" промпта 2 токена/сек. А скорость генерации ответа 1 токен/сек. Для вопросов "не к спеху" можно использовать, но качество ответа так себе.

Замечу, что компьютер у меня старенький: Pentium D E6300 на 2,8Ггц, поддерживает максимум SSSE3 и работает с памятью DDR2 на 4ГБ. По этому, то, что есть уже радует меня)

#llama #llamacpp #linux #vikhr

saemonzixel Apr 30, 2025

А llama.cpp достаточно легко и просто скомпилировалась в моей 32-битной altlinux. Зависимостей мизер. Ничего не потребовалось доустанавливать, компилировать. При этом работает стабильно, не ругается, не сегфолтится.

Тестил с Vikhr-Llama-3.2-1B-Q8_0.gguf, которая на 1,2ГБ и знает русский язык. Скорость "чтения" промпта 2 токена/сек. А скорость генерации ответа 1 токен/сек. Для вопросов "не к спеху" можно использовать, но качество ответа так себе.

Замечу, что компьютер у меня старенький: Pentium D E6300 на 2,8Ггц, поддерживает максимум SSSE3 и работает с памятью DDR2 на 4ГБ. По этому, то, что есть уже радует)

#llama #llamacpp #linux #vikhr