Vibecode по дешевке — домашний сервер с Qwen Code за 25к, который не отключит Anthropic

Я начинающий инженер: учусь, работаю, пишу код. Подсел на Claude — и быстро уткнулся в лимиты: полчаса работы, и могучие руки превращаются в лапки. А пока писал эту статью, Anthropic вообще взял и отключил Fable 5 — для всех разом. Сегодня доступ есть, завтра кто-то наверху решил — и ты ни с чем. Поэтому я собрал собственный сервер с локальной LLM. Серверная Tesla V100 с Авито, переходник, водянка, открытая рама вместо корпуса — всё про 25 тысяч за базу (и ~35 со всеми доп. картами). Внутри крутится Qwen3.6-35B и пишет код со скоростью до 85 токенов в секунду. В статье — честно и с цифрами: какое железо и почём, замеры скорости, как llama.cpp раскидывает одну модель сразу по нескольким видеокартам, и живые примеры того, что она умеет — от генерации кода до разбора чужого на прочность. Никакого облака и подписок: всё работает дома, рядом с кроватью, и его никто не отключит сверху. Посмотреть. что собрал

https://habr.com/ru/articles/1049052/

#Tesla_V100 #локальный_LLM #llamacpp #домашний_сервер #инференс #selfhosted #нейросети #AIагент #водяное_охлаждение #qwen_code

Vibecode по дешевке — домашний сервер с Qwen Code за 25к, который не отключит Anthropic

«У нас было две планки оперативной памяти, одна серверная Tesla V100, прочная открытая рама вместо корпуса, 5 райзеров, коробка, наполовину набитая переходниками питания, и целое море...

Хабр

Vibecode по дешевке — домашний сервер с Qwen Code за 25к, который не отключит Anthropic

Я начинающий инженер: учусь, работаю, пишу код. Подсел на Claude — и быстро уткнулся в лимиты: полчаса работы, и могучие руки превращаются в лапки. А пока писал эту статью, Anthropic вообще взял и отключил Fable 5 — для всех разом. Сегодня доступ есть, завтра кто-то наверху решил — и ты ни с чем. Поэтому я собрал собственный сервер с локальной LLM. Серверная Tesla V100 с Авито, переходник, водянка, открытая рама вместо корпуса — всё про 25 тысяч за базу (и ~35 со всеми доп. картами). Внутри крутится Qwen3.6-35B и пишет код со скоростью до 85 токенов в секунду. В статье — честно и с цифрами: какое железо и почём, замеры скорости, как llama.cpp раскидывает одну модель сразу по нескольким видеокартам, и живые примеры того, что она умеет — от генерации кода до разбора чужого на прочность. Никакого облака и подписок: всё работает дома, рядом с кроватью, и его никто не отключит сверху. Посмотреть. что собрал

https://habr.com/ru/articles/1049052/

#Tesla_V100 #локальный_LLM #llamacpp #домашний_сервер #инференс #selfhosted #нейросети #AIагент #водяное_охлаждение #qwen_code

Vibecode по дешевке — домашний сервер с Qwen Code за 25к, который не отключит Anthropic

«У нас было две планки оперативной памяти, одна серверная Tesla V100, прочная открытая рама вместо корпуса, 5 райзеров, коробка, наполовину набитая переходниками питания, и целое море...

Хабр
#ai #qwen_code #obsidian #оркестрация
Похвастаюсь) Пилил-пилил я вчера навык оркестрации для квена, и "о чудо", он вроде бы корректно отработал сегодня на сложной задаче. Смысл: запускается сервер ollama (5 доступных моделей), квен служит в роли оркестратора: оценивает задачу, декомпозирует на более мелкие задачи, делегирует выполнение мелких задач подходящим моделям ollama, после выполнения проверяет результат каждой мелкой задачи, оценивает, принимает результаты, собирает в общую композицию, отдает пользователю с отчетом о проделанной работе. Пока еще на реальных задачах опробация не проходила, но, как вижу, с синтетикой справляется. Теперь мы перешли к стадии тестирования, посмотрим как она будется справляться с реальными задачами. Ну, круто же! Я знаю, вы думаете, что я - король аськи, но пока не могу подтвердить, статус не занят, могу поделиться) Нужно провести больше тестов.