Как мы перестали писать промпты и превратили ИИ в аналоговый синтезатор через PyTorch Hooks

Спойлер: Никаких банальных ИИ-оберток, где текст конвертируется в звук через API. Только хардкорная хирургия нейросетей, кросс-модальные мосты и перехват мыслей LLM в реальном времени. За последний год Hugging Face превратился в конвейер одинаковых проектов: берем Llama/Gemma, прикручиваем к ней интерфейс на Gradio, называем это стартапом. Мы для нашего виртуального музыкального артиста Livadies решили пойти другим путем. Мы задались вопросом: как звучит чистая мысль нейросети, если не переводить ее в текст? И как звучит математическая геометрия доисторического камня или кожи рептилии? Чтобы это выяснить, нам пришлось вскрывать архитектуры SOTA-моделей и сшивать их напрямую на уровне тензоров. Вот два наших главных инженерных эксперимента.

https://habr.com/ru/articles/1020544/

#pytorch #Hugging_Face #LLM #генерация_музыки #dsp #monkey_patching #кроссмодальность #Livadies #generative_art

Как мы перестали писать промпты и превратили ИИ в аналоговый синтезатор через PyTorch Hooks

Спойлер: Никаких банальных ИИ-оберток, где текст конвертируется в звук через API. Только хардкорная хирургия нейросетей, кросс-модальные мосты и перехват мыслей LLM в реальном времени. За последний...

Хабр
A 3T_1R iteration on the back of a new notebook. Acrylic paint.
This is an instance of iteration 1,2,3,1 in the collection. #generative_art #genartclub

AuraGroove: История одного воркера, который не хотел работать

Опыты кодирования с ИИ в команде. Написать эту статью меня сподвигла дилогия уважаемого Александра Антипина aka @alexantipin «Использование нейросетей в разработке игр» и попробовать поделится собственным опытом ИИ — геймдева. Это не совсем геймдев, это про разработку музыкального приложения, осложненное двумя маниакальными идеями: ни строчки кода руками и веб‑прриложение генератор музыки в реалтайм. Сам по себе проект, как законченное приложение, вряд ли представляет интерес, потому что это попытка переосмысления автопилота из другого приложения EtherMusic, тоже написанного ИИ. Там мне так и не удалось победить проблемы производительности на слабых устройствах типа смартфона. С чего вообще все началось, почему музыка, почему броузер, почему самоделка? Основная идея — помочь приобщить (не научить, а именно приобщить) к музыке людей, которые не умеют играть ни каком инструменте, но музыку любят и хотели бы сыграть что нибудь самостоятельно. Вторая идея — это медитация через музыку. Играя свое настроение сейчас или то, настроение, к которому стремишься, через музыку достичь внутренней гармонии. Ну и третья по счету, но главная по смыслу — помочь своему сыну, у которого музыкальный слух, но который не может слушать музыку. Потеря такого гигантского мира чувств, который дает музыка, больно ранит родительское сердце. Есть идея, что играя сам — научишься не ненавидеть музыку, а возможно, даже и полюбить. Посмотрим. Вдруг получится? Про что эта статья? Это просто история кодинга вместе с ИИ. Выводы делайте сами. Мне не нужна оценка качества кода и кода в статье не будет. Будет про архитектуру, идеи, взаимодействие и результат.

https://habr.com/ru/articles/950660/

#web_audio_api #tonejs #worklets #worker #generative_art #musicmaking #музыка #musiccode

AuraGroove: История одного воркера, который не хотел работать

AURA GROOVE Живая музыка, созданная математикой AuraGroove — это живой музыкальный организм, который сочиняет музыку в реальном времени. Он не воспроизводит треки — он создаёт их из ничего, по своим...

Хабр

Nano Banana от Google: генерация и редактирование изображений на новой архитектуре Gemini 2.5

26 августа 2025 года Google представила новую preview-модель под кодовым названием Nano Banana — это часть экосистемы Gemini 2.5 Flash Image , ориентированной на генерацию и редактирование изображений с помощью текстовых и мультимодальных запросов. Несмотря на шутливое название, перед нами — серьёзный инструмент с претензией на роль нового стандарта в визуальном ИИ.

https://habr.com/ru/articles/941086/

#google_api #Nano_Banana #gemini #generative_art #дизайн #генерация_изображений

Nano Banana от Google: генерация и редактирование изображений на новой архитектуре Gemini 2.5

26 августа 2025 года Google представила новую preview-модель под кодовым названием Nano Banana — это часть экосистемы Gemini 2.5 Flash Image , ориентированной на генерацию и редактирование изображений...

Хабр

Как обучают ИИ: без формул, но с котами

В этой статье — без воды, трюизмов, академизмов и формул — разберёмся, в чём принципиальное отличие машинного обучения (ML) от до-ИИ программирования, а затем генеративного ИИ от классических моделей машинного обучения (ML). Поговорим о типах генеративных моделей, их архитектуре и областях применения. Заодно затронем важный вопрос: где проходит граница между классическим программированием и вероятностным творчеством, на котором построены современные нейросети. Статья ориентирована прежде всего на тех, кто делает первые шаги в ИИ, но если ты начинающий ML-инженер, архитектор ИИ-приложений, основатель стартапа или просто хочешь разобраться, что на самом деле происходит под капотом у ChatGPT и Midjourney — ты, скорее всего, найдёшь здесь для себя что-то полезное.

https://habr.com/ru/articles/919296/

#машинное+обучение #искусственный_интеллект #generative_models #generative_art #ml #научпоп #обучение_нейронных_сетей #генеративные_модели #парадигмы #selfsupervised

Как обучают ИИ: без формул, но с котами

Четыре кота, на которых стоит ML Что такое машинное обучение и как оно вообще «учится»? Чем это отличается от обычного программирования с if, for и «всё работает, пока...

Хабр

"You really ought to be the shepherd of your own attention. You can’t let that be stolen from you."—Brian Eno

Inside Brian Eno's Studio | Zane Lowe Interview >

https://youtu.be/nR4JAonAR4g

#interview #art #capitalism #music #attention #creativity #techno_feudalism #stubbornness #discovery #generative_art #bloom_box #Brian_Eno #Gaza

Inside Brian Eno's Studio | Zane Lowe Interview

YouTube
art/processing/MetroMap/MetroMap.pde at main · berkes/art

Art Experiments. Contribute to berkes/art development by creating an account on GitHub.

GitHub

Some new generative art created with Guile-PNG (https://github.com/artyom-poptsov/guile-png).

Now I can draw regular polygons with arbitrary number of sides.

#guile_png #generative_art #scheme #lisp

GitHub - artyom-poptsov/guile-png: Portable Network Graphics (PNG) library for GNU Guile.

Portable Network Graphics (PNG) library for GNU Guile. - artyom-poptsov/guile-png

GitHub

Now Guile-PNG (https://github.com/artyom-poptsov/guile-png) can draw hexagons. Here an example of a rather quite simple form of generative art, created with Guile-PNG.

#guile #png #guile_png #library #generative_art

GitHub - artyom-poptsov/guile-png: Portable Network Graphics (PNG) library for GNU Guile.

Portable Network Graphics (PNG) library for GNU Guile. - artyom-poptsov/guile-png

GitHub

>>> print("".join( chr(randint( 0x1fba0, 0x1fbae)) for i in range(256) ))
🮮🮤🮡🮪🮢🮥🮩🮤🮥🮬🮬🮨🮥🮪🮫🮩🮤🮤🮨🮥🮢🮮🮨🮭🮥🮭🮩🮫🮤🮭🮭🮠🮦🮣🮬🮮🮤🮫🮥🮪🮨🮡🮮🮥🮢🮮🮭🮠🮭🮩🮢🮪🮨🮭🮫🮮🮪🮠🮭🮢🮪🮤🮭🮭🮦🮫🮧🮭🮭🮪🮫🮦🮧🮫🮧🮮🮣🮫🮠🮪🮩🮨🮭🮢🮮🮥🮠🮦🮫🮬🮪🮤🮦🮬🮢🮬🮥🮧🮡🮦🮨🮮🮢🮣🮠🮠🮬🮧🮥🮥🮡🮣🮦🮡🮤🮬🮠🮫🮧🮫🮨🮩🮥🮦🮬🮤🮣🮠🮬🮦🮤🮣🮩🮤🮠🮮🮤🮦🮬🮥🮮🮡🮠🮥🮮🮠🮭🮤🮡🮩🮥🮧🮢🮧🮪🮡🮫🮩🮦🮠🮡🮧🮤🮣🮮🮡🮤🮠🮨🮪🮩🮨🮤🮢🮩🮫🮬🮥🮧🮬🮬🮥🮤🮤🮭🮫🮮🮫🮣🮠🮮🮦🮩🮩🮧🮪🮭🮭🮪🮫🮨🮩🮪🮨🮨🮨🮭🮤🮢🮠🮮🮫🮥🮮🮥🮠🮢🮧🮪🮠🮭🮤🮡🮨🮮🮪🮭🮨🮫🮡🮤🮧🮪🮩🮫🮨🮥🮩🮨🮡🮫🮥🮧🮨🮮🮬🮡🮪🮪🮦🮬🮬🮬🮡🮪🮩

#Python #generative_art