Нейронные аудиокодеки: мощное сжатие звука с помощью LLM

В июле 2024 года французская компания Kyutai опубликовала речевую модель Moshi с нейронным аудиокодеком Mimi. Это был первый в мире голосовой end-to-end AI с открытыми исходниками, способный вести диалог в реальном времени и свободный для использования всеми желающими, демо . Вместо прямого предсказания сэмплов аудиокодек работает в три этапа: 1. Токенизация звука. 2. Предсказание следующих токенов в LLM. 3. Восстановление оригинала.

https://habr.com/ru/companies/ruvds/articles/1040026/

#float #double #fc #архиваторы #IEEE754 #метаархиватор #Mimi #tiktoken #семантические_токены #ruvds_статьи

Нейронные аудиокодеки: мощное сжатие звука с помощью LLM

Если использовать нейросеть как «большой словарь токенов» для архиватора, то можно разработать архиватор с рекордным коэффициентом сжатия. Например, сейчас в мировом бенчмарке Large Text Compression...

Хабр
https://www.wacoca.com/life/412560/ 美容家の「34歳→42歳」にネット騒然 「めっちゃ綺麗に」「本当に同一人物?」激変ぶり話題に | ENCOUNT #/x/ #article #beauty #Biyō #grooming #Mimi #SNS #美容

The Tin Bullet: Show&Tell

Aula 1206, Pabellón 0+infinito, lunes, 4 de mayo, 18:30 GMT-3

Buenas! El lunes 4/5 (HOY!!!!) están invitados a la segunda edición de "The Tin Bullet" un evento de micro charlas en la facultad.

La primer edición estuvo muy buena y se trajeron cosas muy piolas. Cópense y vengan a la segunda!

Esta vez vamos a estirar las charlas a 10-15 minutos así hay mas espacio para exponer y consultar.

Al final de la jornada tomamos un mate y charlamos sobre lo expuesto (La ultima vez colmamos MauroIT)

En fin!! Los esperamos <3!!

https://cartelera.inexactas.ar/event/the-tin-bullet-showandtell-1