Мы тут уже больше года с @rayslava ходим на уроки японского. Вы это уже, конечно, знаете если слушали наш подкаст и читали нас.
Первые пару месяцев я вёл конспекты в тетрадочке, но в итоге перестал потому что:
- не успеваю записывать и одновременно воспринимать полноценно то, что на экране
- потом искать по тетрадочке с её разрастанием становится мягко говоря неудобно - была несколько раз ситуация когда я хотел найти нужное слово или форму, но на её поиск требовалось больше времени чем поиск в интернете или обращение к LLM
А недавно я всё-таки решил вернуться к конспектам, но уже по-новому.
Теперь у меня есть скриптик, который делает слудующее:
- получает от меня имя файла с записью занятия (которую я делаю в OBS)
- с
ffmpegвынимает аудио - с
ffmpegделает скриншоты картинки раз в 15 секунд - скармливает аудио занятия
whisper.cpp:main-vulkan(предварительно скачав с HuggingFace нужную модельку если её нет) - упаковывает субтитры, аудио и скриншоты в тарбол
- я отдаю тарбол ChatGPT с заранее написанным промптом и получаю на выходе:
- Markdown (Obsidian)
- EPUB (e-Ink читалка)
- PDF (десктоп)
Несмотря на дикие лулзы, которые творит Whisper на смешанной речи записанной из удалённого урока, работает на удивление годно и уже помогало мне готовиться к урокам и при выполнении домашнего задания.
P.S. В появлении этого поста вините @rayslava
#LLM #ML #AI #study #Japanese #log #workflow #automation #thoughts #pic #whisper #FFMPEG #ChatGPT #STT #ASR #pipeline #language












