Large-v3 на Ryzen 5500U: как я оцифровал архив диктофонных записей без GPU и облаков

Как превратить обычный ноутбук в автономную станцию расшифровки, если у вас нет мощной GPU, а облака не подходят по цене или приватности? В статье делюсь опытом создания локального конвейера на базе WhisperX для обработки сотен часов аудиоархива. О чем пойдет речь: Large-v3 на CPU : почему 40 ГБ RAM важнее видеокарты и как добиться стабильной работы без «замерзания» PyTorch. От скрипта к приложению : как с помощью «вайб-кодинга» и Google Antigravity (Gemini 3.0) превратить одиночный скрипт в модульный менеджер очередей с Drag-and-Drop и пакетной обработкой. Техническое «мясо» : установка через uv в один клик, борьба с конфликтами OpenMP и система пресетов (от Turbo до Russian Expert). Реальные цифры : нагрузка на железо, температуры и честная скорость обработки на Ryzen 5500U. Разбираем, как современные LLM позволяют собирать сложные инженерные инструменты «над» ML-моделями, даже не погружаясь в их низкоуровневую реализацию. Репозиторий проекта : whisperx-batch-gui

https://habr.com/ru/articles/1003200/

#WhisperX #Python #Транскрибация #Искусственный_интеллект #Машинное_обучение #LLM #Gradio #Open_Source #Автоматизация #Ryzen

Large-v3 на Ryzen 5500U: как я оцифровал архив диктофонных записей без GPU и облаков

У многих из нас есть «кладбище» аудиозаписей: и��тервью, лекции, длинные совещания. Когда мой архив перевалил за сотню часов, я понял, что пора что-то менять. Облачные сервисы либо кусаются по цене,...

Хабр

Vali Neagu (@AmbsdOP)

원래 Gradio 버전과 동일한 API 호출을 사용하고 있으나, cover 기능에서 Apple 기기에서 메모리 사용량이 높게 나타나는 문제를 발견했습니다. 현재 메모리 최적화에 집중 중이며 곧 PR을 올릴 예정이라고 알렸습니다. 개발자용 툴의 성능 개선 관련 진행 상황을 공유하는 업데이트입니다.

https://x.com/AmbsdOP/status/2019503866929164666

#gradio #memoryoptimization #apple #api #pullrequest

Vali Neagu (@AmbsdOP) on X

@joanplanas @cocktailpeanut We are doing the same API call as the original Gradio version, but I noticed some high memory usage on Apple devices for the cover feature. Right now, I'm focusing on memory optimization. I will push a PR soon.

X (formerly Twitter)

Запускаем AI-ассистента на бесплатном CPU: Qwen2.5 + Gradio + Hugging Face Spaces

Каждый раз, когда кто-то говорит про запуск LLM, возникает вопрос: "А где взять GPU?" Облачные GPU стоят денег, локальные видеокарты стоят ещё больших денег, а бесплатные GPU-тиры исчезают быстрее, чем появляются. Но что если можно запустить полноценного AI-ассистента вообще без GPU? На обычном CPU. Бесплатно. С хорошей поддержкой русского языка. И развернуть его за 15-20 минут. В этой статье рассказывается, как запустить Qwen2.5-3B на бесплатном CPU-тире Hugging Face Spaces, создать веб-интерфейс с помощью Gradio и получить работающего ассистента с поддержкой русского языка. Никаких глубоких знаний не требуется — только базовый Python и аккаунт на Hugging Face. Если вы устали искать бесплатный GPU или просто хотите поэкспериментировать с LLM без лишних затрат — эта статья для вас.

https://habr.com/ru/articles/993312/

#Qwen25 #Gradio #Hugging_Face_Spaces #AIассистент #CPU #Python #llamacpp #машинное_обучение

Запускаем AI-ассистента на бесплатном CPU: Qwen2.5 + Gradio + Hugging Face Spaces

Каждый раз, когда кто-то говорит про запуск LLM, возникает вопрос: "А где взять GPU?" Облачные GPU стоят денег, локальные видеокарты стоят ещё больших денег, а бесплатные GPU-тиры исчезают быстрее,...

Хабр

Linoy Tsaban (@linoy_tsaban)

Flux.2 기반의 새로운 도구 'Relight Brush'를 소개합니다. 컬러 브러시 스트로크로 이미지 조명을 재조정하는 기능으로, 저자는 Flux.2를 중간 단계의 디라이팅(de-lighting) 작업으로 파인튜닝하고 색상 및 위치를 추론하는 맞춤 Gradio 컴포넌트와 결합했다고 설명합니다. lllyasviel의 LuminaBrush에서 영감을 받았으며 이미지 편집/재조명 워크플로우에 적용 가능한 실용적 도구입니다.

https://x.com/linoy_tsaban/status/2019083988674179485

#flux2 #relighting #imageediting #gradio

Linoy Tsaban (@linoy_tsaban) on X

X (formerly Twitter)

Andrew Carr (@andrew_n_carr)

Hugging Face가 DAG 기반 Gradio 워크플로우인 'Daggr'을 공개하며 노드 에디터 시대에 진입했다는 평가입니다. Gradio 위에서 DAG(노드) 기반으로 워크플로우를 구성하는 도구로, Hugging Face 생태계와 개발자 UX에 중요한 업데이트입니다.

https://x.com/andrew_n_carr/status/2016962241816645920

#huggingface #daggr #gradio #workflow

Andrew Carr 🤸 (@andrew_n_carr) on X

Huggingface has entered their node editor era with Daggr (DAG-based Gradio workflows). Really really cool and well done

X (formerly Twitter)

Hugging Face (@huggingface)

daggr 소개: 앱 개발을 위한 새로운 라이브러리로, 여러 모델 엔드포인트를 믹스앤매치하고 Gradio 앱과 통합하며 함수형으로 프로그래밍할 수 있고, 파이프라인을 시각적으로 검사할 수 있는 기능을 제공한다고 안내합니다. 사용해보고 공유하라 권장.

https://x.com/huggingface/status/2016951917931303159

#daggr #gradio #aiworkflows #library #tools

Hugging Face (@huggingface) on X

Introducing daggr: a new way of building apps 🔥 daggr combines best of all worlds, mix-and-match model endpoints, Gradio apps, functions programmatically, inspect the pipeline visually 🙌🏻 Try it out, build and share to get featured!

X (formerly Twitter)

سلطان الفردان (@SultanAlFardan)

LTX-2 모델로 강력한 GPU 없이도 로컬에서 AI 영상 생성이 가능해졌습니다. LTX-2는 단 8GB VRAM으로도 고해상도 영상을 생성하며 메모리 사용을 줄였습니다. WanGP라는 Gradio 기반 간단한 UI가 제공되어 사용이 편리하고, Pinokio를 통해 원클릭 실행도 지원됩니다. (온디바이스 비디오 생성·경량화된 모델·손쉬운 배포 사례)

https://x.com/SultanAlFardan/status/2011281631697670457

#ltx2 #videogeneration #ondevice #gradio #pinokio

سلطان الفردان (@SultanAlFardan) on X

صار تقدر تولّد فيديوهات بالذكاء الاصطناعي على جهازك بدون كرت قوي. •نموذج LTX-2 يشتغل بـ 8GB VRAM فقط •يعطي فيديوهات عالية الدقة مع استهلاك أقل للذاكرة •أداة WanGP واجهتها بسيطة (Gradio) •التشغيل بنقرة واحدة عبر Pinokio

X (formerly Twitter)

right hand: vibe coding a new tool in gradio to download, convert , and output most streaming media podcasts video audio etc to txt so they can be sent straight into ollama for distillation / left hand : giving my 14 year old 4lb yorkie a neck massage in a triple fleeced blanket on my lap

#VibeCoding #Gradio #OpenSource #Ollama #LLMTools #MediaToText #WhisperAI #AIWorkflow #LocalAI #KnowledgeDistillation #Automation

cocktail peanut (@cocktailpeanut)

franzipol이 Apple의 Sharp를 위한 Gradio 웹 UI를 제작해 단 한 장의 이미지로 전체 3D 뷰를 추론할 수 있게 했습니다. Mac/Linux/Windows에서 1클릭으로 실행 가능하며, 실행을 위해 약 10GB VRAM(맥에서는 16GB 메모리 권장)이 필요합니다. 로컬에서 작동하는 3D 생성 도구로 활용할 수 있습니다.

https://x.com/cocktailpeanut/status/2008605036381622593

#3d #singleimage #gradio #apple

cocktail peanut (@cocktailpeanut) on X

Generate 3D from just one image, on your computer. @franzipol has built a gradio web ui for Apple's Sharp, which infers an entire 3D view from just one image. You can run it on any computer with 1-click: Mac, Linux, Windows. Just need 10GB VRAM (16GB memory on Macs).

X (formerly Twitter)

Gradio now auto‑creates a text input, submit button, and output from a simple spec—no extra code. It speeds up Python interface building for text, images, audio or sliders, keeping projects open‑source friendly. Check out the KDnuggets deep dive to see how you can prototype faster. #Gradio #Python #KDnuggets #Interface

🔗 https://aidailypost.com/news/gradio-autocreates-text-input-submit-button-output-from-spec