zast (@zast57)

ZastTranslate 1.03이 출시되었습니다. VoxCPM 2 기반으로 음성 복제 안정성을 개선했으며, 깨끗한 5~15초 구간을 추출하는 reference extraction, Demucs 분리 트랙 활용 등 음성 클로닝 품질 향상을 위한 실전적인 업데이트가 포함됐습니다.

https://x.com/zast57/status/2056036290051584311

#speech #voicecloning #translation #opensource #ai

zast (@zast57) on X

Stayed up part of the night on this one. ZastTranslate 1.03 is out. Since the 1.01 I shared here, I pushed hard on VoxCPM 2 by @OpenBMB voice cloning stability (surgical reference extraction picking the cleanest 5-15s segment from the Demucs-isolated track, persistent default

X (formerly Twitter)
OpenAI posiluje své AI schopnosti akvizicí startupu Weights.gg, který se specializuje na klonování hlasů. Nové technologie se integrují do ChatGPT a API. #AI #OpenAI #AI #OpenAI #voicecloning 📰 The Decoder

PBS NewsHour - The Latest | How to recognize and block AI-powered scam attempts by Paul Solman, Ryan Connelly Holmes

AI generated summary, Read the full article for complete information.

In this PBS NewsHour segment, Paul Solman explains that scams are getting harder to avoid because fraudsters now use artificial‑intelligence tools—such as realistic voice‑cloning—to impersonate trusted individuals, with seniors often being the primary targets; the report describes how these AI‑powered scams operate, offers practical tips for spotting them (like questioning unexpected requests for money or personal information, verifying callers through independent channels, and recognizing synthetic‑voice cues), and outlines steps to protect yourself, including using call‑blocking features, reporting suspicious activity, and staying vigilant about emerging AI‑driven deception techniques.

Read more: https://www.pbs.org/newshour/show/how-to-recognize-and-block-ai-powered-scam-attempts

#AI_poweredscams #voicecloning #banks #artificialintelligence #scams

How to recognize and block AI-powered scam attempts

If it feels like it's getting harder and harder to avoid being scammed, that's because it is. In the age of artificial intelligence, scammers are using voice cloning that can sound very real, and seniors are often the target. Paul Solman reports on the problem and what you can do to protect yourself.

PBS News

OpenAI acquired Weights.gg, a voice-cloning startup with a catalog of unauthorized celebrity voice models, and dispersed the team rather than integrate it as a product group. The service shut down in March. OpenAI's own Voice Engine remains in limited preview citing safety concerns, creating a pattern worth examining.

#AI #VoiceCloning #OpenAI

https://www.implicator.ai/openai-quietly-bought-voice-cloning-startup-weights-gg-then-folded-the-team/

OpenAI Quietly Bought Voice-Cloning Startup Weights.gg

OpenAI quietly bought Weights.gg, a six-person voice-cloning startup whose Replay catalog hosted models for Taylor Swift, Samuel L. Jackson and President Trump. The team has dispersed; the IP transferred. OpenAI still says its own voice-cloning tool is too risky for general release.

Implicator.ai

DramaBox: An Open-Weight TTS That Reads Stage Directions

DramaBox는 텍스트가 아닌 연극 대본 형식의 무대 지시문을 입력받아 감정과 연기 톤을 반영한 음성을 생성하는 오픈 웨이트 TTS 모델입니다. Lightricks의 LTX-2.3 비디오용 확산 트랜스포머를 IC-LoRA로 파인튜닝하고, Gemma 3 12B 텍스트 임베딩으로 자연어 지시문을 해석해 대사 전달 방식을 조절합니다. 10초 음성 샘플을 주면 해당 목소리와 연기 스타일을 모방할 수 있으며, 게임, 오디오 드라마, 더빙 등 표현력이 중요한 오디오 네이티브 경험에 적합합니다. 다만 24GB VRAM 요구와 상업적 이용 제한이 있어 주의가 필요합니다.

https://firethering.com/dramabox-open-weights-tts-voice-cloning/

#tts #diffusion #llm #voicecloning #audiogeneration

DramaBox: An Open-Weight TTS Model Built Around Stage Directions - Firethering

Dramabox just landed on Hugging Face and the demo space is live. Resemble AI built it on top of Lightricks' LTX-2.3, and the thing that makes it different from every other TTS model is simpler than you'd expect, you don't give it text to read. You write it a scene.

Firethering

Voicebox는 완전 로컬에서 구동되는 오픈소스 AI 보이스 스튜디오로 ElevenLabs·WisprFlow의 무료 대안입니다. 몇 초 샘플로 목소리 클론, 다중 TTS 엔진, Whisper 기반 전사·정제, 타임라인 에디터·오디오 이펙트, Metal/CUDA/ROCm/DirectML/Intel Arc 등 로컬 GPU 지원을 제공합니다. REST API와 MCP 연동으로 에이전트에 클론 음성을 부여하고 API키·요금 없이 오프라인 사용이 가능합니다.

https://voicebox.sh/

#tts #voicecloning #opensource #localinference #whisper

Voicebox

Open source voice cloning. Local-first. Free forever.

Show HN: We built a tool to dub any video in the original voice in 30 languages

Vaani는 원본 음성을 클론하여 30개 이상의 언어로 비디오를 더빙하는 도구입니다. 이 서비스는 로봇 음성 문제, 음악 손실, 의미 왜곡, 입 모양 불일치 문제를 해결하며, 10개 이상의 인도 언어와 20개 이상의 글로벌 언어를 지원합니다. 크리에이터가 다시 촬영하지 않고도 글로벌 시청자에게 콘텐츠를 자연스럽게 전달할 수 있도록 설계되었습니다.

https://news.ycombinator.com/item?id=48084756

#voicecloning #videodubbing #multilingual #contentlocalization #aiaudio

DeepTechTR (@DeepTechTR)

오픈소스 음성 클로닝 도구 ‘Voice-Pro’가 공개됐다. 매우 빠르고 고품질로 평가되며, 영상 제작, 보이스오버, 더빙 작업의 수준을 크게 끌어올릴 수 있는 새로운 AI 음성 도구로 소개된다.

https://x.com/DeepTechTR/status/2050653888098013481

#opensource #voicecloning #audiotool #aigeneration

DeepTechTR 🇹🇷 (@DeepTechTR) on X

🚨 Arkadaşlar, son dakika gerçekten bomba gibi bir gelişme! “Voice-Pro” adlı yeni açık kaynak araç, gelmiş geçmiş en hızlı ve en kaliteli ses klonlama programlarından biri olarak yayınlandı. Video, seslendirme ve dublaj işlerini bambaşka bir seviyeye taşıyor: - Çok yüksek

X (formerly Twitter)