Linoy Tsaban (@linoy_tsaban)
KugelAudio는 오픈소스 TTS 모델로 소개되며, Vibe-Voice 7B를 파인튜닝하여 제작되었고 약 20만 시간 분량의 데이터로 23개 언어를 학습해 최첨단(SOTA) 성능을 냈다고 알립니다. 더 많은 주목을 받아야 한다는 추천이 포함된 공개 모델 소식입니다.
Linoy Tsaban (@linoy_tsaban)
KugelAudio는 오픈소스 TTS 모델로 소개되며, Vibe-Voice 7B를 파인튜닝하여 제작되었고 약 20만 시간 분량의 데이터로 23개 언어를 학습해 최첨단(SOTA) 성능을 냈다고 알립니다. 더 많은 주목을 받아야 한다는 추천이 포함된 공개 모델 소식입니다.