Yicheng (@ChrisYicheng)
책 같은 정적 콘텐츠는 한 번만 음성을 생성해 CDN에 저장하면 요청당 비용을 사실상 없앨 수 있다는 제안과 함께 작성자가 로컬에서 학습한 TTS 모델이 Kokoro보다 성능이 더 좋다고 밝힘. 'listen' 기능 구현을 희망하며 구현에 도움을 제공하겠다고 함.

Yicheng (@ChrisYicheng) on X
@deedydas Cool! Would love to see a "listen" feature here, and the cost problem is solvable. Books are static content: generate audio once, store on CDN, serve forever. Zero per-request cost. We actually trained a local TTS model that outperforms Kokoro. Happy to help make this happen.



