Mastodawn

Die automatischen Apple Podcast Transcripts haben doch eine grobe Speaker Diarization eingebacken, aber noch keine Zuordnung zu Sprechernamen.

Und sie enthalten zumindest in der exportierten VTT-Version keine Timestamps pro Wort.