Amazon Transcribe カスタム言語モデルで「お食事券」と「汚職事件」を聞き分ける
https://qiita.com/mksamba/items/6b38ac0d49eb7d060fee?utm_campaign=popular_items&utm_medium=feed&utm_source=popular_items
Amazon Transcribe カスタム言語モデルで「お食事券」と「汚職事件」を聞き分ける
https://qiita.com/mksamba/items/6b38ac0d49eb7d060fee?utm_campaign=popular_items&utm_medium=feed&utm_source=popular_items
#RealtimeTranscription for #PyConIT 🎙️
Whisper hallucinated on real conference audio: a problem I skipped for time: everything else to build.
🔮 Spoiler: #AmazonTranscribe doesn't generate text, it decodes it.
In the article: the choices I made, and the stories you only find when plugging things in (Linux audio is a zoo) 😄
CreatorCaps detects your video format and suggests the best caption style. Pick your font, highlight color, and preset.
No subscriptions, one-time unlock.
Try it on iPhone & iPad: https://apple.co/4ruCxYI
Cohere Transcribe: Speech Recognition
https://cohere.com/blog/transcribe
#HackerNews #Cohere #Transcribe #Speech #Recognition #AI #Tech #Innovation
Công cụ Transcribe (tx) miễn phí, chạy cục bộ với Whisper, hỗ trợ nhận diện giọng nói theo thời gian thực, phân biệt người nói (diarization) và thời gian chính xác. Hỗ trợ file, mic, âm thanh hệ thống và tích hợp Ollama để tóm tắt nội dung (tùy chọn). Hoạt động ngoại tuyến, đa nền tảng: Windows, macOS, Linux. Giao diện đồ họa và CLI tiện lợi tự động hóa.
#Transcribe #Whisper #Ollama #SpeechToText #Diarization #AI #LocalAI #CôngCụ #TríTuệNhânTạo #ThuyếtTrình
Deepseek只靠选项猜测听力答案
音频靠的是IDM自动嗅探的,哪个文件大基本哪个就是听力文件
音频转文字靠replicate的gpt-4o-transcribe
既有听力材料又有题目默认全对
第1-4 1 ❌3 ✅
第5-8 1 ❌ 3 ✅
第9-11 1 ❌ 2 ✅
第12-15 1 ❌ 3 ✅
16-25的音频缺失嗅探不到了,只能靠选项猜答案
看看deepseek能帮我考多少分