返回技能中心

ElevenLabs 语音转文字
@clawdbotborges
developmentspeech-to-textaudio-transcriptionmultilingual
使用 ElevenLabs Scribe v2 模型转录音频文件,支持 90+ 种语言、说话人分离、音频事件检测和字级时间戳。
🚀 使用 ElevenLabs 语音转文字转录音频文件。支持 90+ 种语言自动检测、说话人识别和音频事件标记(笑声、音乐、掌声)。获得精确的字级时间戳,处理所有主要音频格式——mp3、wav、m4a、ogg、webm 等。
💡 适用于会议、播客、语音笔记和采访。自动识别发言人、提取精确时间用于编辑、轻松处理多语言内容。非常适合记者、研究人员、内容创作者和需要快速准确转录的团队。
✨ 内置说话人分离功能自动区分多个声音。带时间戳的 JSON 输出可无缝集成到工作流中,自动语言检测消除设置摩擦。