返回技能中心
ElevenLabs 语音转文字

ElevenLabs 语音转文字

@clawdbotborges
developmentspeech-to-textaudio-transcriptionmultilingual

使用 ElevenLabs Scribe v2 模型转录音频文件,支持 90+ 种语言、说话人分离、音频事件检测和字级时间戳。

🚀 使用 ElevenLabs 语音转文字转录音频文件。支持 90+ 种语言自动检测、说话人识别和音频事件标记(笑声、音乐、掌声)。获得精确的字级时间戳,处理所有主要音频格式——mp3、wav、m4a、ogg、webm 等。

💡 适用于会议、播客、语音笔记和采访。自动识别发言人、提取精确时间用于编辑、轻松处理多语言内容。非常适合记者、研究人员、内容创作者和需要快速准确转录的团队。

✨ 内置说话人分离功能自动区分多个声音。带时间戳的 JSON 输出可无缝集成到工作流中,自动语言检测消除设置摩擦。

GitHub

要求

ElevenLabs API Key

具有语音转文字访问权限的 ElevenLabs API 密钥

curl

用于发送 API 请求的命令行工具

jq

用于解析响应的 JSON 查询处理器(可选但推荐)

ElevenLabs 语音转文字 - 音频转录 | OpenClaw Skills | Openclawd hub