返回技能中心

OpenRouter 音频转录
@obviyus
developmentaudio transcriptionspeech-to-textOpenRouter
使用 OpenRouter 的聊天完成 API 和 input_audio 内容类型转录音频文件。支持任何支持音频的模型,包括 Google Gemini 和 OpenAI GPT-4o。自动将音频转换为 WAV 格式,处理 base64 编码,并使用可自定义的提示提取转录文本。
🚀 使用 OpenRouter 的音频模型 将音频文件瞬间转换为文本。只需指向您的音频文件(M4A、OGG、WAV 等),脚本会自动处理格式转换、API 调用和文本提取。支持 OpenRouter 上的任何音频模型。
💡 非常适合转录采访、会议、语音备忘录和播客,无需手动输入。可自定义输出格式(如添加说话人标签)、直接保存到文件,并通过 OpenRouter 仪表板跟踪使用情况。适合内容创作者、研究人员和处理大量音频文件的用户。
✨无需复杂设置——只需设置 API 密钥即可运行。脚本智能处理大文件和格式转换,让您专注于重要工作。