使用 OpenAI 的 Whisper CLI 工具在本地转录音频文件。支持多种音频格式和语言,可自定义模型大小以平衡速度和准确性。
🚀 Whisper 是一款强大的语音转文字工具,可在您的计算机上本地转录音频文件。只需指定音频文件(MP3、M4A 等),选择输出格式——纯文本、字幕或其他格式。快速、准确,完全离线工作。
💡 适用于将播客、访谈、会议和讲座转换为文本。用于创建可搜索的文稿、为视频生成字幕或将语音内容翻译成不同语言。非常适合研究人员、内容创作者和任何需要快速音频转文字的用户。
✨ 在多个模型大小之间选择,根据需要平衡速度和准确性。模型在首次使用时自动下载,所有处理都在您的机器上进行——无需上传到云端。
用于音频转录的 OpenAI Whisper Python 包