视频 / 音频 AI
whisper
OpenAI 开源语音识别模型,支持多语言转录
质量分85
65,000 Stars
unknown
easy
中文速读
Whisper 是 OpenAI 发布的开源语音识别模型,支持多语言自动检测和转录。可通过 pip install 快速安装,提供 Colab 示例和 PyTorch 集成。适合语音转文字、字幕生成等场景。
适合
- 需要语音转文字的开发者
- 字幕生成需求
不适合
- 需要实时流式语音识别的场景
- 需要超低延迟的应用
标签
语音识别转录多语言OpenAI