返回搜索GitHub

视频 / 音频 AI

whisper

OpenAI 开源语音识别模型,支持多语言转录

质量分85
65,000 Stars
unknown
easy

中文速读

Whisper 是 OpenAI 发布的开源语音识别模型,支持多语言自动检测和转录。可通过 pip install 快速安装,提供 Colab 示例和 PyTorch 集成。适合语音转文字、字幕生成等场景。

适合

  • 需要语音转文字的开发者
  • 字幕生成需求

不适合

  • 需要实时流式语音识别的场景
  • 需要超低延迟的应用

标签

语音识别转录多语言OpenAI