返回搜索GitHub

视频 / 音频 AI / Local AI

speechbrain

基于 PyTorch 的端到端语音处理工具包,支持 ASR、说话人识别等

质量分79
11,528 Stars
2026-05-03T17:30:53Z
unknown
hard

中文速读

SpeechBrain 是基于 PyTorch 的开源语音处理工具包,提供语音识别、说话人识别、语音增强、音频分类等功能。有完整教程和 Colab 示例,适合研究和原型开发。

适合

  • 语音 AI 研究者和学生
  • 需要端到端语音处理管线

不适合

  • 生产环境直接部署
  • 只需要开箱即用 API 的用户

标签

语音处理PyTorch研究