视频 / 音频 AI / Local AI
speechbrain
基于 PyTorch 的端到端语音处理工具包,支持 ASR、说话人识别等
质量分79
11,528 Stars
2026-05-03T17:30:53Z
unknown
hard
中文速读
SpeechBrain 是基于 PyTorch 的开源语音处理工具包,提供语音识别、说话人识别、语音增强、音频分类等功能。有完整教程和 Colab 示例,适合研究和原型开发。
适合
- 语音 AI 研究者和学生
- 需要端到端语音处理管线
不适合
- 生产环境直接部署
- 只需要开箱即用 API 的用户
标签
语音处理PyTorch研究