视频 / 音频 AI
FunASR
阿里达摩院开源的工业级语音识别工具包,支持 ASR/VAD/标点恢复/说话人分离
质量分78
0 Stars
unknown
medium
中文速读
FunASR 是阿里巴巴达摩院(ModelScope)开源的端到端语音识别工具包,旨在搭建学术研究与工业应用之间的桥梁。支持语音识别(ASR)、语音活动检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离和多说话人 ASR。提供预训练模型的推理和微调,支持 ModelScope 和 HuggingFace 模型库。有完整的中文文档和教程。
快速试用
暂未发现稳定的 Demo 或视频入口。
适合
- 需要中文语音识别的开发者
- 语音 AI 研究者
- 构建语音交互产品的团队
不适合
- 非语音 AI 领域的开发者
- 需要开箱即用 SaaS 语音 API 的用户
标签
语音识别ASRVAD说话人分离中文语音ModelScope达摩院