返回搜索GitHub

视频 / 音频 AI

FunASR

阿里达摩院开源的工业级语音识别工具包,支持 ASR/VAD/标点恢复/说话人分离

质量分78
0 Stars
unknown
medium

中文速读

FunASR 是阿里巴巴达摩院(ModelScope)开源的端到端语音识别工具包,旨在搭建学术研究与工业应用之间的桥梁。支持语音识别(ASR)、语音活动检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离和多说话人 ASR。提供预训练模型的推理和微调,支持 ModelScope 和 HuggingFace 模型库。有完整的中文文档和教程。

快速试用

暂未发现稳定的 Demo 或视频入口。

适合

  • 需要中文语音识别的开发者
  • 语音 AI 研究者
  • 构建语音交互产品的团队

不适合

  • 非语音 AI 领域的开发者
  • 需要开箱即用 SaaS 语音 API 的用户

标签

语音识别ASRVAD说话人分离中文语音ModelScope达摩院