返回搜索GitHub

视频 / 音频 AI / Local AI

SenseVoice

阿里通义实验室的语音基础模型,支持 ASR、语种识别、情感识别和音频事件检测

质量分79
8,125 Stars
2025-12-30T02:36:56Z
unknown
medium

中文速读

SenseVoice 是阿里通义实验室推出的语音基础模型,具备自动语音识别、语种识别、语音情感识别和音频事件检测等多任务能力。支持中文等多种语言,有 HuggingFace Space 可在线试用。

适合

  • 需要多任务语音理解的场景
  • 中文语音识别需求

不适合

  • 只需要单一 ASR 功能的轻量场景

标签

语音识别多模态阿里