返回搜索GitHub

视频 / 音频 AI / Local AI

MiniCPM-o

手机可运行的轻量级多模态模型,支持图像和视频理解

质量分80
0 Stars
unknown
medium

中文速读

MiniCPM-o 是清华大学 OpenBMB 团队开发的端侧多模态大语言模型系列,专注于在手机等资源受限设备上实现高效的图像和视频理解。最新版本 MiniCPM-o 4.5 支持流式视频和音频输入的端到端交互。提供 Hugging Face Demo 和移动端 App。

快速试用

暂未发现稳定的 Demo 或视频入口。

适合

  • 需要在端侧部署多模态模型的开发者
  • 移动端 AI 应用开发
  • 资源受限环境的 AI 部署

不适合

  • 需要最强模型效果的场景(端侧模型能力有限)
  • 纯文本 LLM 需求(有更轻量的选择)

标签

multimodaledge-aimobilevision-languagechinese-model