视频 / 音频 AI / Local AI
MiniCPM-o
手机可运行的轻量级多模态模型,支持图像和视频理解
质量分80
0 Stars
unknown
medium
中文速读
MiniCPM-o 是清华大学 OpenBMB 团队开发的端侧多模态大语言模型系列,专注于在手机等资源受限设备上实现高效的图像和视频理解。最新版本 MiniCPM-o 4.5 支持流式视频和音频输入的端到端交互。提供 Hugging Face Demo 和移动端 App。
快速试用
暂未发现稳定的 Demo 或视频入口。
适合
- 需要在端侧部署多模态模型的开发者
- 移动端 AI 应用开发
- 资源受限环境的 AI 部署
不适合
- 需要最强模型效果的场景(端侧模型能力有限)
- 纯文本 LLM 需求(有更轻量的选择)
标签
multimodaledge-aimobilevision-languagechinese-model