AI Agent / 工作流自动化
UI-TARS-desktop
字节跳动的多模态 AI Agent,通过视觉理解操控桌面应用
质量分82
0 Stars
unknown
hard
中文速读
UI-TARS 是字节跳动开发的多模态 AI Agent 栈,通过视觉理解 GUI 界面,自动操作桌面应用。适合想探索 GUI Agent 和桌面自动化的开发者。
快速试用
暂未发现稳定的 Demo 或视频入口。
适合
- 研究 GUI Agent 的开发者
- 需要桌面自动化的场景
不适合
- 需要稳定生产自动化的企业(仍在研究中)
- 纯命令行场景
标签
GUI Agent多模态桌面自动化字节跳动