返回搜索GitHub

AI Agent / 工作流自动化

UI-TARS-desktop

字节跳动的多模态 AI Agent,通过视觉理解操控桌面应用

质量分82
0 Stars
unknown
hard

中文速读

UI-TARS 是字节跳动开发的多模态 AI Agent 栈,通过视觉理解 GUI 界面,自动操作桌面应用。适合想探索 GUI Agent 和桌面自动化的开发者。

快速试用

暂未发现稳定的 Demo 或视频入口。

适合

  • 研究 GUI Agent 的开发者
  • 需要桌面自动化的场景

不适合

  • 需要稳定生产自动化的企业(仍在研究中)
  • 纯命令行场景

标签

GUI Agent多模态桌面自动化字节跳动