返回搜索GitHub

AI 编程 / MCP

deepeval

LLM 应用评估框架

质量分82
0 Stars
unknown
medium

中文速读

DeepEval 是专门用于评估 LLM 应用质量的测试框架,提供多种评估指标和 Colab demo。

快速试用

暂未发现稳定的 Demo 或视频入口。

适合

  • 开发 LLM 应用的团队
  • 需要 AI 质量保证的工程师

不适合

  • 只需要简单 prompt 测试的用户

标签

LLM评估测试框架AI质量