AI 编程 / MCP
deepeval
LLM 应用评估框架
质量分82
0 Stars
unknown
medium
中文速读
DeepEval 是专门用于评估 LLM 应用质量的测试框架,提供多种评估指标和 Colab demo。
快速试用
暂未发现稳定的 Demo 或视频入口。
适合
- 开发 LLM 应用的团队
- 需要 AI 质量保证的工程师
不适合
- 只需要简单 prompt 测试的用户
标签
LLM评估测试框架AI质量
AI 编程 / MCP
LLM 应用评估框架
DeepEval 是专门用于评估 LLM 应用质量的测试框架,提供多种评估指标和 Colab demo。
暂未发现稳定的 Demo 或视频入口。