测试与评估
示例
这里 是一个客户支持代理的集成测试示例。 这对应于级别 1:单元测试。
推荐阅读
- 您的 AI 产品需要评估
- 创建一个推动业务成果的 LLM 评判者
- RAG 管道评估实用指南(第 1 部 分:检索)
- RAG 管道评估实用指南(第 2 部分:生成)
- 黄金数据集对 LLM 评估有多重要?
- 案例研究:RAG 管道的无参考评估与基于参考的评估
- 如何评估复杂的 GenAI 应用:一种细粒度方法
- 生成合成数据来测试 LLM 应用
备注
更多信息即将推出。
这里 是一个客户支持代理的集成测试示例。 这对应于级别 1:单元测试。
更多信息即将推出。