评估日志
评估日志存储了 EvaluationAgent 的评估结果。评估日志包含以下信息:
| 字段 | 描述 | 类型 |
|---|---|---|
| 原因 (Reason) | 通过观察屏幕截图差异和...,判断的详细原因。 |
字符串 |
| 子分数 (Sub-score) | 将评估分解为多个子目标时的评估子分数。 | 字典列表 |
| 完成 (Complete) | 评估的完成状态,可以是 yes、no 或 unsure。 |
字符串 |
| level | 评估级别。 | 字符串 |
| 请求 (request) | 发送给 EvaluationAgent 的请求。 |
字典 |
| id | 评估的 ID。 | 整数 |