评估日志
评估日志存储了 EvaluationAgent
的评估结果。评估日志包含以下信息:
字段 | 描述 | 类型 |
---|---|---|
原因 (Reason) | 通过观察屏幕截图差异和...,判断的详细原因。 |
字符串 |
子分数 (Sub-score) | 将评估分解为多个子目标时的评估子分数。 | 字典列表 |
完成 (Complete) | 评估的完成状态,可以是 yes 、no 或 unsure 。 |
字符串 |
level | 评估级别。 | 字符串 |
请求 (request) | 发送给 EvaluationAgent 的请求。 |
字典 |
id | 评估的 ID。 | 整数 |