评估日志

评估日志存储了 EvaluationAgent 的评估结果。评估日志包含以下信息:

字段 描述 类型
原因 (Reason) 通过观察屏幕截图差异和...,判断的详细原因。. 字符串
子分数 (Sub-score) 将评估分解为多个子目标时的评估子分数。 字典列表
完成 (Complete) 评估的完成状态,可以是 yesnounsure 字符串
level 评估级别。 字符串
请求 (request) 发送给 EvaluationAgent 的请求。 字典
id 评估的 ID。 整数