✍️ Gate 广场「创作者认证激励计划」进行中!
我们欢迎优质创作者积极创作,申请认证
赢取豪华代币奖池、Gate 精美周边、流量曝光等超 $10,000+ 丰厚奖励!
立即报名 👉 https://www.gate.com/questionnaire/7159
📕 认证申请步骤:
1️⃣ App 首页底部进入【广场】 → 点击右上角头像进入个人主页
2️⃣ 点击头像右下角【申请认证】进入认证页面,等待审核
让优质内容被更多人看到,一起共建创作者社区!
活动详情:https://www.gate.com/announcements/article/47889
谷歌的新“Vantage”平台利用人工智能头像测试批判性思维、协作和实际技能
简要介绍
谷歌推出 Vantage AI 系统,用于开发和评估未来人类技能,包括批判性思维、协作、创造力、冲突解决以及项目管理,随着 AI 的不断进步而发展。
该项目以“Vantage”为名,是一个由 AI 驱动的实验性系统,旨在通过模拟互动环境来支持这些能力的培养与评估。该倡议在教育学方法专家与研究人员的协作下开发,其中包括来自纽约大学的贡献者。其目标是为学生提供一个结构化的沙盒,让他们通过类似应用于数学或科学等核心学科的方法,练习并评估面向未来的技能。该系统目前可通过 Google Labs 以英文形式使用。
该流程通过将用户置于模拟的多智能体环境来实现:用户在开放式场景中与由 AI 生成的虚拟形象互动,例如辩论、协作式问题解决任务,或项目规划练习。在该设置中,协调用的“Executive LLM(执行型 LLM)”会使用预先定义的评估框架来引导互动,并动态调整对话条件。这包括引入分歧、挑战假设,或引导对话方向,以生成与目标技能相关的可观察行为证据。
基于模拟的 AI 框架,用于评估面向未来的技能
与此同时,另一个 AI 评估模型会在任务完成后分析完整的互动过程。它使用相同的结构化评分量表,评估对话记录,并生成详尽的表现画像,将观察到的行为映射到特定的技能类别。输出内容既包括定量评分,也包括定性反馈,把复杂的人际互动转化为结构化、可衡量的技能表现指标。
为确保方法论的可靠性,该系统已与纽约大学合作进行测试,采用包含 188 名参与者(年龄为 18 至 25 岁)的受控研究。此次评估聚焦于与协作相关的能力,例如冲突解决和项目协调。结果显示,与非定向互动模型相比,由自适应 AI 驱动的对话引导能够产生更高密度的可评估技能证据,同时在多个任务中维持连贯且自然的对话流程。
与包括 OpenMic 在内的外部合作伙伴进一步验证后,测试扩展到创意与语言类任务,涵盖多媒体以及基于文学的练习。在这些情况下,AI 生成的评估与专家的人类评分表现出较强的相关性,进一步强化了该系统在超越结构化团队协作情境后,应用到更开放的创意领域的潜在可能性。
此类基于模拟的系统,未来不久有望作为传统评估方法之外的额外评估层,融入教育环境。这将使学生不仅在学科知识方面受到评估,也能在受控的模拟场景中评估其人际交往与认知技能。该研究更广泛的目标,是在规模化层面让面向未来的能力更易衡量,并使教育评估与不断演变的劳动力需求实现更紧密的匹配。