谷歌全新「Vantage」平台利用人工智慧化身測試批判性思考、協作能力和實際技能

Mpost • 2026 年 4 月 15 日 03:21 • 资讯 • 阅读 298

科技公司 Google 我們推出了一套旨在培養未來人類技能的人工智慧系統。隨著人工智慧的不斷發展，那些難以自動化的所謂「持久軟技能」正變得越來越重要。這些技能包括批判性思考、協作能力、創造性思考、衝突解決能力、專案管理能力以及其他人際溝通能力。

這項名為「Vantage」的人工智慧實驗系統旨在透過模擬互動環境來支持這些能力的培養和評估。該計畫由教育學專家和研究人員（包括紐約大學的貢獻者）合作開發，旨在為學生提供一個結構化的沙盒環境，讓他們能夠運用類似於數學或科學等核心學科的方法練習和評估面向未來的技能。該系統目前已透過Google Labs提供英文版本。

這個流程的工作原理是將使用者置於模擬的多智能體環境中，讓他們在開放式場景（例如辯論、協作解決問題或專案規劃練習）中與人工智慧生成的虛擬化身進行互動。在此設定中，協調的“執行LLM”使用預先defi需要藉助評估框架來引導互動並動態調整對話情境。這包括引入分歧、挑戰假設或引導對話方向，以便產生與目標技能相關的可觀察行為證據。

基於模擬的AI框架用於評估面向未來的技能

同時，一個獨立的AI評估模型會在任務完成後分析完整的互動過程。該模型使用相同的結構化評分標準，評估對話記錄，並產生詳細的績效概況，將觀察到的行為映射到特定的技能類別。輸出結果包括定量評分和定性回饋，將複雜的人際互動轉化為結構化且可衡量的技能績效指標。

為了確保方法論的可靠性，該系統與紐約大學合作，並通過一項包含188名年齡在18至25歲之間的參與者的對照研究進行了測試。這些評估著重於與協作相關的能力，例如衝突解決和專案協調。結果表明，與非定向互動模型相比，自適應人工智慧驅動的對話引導能夠產生更高密度的可評估技能證據，同時在多個任務中保持連貫自然的對話流程。

進一步的測試將人工智慧產生的評分與使用相同教學評分標準的人類專家評估進行了比較。結果表明，人工智慧評估者與人類評分者之間的一致性水平與人類之間的一致性水平相當。這表明，在結構化的評估環境中，自動化系統可以達到接近專家層級的一致性。

與包括 OpenMic 在內的外部合作夥伴進行的額外驗證，將測試範圍擴展到涉及多媒體和文學練習的創意和語言類任務。在這些案例中，人工智慧產生的評估結果與專家評分高度相關，這進一步證實了該系統除了結構化的團隊合作場景外，還可用於更開放的創意領域。

在不久的將來，此類基於模擬的系統可以作為傳統評估方法之外的補充評估層，融入教育環境中。這將使學生不僅能夠評估其學科知識，還能在可控的模擬環境中評估其應用人際互動和認知技能。該研究的更廣泛目標是使面向未來的能力更容易大規模衡量，並使教育評估更緊密地與不斷變化的勞動力需求相匹配。

Source link

免责声明：本文提供的信息不是交易建议。BlockWeeks.com不对根据本文提供的信息所做的任何投资承担责任。我们强烈建议在做出任何投资决策之前进行独立研究或咨询合格的专业人士。

谷歌全新「Vantage」平台利用人工智慧化身測試批判性思考、協作能力和實際技能

基於模擬的AI框架用於評估面向未來的技能

相关推荐

发表回复