
科技公司 Google 該公司表示,已發布了深度研究代理的大幅升級版本,現在開發者可以透過新的互動 API 存取該代理,並計劃在搜尋、NotebookLM 和 Gemini 應用程式中向消費者開放該代理程式。
開發者首次能夠將Google最先進的自主研究功能直接整合到自己的應用程式中。 Gemini Deep Research 專為擴展資訊收集和綜合任務而設計,其推理系統由 Gemini 3 Pro 提供支持,該模型被譽為Google迄今為止最可靠的模型。它經過訓練,能夠減少幻覺,並提高複雜報告的清晰度和可靠性。透過擴展多步驟強化學習搜尋功能,此智能體能夠以更高的準確率獨立導航複雜的資訊環境。
該代理程式透過產生查詢、審查結果、識別缺失資訊並不斷重複此過程,逐步建立其研究工作流程,直到完成調查為止。新版本對網路搜尋效能進行了重大升級,使其能夠更深入地瀏覽網站,從而提取高度特定的資料。
據Google稱,最新版本在「人類最後的考試」(HLE)和「深度搜尋問答」(DeepSearchQA)測試中均取得了最先進的性能,同時在「瀏覽比較」(BrowseComp)測試中也取得了迄今為止的最佳成績。該版本針對以更低的成本生成高品質的研究報告進行了最佳化,並將很快整合到Google搜尋、NotebookLM、Google財經以及增強版的Gemini應用程式中。
早期測試已經表明,在那些對準確性和詳細上下文理解至關重要的領域,該方法已取得顯著成效。在金融服務領域,各公司已經開始使用此方法。 雙子座深度研究 透過彙總來自公開和專有通路的市場指標、競爭對手洞察和合規性考量,簡化盡職調查的早期階段。這使得該代理商成為投資團隊進行初步工作流程的寶貴工具。
在科學領域,該技術正被應用於複雜的安全相關研究。開發用於預測藥物毒性的人工智慧系統的Axiom Bio公司報告稱,Gemini Deep Research提供的生物醫學文獻初步分析深度和精準度,使其研究和發現過程得以更快推進。
對於建立自動化研究系統的開發者而言,Gemini Deep Research 代理程式提供了強大的功能,可用於綜合資訊並產生詳細、可驗證的報告。它結合了文件上傳和文件搜尋工具,支援對使用者文件(例如 PDF、CSV 和文字文件)以及公共網路資源進行統一分析。
它能有效管理豐富的上下文訊息,使開發人員能夠直接在提示訊息中包含大量背景資料。輸出結構可透過提示資訊進行客製化,從而實現對報告版面、標題和資料呈現方式的完全控制。該系統為聲明提供細粒度的引用,確保資料來源的透明度,並支援結構化輸出(包括 JSON 模式),以便簡化與下游應用程式的整合。
Google開源DeepSearchQA基準測試,以提升多步驟網路搜尋能力
此外,Google宣布開源一項名為 DeepSearchQA 的全新基準測試,旨在評估研究代理處理複雜、多步驟網路查詢的效率。 DeepSearchQA 包含 900 個人工建構的因果鏈任務,涵蓋 17 個學科領域,每一步都建立在前一步的結論之上。此基準測試並非依賴簡單的事實檢索問題,而是衡量代理產生完整且詳盡答案集的能力,從而能夠評估研究的準確性和檢索覆蓋率。
DeepSearchQA 也旨在作為一種診斷工具,用於研究延長推理時間的影響。內部測試表明,當智能體有更多機會運行額外的搜尋和推理循環時,性能會得到提升,谷歌計劃在未來的迭代版本中擴展這一領域。
發布這些基準測試資料旨在鼓勵開發更強大的研究型智能體,並推動相關技術的持續進步。開發者和研究人員可以查看資料集、排行榜和入門級 Colab,還可以查閱隨附技術報告中所述的底層方法。
儘管深度研究領域競爭已經非常激烈,但Google更新後的代理程式引入了顯著的增強功能,進一步提升了現有代理程式的功能。 雙子座 3 個模型。此次發布也標誌著開發者首次能夠將這項技術直接整合到自己的應用程式中,從而顯著提升了第三方產品的研究功能。
免责声明:本文提供的信息不是交易建议。BlockWeeks.com不对根据本文提供的信息所做的任何投资承担责任。我们强烈建议在做出任何投资决策之前进行独立研究或咨询合格的专业人士。