視頻游戲是人工智能(AI)系統的重要試驗場。與現實世界一樣,游戲也是豐富的學習環境,具有反應靈敏的實時設置和不斷變化的目標。
從早期與雅達利游戲的合作,到 AlphaStar 系統能夠以人類大師級的水平玩轉《星際爭霸 II》,Google DeepMind 在人工智能和游戲領域有著悠久的歷史。
最近,Google DeepMind 宣布了一個新的里程碑——將重點從單個游戲轉向通用的、可指導游戲的 AI 智能體。
在一份新的技術報告中,Google DeepMind 介紹了 SIMA(Scalable Instructable Multiworld Agent),這是一種適用于 3D 虛擬環境的通才 AI 智能體。Google DeepMind 與游戲開發商合作,在各種視頻游戲中訓練 SIMA。這項研究標志著首次有 AI 智能體證明自己能夠理解各種游戲世界,并像人類一樣按照自然語言指令在游戲世界中執行任務。
這項工作并不是為了獲得高分。對于人工智能系統來說,學會玩哪怕是一款視頻游戲都是一項技術壯舉,但學會在各種游戲環境中聽從指令,可以讓 AI 智能體在任何環境中都能發揮更大的作用。
Google DeepMind 的研究展示了如何通過語言界面將高級人工智能模型的能力轉化為現實世界中有用的行動。他們希望 SIMA 和其他智能體研究能將視頻游戲作為沙盒,以更好地了解人工智能系統如何變得更有幫助。
從電子游戲中學習
為了讓 SIMA 接觸到更多環境,Google DeepMind 與游戲開發商建立了大量合作關系,以開展研究。他們與八家游戲工作室合作,在九款不同的視頻游戲中訓練和測試 SIMA,如 Hello Games 的《無人天空》和 Tuxedo Labs 的《Teardown》。SIMA 產品組合中的每款游戲都為我們打開了一個全新的互動世界,包括一系列需要學習的技能,從簡單的導航和菜單使用,到開采資源、駕駛飛船或制作頭盔。
Google DeepMind 還使用了四個研究環境——包括使用 Unity 構建的一個名為“建筑實驗室”的新環境,在這個實驗室中,智能體需要用積木搭建雕塑,測試他們對物體的操作以及對物理世界的直觀理解。
通過向不同的游戲世界學習,SIMA 捕捉到了語言與游戲行為之間的聯系。第一種方法是在游戲組合中記錄成對的人類玩家,其中一名玩家觀察并指導另一名玩家。他們還讓玩家自由玩游戲,然后重新觀察他們的行為,并記錄下可能導致其游戲行為的指令。
圖|SIMA 由預先訓練好的視覺模型和一個主模型組成,主模型包括一個存儲器,可輸出鍵盤和鼠標操作。
SIMA:多功能AI智能體
SIMA 是一個 AI 智能體,它能夠感知和理解各種環境,然后采取行動實現指令目標。它由一個用于精確圖像語言映射的模型和一個用于預測屏幕上接下來會發生什么的視頻模型組成。Google DeepMind 根據 SIMA 產品組合中特定 3D 設置的訓練數據對這些模型進行了微調。
據介紹,SIMA 不需要訪問游戲的源代碼,也不需要定制的應用程序接口。它只需要兩個輸入:屏幕上的圖像和用戶提供的簡單自然語言指令。SIMA 使用鍵盤和鼠標輸出來控制游戲中心角色執行這些指令。人類使用的就是這種簡單的界面,這意味著 SIMA 可以與任何虛擬環境進行交互。
當前版本的 SIMA 評估了 600 項基本技能,包括導航(如“向左轉”)、物體交互(“爬梯子”)和菜單使用(“打開地圖”)。Google DeepMind 已經對 SIMA 進行了訓練,使其能夠在 10 秒鐘內完成簡單的任務。
Google DeepMind 希望,未來的智能體能夠處理需要高級戰略規劃和多個子任務才能完成的任務,如“尋找資源并建造營地”。這是人工智能的一個重要目標,因為雖然大型語言模型(LLMs)已經產生了強大的系統,可以捕捉有關世界的知識并生成計劃,但它們目前還缺乏代表我們采取行動的能力。
跨游戲歸納
Google DeepMind 發現,接受過多種游戲訓練的智能體要優于只學會玩一種游戲的智能體。在評估中,接受過九款 3D 游戲訓練的 SIMA 智能體的表現明顯優于只接受過單款游戲訓練的所有專業智能體。更重要的是,除了一款游戲外,接受過其他所有游戲訓練的智能體在未見過的游戲中的平均表現幾乎與接受過專門訓練的智能體相同。重要的是,這種在全新環境中發揮作用的能力凸顯了 SIMA 在訓練之外的通用能力。這是一個很有希望的初步結果,但要使 SIMA 在可見和未見游戲中的表現都達到人類水平,還需要更多的研究。
結果還表明,SIMA 的表現依賴于語言。在對照測試中,智能體沒有接受任何語言訓練或指令,它的行為適當但漫無目的。例如,智能體可能會經常收集資源,而不是按照指示行走。
圖|Google DeepMind 對 SIMA 遵循指令完成近 1500 項獨特游戲任務的能力進行了評估,其中部分評估是通過人類評委完成的。作為基準比較,他們使用了環境專用 SIMA 智能體的性能(經過訓練和評估,可在單一環境中遵從指令),并將這種性能與三種通用 SIMA 智能體進行比較,每種智能體都在多個環境中接受過訓練。
推進 AI 智能體研究
Google DeepMind 表示,SIMA 的研究成果表明,他們有潛力開發出新一批通用的、語言驅動的 AI 智能體。這是一項早期研究,他們期待著在 SIMA 的基礎上,在更多的訓練環境中進一步發展,并納入更多能力更強的模型。
隨著 SIMA 在更多訓練環境中的應用,Google DeepMind 希望,它的通用性和多功能性會越來越強。
有了更先進的模型,他們希望能提高 SIMA 對更高級語言指令的理解和執行能力,從而實現更復雜的目標。
最終,Goo gle DeepMind的研究將朝著更通用的人工智能系統和智能體的方向發展,這些系統和智能體能夠理解并安全地執行各種任務,為人們在網上和現實世界中提供幫助。
原文鏈接:
https://deepmind.google/discover/blog/sima-generalist-ai-agent-for-3d-virtual-environments/
下一篇:返回列表
【免責聲明】本文轉載自網絡,與科技網無關。科技網站對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。