10月12日消息,據金融時報報道,埃隆·馬斯克的 xAI 正在努力構建所謂的世界模型,與 Meta 和谷歌等競爭對手一起競相開發能夠導航和設計物理環境的人工智能系統。
這家總部位于舊金山的初創公司今年夏天聘請了英偉達的專家來研發這些下一代人工智能模型,這些模型通過機器人的視頻和數據進行訓練,以了解現實世界。
世界模型可以使人工智能的能力超越以文本訓練的大型語言模型,而大型語言模型是 ChatGPT 和 xAI 的 Grok 等流行人工智能工具的基礎。
兩位知情人士表示,該公司正在構建世界模型,旨在將其應用于游戲領域,從而生成交互式 3D 環境。其中一位知情人士補充說,這些模型還可以應用于機器人的 AI 系統。
xAI聘請了兩位來自 Nvidia 的 AI 研究員 Zeeshan Patel 和 Ethan He,他們在世界模型方面擁有豐富的經驗。Nvidia 憑借其 Omniverse 平臺(該平臺可以創建和運行模擬)在開發這項技術方面處于領先地位。
一些科技集團對世界模型抱有遠大的期望,認為它能夠將人工智能的應用拓展到軟件和計算機以外的領域,例如人形機器人等實體產品。
上個月,英偉達向英國《金融時報》表示,世界模型的潛在市場規模可能幾乎相當于目前的全球經濟規模。
馬斯克在 X 的一篇文章中表示,xAI 將在明年年底之前發布一款“出色的人工智能游戲”,這證實了這位億萬富翁去年設定的目標。
周二,xAI 推出了其最新的圖像和視頻生成模型,據稱該模型進行了“大規模升級”并且可以免費使用。
當前的視頻生成模型,例如 OpenAI 的 Sora,通過預測從訓練數據中學習到的模式來為視頻生成圖像幀。
世界模型將是一個巨大的進步,因為它們將對物理學以及物體如何在不同環境中實時相互作用有因果理解。
該公司正在招聘圖像和視頻生成方面的技術人員加入其“全能團隊”,該團隊“創造超越文本的神奇人工智能體驗,實現對圖像、視頻和音頻等各種模式內容的理解和生成”。
這些職位的薪資從18萬美元到44萬美元不等。該公司還招聘一名“視頻游戲導師”,負責培訓Grok制作視頻游戲,并讓“用戶探索人工智能輔助游戲設計”,時薪為45美元到100美元。
馬斯克效仿了谷歌和 Meta 等其他領先的人工智能實驗室,他們也在研究這些系統。
然而,世界模型仍然是一個巨大的技術挑戰。事實證明,尋找足夠的數據來模擬現實世界并訓練這些模型既困難又昂貴。
開發視頻游戲《博德之門 3》的Larian Studios的發行主管邁克爾·杜斯 (Michael Douse)本周在 X 上表示,人工智能無法解決游戲行業的“大問題”,即“領導力和愿景”。
他補充說,該行業不需要“更多數學制作、心理訓練的游戲循環,而是需要更多人們參與或想要參與的世界的表達”。
xAI、Patel 和他沒有回應置評請求。