日前,谷歌旗下AI研究團(tuán)隊(duì)DeepMind發(fā)布了一款名為GameNGen的AI游戲引擎。據(jù)悉,這也是首個(gè)完全由神經(jīng)網(wǎng)絡(luò)模型驅(qū)動(dòng)的游戲引擎,能夠?qū)崟r(shí)生成游戲畫面、并且每一幀都由擴(kuò)散模型預(yù)測(cè)。
據(jù)DeepMind方面透露,GameNGen能夠根據(jù)玩家操作和環(huán)境的交互,在單個(gè)TPU上以每九游娛樂(lè)-官網(wǎng)app秒超過(guò)20幀的速度實(shí)時(shí)預(yù)測(cè)、生成高質(zhì)量且復(fù)雜的游戲畫面。以經(jīng)典射擊游戲《毀滅戰(zhàn)士(DOOM)》為例,GameNGen所生成的畫面質(zhì)量與真實(shí)游戲非常接近,并且完全不需要游戲引擎的常規(guī)組件,其下一幀預(yù)測(cè)的峰值信噪比(PSNR)為29.4、可與有損JPEG壓縮相當(dāng)。
據(jù)悉,GameNGen的訓(xùn)練分為2個(gè)階段,即首先通過(guò)一個(gè)RL-agent(強(qiáng)化學(xué)習(xí))代碼學(xué)習(xí)如何玩游戲、并記錄訓(xùn)練過(guò)程中的動(dòng)作和結(jié)果。再通過(guò)訓(xùn)練一個(gè)小型的擴(kuò)散模型(如Stable Diffusion 九游娛樂(lè)-官網(wǎng)appv1.4)、以過(guò)去幀和動(dòng)作序列為條件來(lái)生成下一幀。隨后在訓(xùn)練過(guò)程中向上下幀添加高斯噪聲,從而使得模型能夠在長(zhǎng)時(shí)間生成過(guò)程中保持視覺(jué)穩(wěn)定性。
對(duì)此有觀點(diǎn)認(rèn)為,除了節(jié)省成本和時(shí)間之外,AI驅(qū)動(dòng)的游戲引擎可能會(huì)促生全新的游戲類型,其中的環(huán)境、敘事和游戲機(jī)制會(huì)根據(jù)玩家的行為動(dòng)態(tài)發(fā)展,這一創(chuàng)新可能會(huì)重塑游戲市場(chǎng)的格局,從而使得該行業(yè)從“以大片為核心”的模式、轉(zhuǎn)向更加多樣化的生態(tài)。
但同時(shí)也有業(yè)內(nèi)人士表示,當(dāng)前的GameNGen是針對(duì)特定游戲(即DOOM)量身定制,開(kāi)發(fā)能夠運(yùn)行多個(gè)游戲、更通用的AI游戲引擎可能仍然需要更強(qiáng)大的算力做支撐持。
此外,英偉達(dá)高級(jí)科學(xué)家Jim Fan也指出了GameNGen存在的一些限制,例如“在單個(gè)游戲上過(guò)擬合到了極致”、“無(wú)法想象新場(chǎng)景,無(wú)法合成新的游戲或交互機(jī)制”,以及“無(wú)法實(shí)現(xiàn)用提示詞創(chuàng)作可玩世界,或用世界模型訓(xùn)練更好的具身AI”等。
但Jim Fan也補(bǔ)充到,“不管怎么說(shuō),GameNGen仍是一個(gè)非常出色的概念驗(yàn)證。至少我們現(xiàn)在知道,9億幀是將高分辨率DOOM壓縮到神經(jīng)網(wǎng)絡(luò)中的上限”。