NPC有望自主思考?研究者用25個(gè)智能體創(chuàng)造出一座虛擬小鎮(zhèn)
NPC是游戲中必要的組成部分,相應(yīng)地,玩家也經(jīng)常吐槽NPC們像是復(fù)讀機(jī),只能簡(jiǎn)單重復(fù)固定的對(duì)話或演出,在一些極端狀況下,NPC演出與劇情不匹配甚至?xí)o人帶來(lái)割裂感。
要改變這種情況,以前需要開(kāi)發(fā)者們投入更多時(shí)間、精力,設(shè)計(jì)更復(fù)雜的腳本和更多對(duì)話。盡管隨著技術(shù)發(fā)展,這類(lèi)情況整體來(lái)說(shuō)有所改善,但很難從根源上解決問(wèn)題,哪怕是前段時(shí)間頗受關(guān)注的“AI編劇寫(xiě)作工具”,也僅是幫助編劇從AI生成的對(duì)話和場(chǎng)景中做出選擇,并不能真正賦予NPC自主行動(dòng)和交流的能力。偶爾,我們也會(huì)暢想“當(dāng)玩家不在的時(shí)候,NPC們都會(huì)做些什么”,但我們也知道,那是一種藝術(shù)上的想象,并非真實(shí)。
然而,假如這個(gè)構(gòu)想也能成真,讓虛擬角色擁有思考、記憶等等能力,讓他們像個(gè)活人一樣在虛擬世界里生活、工作、社交,又會(huì)變成什么樣?
(資料圖)
不久前,美國(guó)斯坦福大學(xué)和Google Research的研究者們發(fā)表了一篇相關(guān)論文,很快引起了關(guān)注。按照論文的描述,研究者們?cè)谝粋€(gè)類(lèi)似沙盒游戲的場(chǎng)景中成功構(gòu)建了一個(gè)小鎮(zhèn),小鎮(zhèn)里有25個(gè)生成式智能體(Generative Agent)。在論文附上的Demo中,智能體們能通過(guò)基于ChatGPT 3.5的大型語(yǔ)言模型生成可信的行為,在小鎮(zhèn)中模擬人類(lèi)的生活方式,自主完成基本的日常活動(dòng)和社交,甚至共同參與了一個(gè)情人節(jié)派對(duì)。
研究者給生成式智能體的定義是:他們能對(duì)自己、其他智能體和他們身處的環(huán)境進(jìn)行多樣化的推斷;他們能制訂反映自身特征和經(jīng)驗(yàn)的日常計(jì)劃,執(zhí)行這些計(jì)劃,作出反應(yīng),并在合適的狀況下重整計(jì)劃;在終端用戶(在論文中即為研究者與測(cè)試者)改變他們的環(huán)境或用自然語(yǔ)言下達(dá)命令時(shí)作出反應(yīng)。
25位生成式智能體開(kāi)始了他們的一天
為了方便理解,也更貼近游戲的語(yǔ)境,我們暫時(shí)將這些智能體稱(chēng)為NPC。
論文中提及的小鎮(zhèn)由幾幢功能完備的住房和一些社交場(chǎng)所組成,包括咖啡館、酒吧、學(xué)校、宿舍和房屋。每個(gè)建筑內(nèi)都有相應(yīng)的可互動(dòng)物品,比如爐子、水池、衣柜、書(shū)桌等。
研究者會(huì)賦予每個(gè)NPC一個(gè)基礎(chǔ)人設(shè),他們的日常行為都圍繞這個(gè)基礎(chǔ)人設(shè)進(jìn)行。比如Abigail Chen是一名藝術(shù)家,正在為一個(gè)動(dòng)畫(huà)項(xiàng)目工作,旨在激發(fā)低收入人群的創(chuàng)造力。所以,她除了花大量時(shí)間進(jìn)行動(dòng)畫(huà)制作外,還會(huì)與擅長(zhǎng)寫(xiě)作的另一位NPC討論合作事宜,也會(huì)與其他NPC交流如何更有效地推廣她的理念。除了基礎(chǔ)人設(shè)外,這些對(duì)話和關(guān)系的構(gòu)建均由NPC自主生成。
終端用戶也能用自然語(yǔ)言直接控制小鎮(zhèn)中的場(chǎng)景和人物行為。比如,研究者可以設(shè)定兩位NPC互相愛(ài)慕,并要求另一位NPC舉辦派對(duì)。研究者也可以讓房屋中的某個(gè)用品損壞,觀察NPC的反應(yīng)。
每個(gè)NPC對(duì)當(dāng)天的生活都有自己的規(guī)劃
在論文中,研究者從兩個(gè)方面對(duì)這些NPC的行為進(jìn)行觀察和記錄,并對(duì)這些行為的合理性作出評(píng)估。
第一,評(píng)估他們是否能在獨(dú)自行動(dòng)時(shí)作出可信的行為,比如模擬人類(lèi)每天早上起床做早飯、洗漱、吃飯,然后換衣服出門(mén)的過(guò)程。
第二,評(píng)估他們能否在一定時(shí)間內(nèi)(研究者取用了小鎮(zhèn)中2天的時(shí)間)與周?chē)钠渌鸑PC和環(huán)境進(jìn)行合理交互,甚至彼此合作,構(gòu)建新的關(guān)系。比如,洗手間被占用時(shí)NPC會(huì)在一旁等待,發(fā)現(xiàn)水龍頭漏水時(shí)NPC會(huì)嘗試維修。在對(duì)話當(dāng)中,NPC應(yīng)當(dāng)根據(jù)自己被設(shè)定的基礎(chǔ)人設(shè)對(duì)答,并且記住在此前的對(duì)話、互動(dòng)中獲得過(guò)的信息,在行為上具有連貫性。
其中,保證行為的連貫性這一點(diǎn)比較困難。因?yàn)镹PC并不存在真正的“記憶”,可能會(huì)忘記基礎(chǔ)人設(shè)之外的環(huán)境給自己帶來(lái)的改變。所以,研究者構(gòu)建了一個(gè)“記憶—計(jì)劃—反思”的框架模型。
準(zhǔn)確地搜索和調(diào)取記憶流中的數(shù)據(jù)是件很有技術(shù)含量的事
在這個(gè)模型中,“記憶”指的是NPC在感知到環(huán)境后,會(huì)把環(huán)境特征記錄在記憶流中。在面臨新?tīng)顩r時(shí),NPC會(huì)對(duì)記憶流中的數(shù)據(jù)進(jìn)行檢索,根據(jù)檢索到的結(jié)果進(jìn)行推理,再?zèng)Q定如何反饋。
模型中的“計(jì)劃”是指,NPC會(huì)先把當(dāng)天的大致計(jì)劃(比如起床、上課、完成作業(yè)、睡覺(jué))儲(chǔ)存在記憶流中,再把計(jì)劃分解成各種細(xì)化的行為,以便根據(jù)實(shí)時(shí)狀況調(diào)整計(jì)劃。
“反思”則是一種更高級(jí)的記憶,促使NPC通過(guò)已知數(shù)據(jù)推斷,形成更高級(jí)的思維。用以反思的數(shù)據(jù)不僅可以來(lái)自當(dāng)事NPC自己的觀察,也可以來(lái)自其他NPC的觀察。
具體來(lái)說(shuō)就是,首先,研究者需要讓NPC確定反思的內(nèi)容。舉個(gè)例子,研究者在Demo中用大型語(yǔ)言模型查詢記憶流中的100條最新記錄,其中包含“Klaus Mueller正在閱讀一本關(guān)于城市化的書(shū)”“Klaus Mueller正在與圖書(shū)管理員談?wù)撍难芯宽?xiàng)目”“ 圖書(shū)館的桌子目前沒(méi)人在用”等數(shù)據(jù)。
接下來(lái),NPC需要思考根據(jù)這些信息能問(wèn)出哪些比較高級(jí)的問(wèn)題,比如:“Klaus Mueller對(duì)什么話題充滿熱情?” “Klaus Mueller和Maria Lopez之間的關(guān)系是什么?”最終,NPC也許會(huì)在反思后得出結(jié)論,認(rèn)為Klaus Mueller正在致力于他對(duì)城市化的研究。這相當(dāng)于這名NPC對(duì)Klaus Mueller產(chǎn)生了新的認(rèn)識(shí),今后他們也許會(huì)圍繞這一認(rèn)識(shí)在與Klaus Mueller的交往中作出反應(yīng)。
“反思”能讓NPC通過(guò)已有數(shù)據(jù)得出一些更高級(jí)的結(jié)論
總之,這篇論文和Demo用沙盒地圖和ChatGPT中的語(yǔ)言模型,構(gòu)筑了一個(gè)看起來(lái)像模像樣的虛擬小鎮(zhèn)以及當(dāng)中的虛擬居民。雖然居民的活動(dòng)范圍不大,生成的交互類(lèi)型與事件也比較簡(jiǎn)單,但人們已經(jīng)能通過(guò)它看到虛擬人物自主生活、自主交往的雛形。在Demo中,NPC們的種種反饋都是由基本的尋路移動(dòng)和文字形式給出的,效果還比較簡(jiǎn)陋,但它展示出的可能性顯然難以估量。
按照這個(gè)邏輯發(fā)展下去,我們很難不聯(lián)想到一些科幻片式的問(wèn)題,諸如“創(chuàng)造一個(gè)全部由AI組成的虛擬世界,成熟后與真實(shí)世界對(duì)接”“《失控玩家》或者《西部世界》里的游戲世界會(huì)不會(huì)成真”“這算不算高維生命創(chuàng)造了低維生命”之類(lèi)的——在此之前,其實(shí)已經(jīng)有許多藝術(shù)作品討論過(guò)類(lèi)似的東西了,也沿著這些思路虛構(gòu)和想象了一些情節(jié)和場(chǎng)景,有喜有憂。一旦這樣的想象成為現(xiàn)實(shí),真正的發(fā)展方向目前其實(shí)還很難輕易判斷。
不過(guò),這些應(yīng)用對(duì)游戲開(kāi)發(fā)者和玩家們來(lái)說(shuō)是相當(dāng)熟悉的。這篇論文展示出的前景可以讓未來(lái)的開(kāi)發(fā)者們更加智能、更加真實(shí)地生成游戲中NPC的行為。假如相關(guān)技術(shù)再成熟一些,開(kāi)發(fā)者也許就可以像論文中的研究者一樣,只需要用自然語(yǔ)言輸入一系列設(shè)定,NPC們就能自動(dòng)根據(jù)玩家的行為以及玩家對(duì)周遭環(huán)境的改變作出反饋。
這篇論文發(fā)表后得到了大量的關(guān)注,也許從側(cè)面上說(shuō)明了人們對(duì)這種活生生擺在眼前的虛擬樂(lè)園的贊嘆與驚詫。更何況,論文中使用的是ChatGPT 3.5語(yǔ)言模型,隨著版本迭代更新,未來(lái)還有很大進(jìn)步空間。至少在游戲領(lǐng)域,人們對(duì)更生動(dòng)、更豐富的虛擬角色的交互始終有著旺盛的需求,甚至可以說(shuō)有一種浪漫化的、真情實(shí)感的憧憬——這篇論文中的實(shí)驗(yàn)也許是一個(gè)好的開(kāi)始。
最后附上論文和Demo的具體網(wǎng)址,論文中對(duì)如何實(shí)現(xiàn)這些功能有相當(dāng)詳細(xì)的描述,有興趣的讀者可以進(jìn)一步自行研究。
標(biāo)簽:
- 環(huán)球時(shí)訊:分紅轉(zhuǎn)股對(duì)上市公司有什么影響?分紅轉(zhuǎn)股后自己的股票數(shù)有什么變化?
- 端午假期天津重點(diǎn)商貿(mào)流通企業(yè)銷(xiāo)售超9億元同比增長(zhǎng)38.1%|焦點(diǎn)信息
- 今日觀點(diǎn)!醫(yī)保怎么交費(fèi)?城鄉(xiāng)醫(yī)保怎么交費(fèi)?醫(yī)保忘了交費(fèi)能補(bǔ)交嗎?
- 世界今頭條!無(wú)繩電話輻射大嗎?無(wú)繩電話通話距離是多少米?
- 無(wú)繩電話輻射大嗎?無(wú)繩電話一般在多少米范圍內(nèi)有效?-速看
- 環(huán)球熱消息:突發(fā)!又一名中行高管被查,已退休數(shù)年
- 環(huán)球?qū)崟r(shí):電腦玩dnf沒(méi)有聲音是什么問(wèn)題?dnf進(jìn)游戲沒(méi)聲音怎么辦?
- 股指期貨仿真交易軟件有哪些?股指期貨交易規(guī)則有什么?|焦點(diǎn)熱門(mén)
- 基金凈值為什么會(huì)暴跌?基金的巨額贖回會(huì)有什么影響?
- 股票為什么會(huì)跌破發(fā)行價(jià)?LPR機(jī)制改革對(duì)股市有沒(méi)有影響?|最新消息
- 為什么設(shè)立基金定投止盈點(diǎn) 寶盈新銳靈活混A的綜合分析
- 焦點(diǎn)訊息:一般水庫(kù)搬遷賠多少錢(qián)?國(guó)有劃撥土地是否有拆遷補(bǔ)償?
- 觀天下!科創(chuàng)板解禁時(shí)間是多久 科創(chuàng)板解禁是利空嗎?
- 產(chǎn)品組合縮減策略的方式怎么樣? 產(chǎn)品組合縮減策略的優(yōu)點(diǎn)有什么?
- 熱點(diǎn)在線丨個(gè)人所得稅是交百分之多少?勞務(wù)報(bào)酬個(gè)人所得稅稅率是多少?
- 世界最資訊丨惠氏奶粉屬于什么檔次?惠氏奶粉是國(guó)產(chǎn)還是進(jìn)口?
- 全球熱文:股東退出的主要方式有哪些?股東退出需要什么手續(xù)?
- 信用卡風(fēng)控是什么意思?信用卡風(fēng)控多久可以恢復(fù)?
- 法院裁判網(wǎng)app(法院裁判網(wǎng)官網(wǎng)) 世界最新
- win10系統(tǒng)怎么關(guān)閉軟驅(qū)?華碩bios怎么關(guān)閉軟驅(qū)?
- 存款利息少了怎么回事?為什么現(xiàn)在存款利息越來(lái)越低?
- keynote文字怎么添加火花穿過(guò)的動(dòng)畫(huà)效果?keynote怎么制作放大動(dòng)畫(huà)?
- 股票大單壓盤(pán)是什么意思?大單壓盤(pán)是要漲還是要跌?|全球快播
- 【全球快播報(bào)】紅色痘痘涂什么藥膏?推薦祛痘效果好的產(chǎn)品2023!
- 基金收益的計(jì)算公式是什么?基金當(dāng)天賣(mài)出收益如何算?|世界即時(shí)
- 為什么本科學(xué)校有專(zhuān)科?專(zhuān)科勢(shì)力比較強(qiáng)的大學(xué)有哪些?
- 【新視野】票面利率計(jì)算公式是什么?票面利率怎么算?
- 普通家庭買(mǎi)車(chē)什么價(jià)位合適?普通家庭有必要買(mǎi)20萬(wàn)的車(chē)嗎?-最新消息
- 【速看料】公司退市之后還能重新上市嗎?股票退市我的持倉(cāng)沒(méi)了?
- 家用經(jīng)濟(jì)轎車(chē)有哪些?家用經(jīng)濟(jì)轎車(chē)一般多少錢(qián)?
- 美國(guó)五角大樓“泄密門(mén)”事件發(fā)酵 現(xiàn)實(shí)版“
- 打價(jià)格戰(zhàn)的特斯拉為何突然漲價(jià) 一季度財(cái)報(bào)
- 繼燒烤后淄博代購(gòu)也火了 淄博炒鍋餅小區(qū)團(tuán)
- 給淄博燒烤潑一盆“冷水” 這時(shí)候不來(lái)淄博
- 真是笑不活了!民宿五一為漲價(jià)謊稱(chēng)因嫖娼被
- 90后冒充老中醫(yī)賣(mài)壯陽(yáng)藥賺900萬(wàn) “私人定
- 調(diào)休來(lái)的假期為什么不香了?帶來(lái)生理和心理
- 酒店謊稱(chēng)需要裝修取消游客訂房 對(duì)消費(fèi)者是
- 環(huán)球時(shí)訊:分紅轉(zhuǎn)股對(duì)上市公司有什么影響?
- 端午假期天津重點(diǎn)商貿(mào)流通企業(yè)銷(xiāo)售超9億元
- 今日觀點(diǎn)!醫(yī)保怎么交費(fèi)?城鄉(xiāng)醫(yī)保怎么交費(fèi)
- 世界今頭條!無(wú)繩電話輻射大嗎?無(wú)繩電話通
- 無(wú)繩電話輻射大嗎?無(wú)繩電話一般在多少米范
- 環(huán)球熱消息:突發(fā)!又一名中行高管被查,已
- 環(huán)球?qū)崟r(shí):電腦玩dnf沒(méi)有聲音是什么問(wèn)題?d
- 股指期貨仿真交易軟件有哪些?股指期貨交易
- 基金凈值為什么會(huì)暴跌?基金的巨額贖回會(huì)有
- 股票為什么會(huì)跌破發(fā)行價(jià)?LPR機(jī)制改革對(duì)股
- 為什么設(shè)立基金定投止盈點(diǎn) 寶盈新銳靈活混
- 焦點(diǎn)訊息:一般水庫(kù)搬遷賠多少錢(qián)?國(guó)有劃撥
- 觀天下!科創(chuàng)板解禁時(shí)間是多久
- 產(chǎn)品組合縮減策略的方式怎么樣? 產(chǎn)
- 熱點(diǎn)在線丨個(gè)人所得稅是交百分之多少?勞務(wù)
- 世界最資訊丨惠氏奶粉屬于什么檔次?惠氏奶
- 全球熱文:股東退出的主要方式有哪些?股東
- 信用卡風(fēng)控是什么意思?信用卡風(fēng)控多久可以
- 法院裁判網(wǎng)app(法院裁判網(wǎng)官網(wǎng)) 世界最新
- win10系統(tǒng)怎么關(guān)閉軟驅(qū)?華碩bios怎么關(guān)閉
- 存款利息少了怎么回事?為什么現(xiàn)在存款利息
- keynote文字怎么添加火花穿過(guò)的動(dòng)畫(huà)效果?k
- 股票大單壓盤(pán)是什么意思?大單壓盤(pán)是要漲還
- 【全球快播報(bào)】紅色痘痘涂什么藥膏?推薦祛
- 基金收益的計(jì)算公式是什么?基金當(dāng)天賣(mài)出收
- 為什么本科學(xué)校有專(zhuān)科?專(zhuān)科勢(shì)力比較強(qiáng)的
- 【新視野】票面利率計(jì)算公式是什么?票面利
- 普通家庭買(mǎi)車(chē)什么價(jià)位合適?普通家庭有必要
- 【速看料】公司退市之后還能重新上市嗎?股
- 家用經(jīng)濟(jì)轎車(chē)有哪些?家用經(jīng)濟(jì)轎車(chē)一般多少