有人做出来靠GPT模型来驱动的游戏NPC群体

泰坦失足 · 发表于 2023-4-11 10:47

来源:https://weibo.com/1644684112/4889146302139095
实时 demo（你可以看到每个人正在干啥和聊什么）：reverie.herokuapp.com/arXiv_Demo/
论文摘要：
可信的人类行为智能体能够赋能从沉浸式环境到人际交流排练空间再到原型工具的交互式应用。在本文中，我们介绍了模拟可信人类行为的生成式智能体。他们会起床，做早餐，然后去上班；艺术家会画画，作家会写作；他们形成观点，注意到彼此，发起对话；他们记得过去的日子，并在计划下一天时进行反思。为了实现生成式智能体，我们描述了一种体系结构，该体系结构扩展了一个大型语言模型，以自然语言存储智能体的全部经验记录，随着时间的推移将这些记忆合成为更高级别的反思，并动态地检索它们以计划行为。我们使用自然语言实例化生成式智能体，填充了受《模拟人生》启发的交互式沙盒环境，最终用户可以使用自然语言与25个智能体的小镇进行交互。在评估中，这些生成式智能体产生了可信的个体和紧急社交行为：例如，仅从单个用户指定的一个智能体想要举办情人节派对的概念开始，智能体自主地在接下来的两天内向派对散发邀请，结交新朋友，相互邀请参加派对，并协调好在正确时间一起出现在派对上。我们通过消融实验证明了我们的智能体体系结构——观察、规划和反思的组成部分——对智能体行为的可信度均起到了至关重要的作用。通过将大型语言模型与计算机交互智能体融合在一起，这项工作介绍了实现可信人类行为模拟的体系结构和交互模式。
好长的paper, 大体上还是力大砖飞, GPT3.5/4.0体现出的逻辑推理能力不亚于传统基于算法的推理方式, 甚至更强更具有通用性
比如下面这个全是靠GPT生成的:
【代理人摘要】时间为2023年2月13日下午4:56。
John Lin的状态：John下班很早就回家了。
观察：约翰看到艾迪在他的工作场所附近散步。
约翰记忆中的相关上下文摘要：
Eddy Lin是John Lin的儿子。Eddy Lin一直在为他的班级创作音乐作品。Eddy Lin在思考或听音乐时喜欢在花园里散步。
约翰应该对观察结果做出反应吗？如果是，什么是合适的反应？
【代理人摘要】时间为2023年2月13日下午4:56。
John Lin的状态：John下班很早就回家了。
观察：约翰看到艾迪在他的工作场所附近散步。
约翰记忆中的相关上下文摘要：
Eddy Lin是John Lin的儿子。Eddy Lin一直在为他的班级创作音乐作品。Eddy Lin在思考或听音乐时喜欢在花园里散步。
约翰正在向艾迪询问他的音乐创作项目。他会对艾迪说什么？
他的结果是：“嘿，艾迪，你班的音乐创作项目进展如何？”从艾迪的角度来看，约翰发起对话被视为他可能想做出反应的事件。因此，正如约翰所做的那样，艾迪检索并总结了他与约翰关系的记忆，以及他可能与约翰在对话中最后一句话有关的记忆。如果他决定回应，我们会使用他总结的记忆和当前的对话历史生成Eddy的话语：
【代理人摘要】时间为2023年2月13日下午4:56。
Eddy Lin的状态：Eddy正在他的工作场所散步。
观察：约翰正在与艾迪开始对话。
Eddy记忆中的相关上下文摘要：
Jonn Lin是Eddy Lin的父亲。John Lin很关心并有兴趣进一步了解Eddy Lin的学业。John Lin知道Eddy Lin正在创作一首音乐作品。
以下是对话历史：
约翰：嘿，艾迪，你们班的音乐创作项目进展如何？
艾迪会如何回应约翰？
这引起了Eddy的回应：“嘿，爸爸，一切都很顺利。我一直在花园里散步，以清醒头脑，让自己振作起来。”这段对话的继续是使用相同的机制产生的，直到两名代理人中的一人决定结束对话。

Eddy Lin的卧室：桌子），里面有Mei和John Lin的房间、Eddy Lin的卧室、公共休息室、厨房、浴室和花园。
Eddy Lin知道以下地区：林家的房子、Johnson Park、Harvey Oak Supply Store、the Willows Market and Pharmacy、Hobbs Cafe、the Rose and Crown Pub。
*如果可以在当前区域进行活动，则更愿意留在该区域。
Eddy Lin计划在他的工作空间里散散步。Eddy Lin应该去哪个地区？
这输出了林家的房子。然后，我们递归地使用相同的过程来确定所选区域内最合适的子区域，直到我们到达代理的环境树的叶节点。在上面的例子中，这个遍历的结果是林家的房子：花园：房子花园。最后，我们使用传统的游戏路径算法来动画代理的移动，使其移动到叶节点指示的位置。
当代理对对象执行操作时，我们会提示语言模型询问对象的状态会发生什么。例如，如果Isabella的生成代理输出“为顾客制作意式浓缩咖啡”的动作，则对语言模型的查询会指示Hobbs Cafe咖啡机的状态应该从“关闭”变为“冲泡咖啡”。

weiduopla · 发表于 2023-4-11 11:22

AI确实带来了更多的可能性，不过要应用到游戏上还需要一些时间。

Lunamos · 发表于 2023-4-11 11:27

本帖最后由 Lunamos 于 2023-4-11 12:33 编辑

前几天也看到了，这篇质量挺高的，属于正经定义了用LLM指导Generative Agents的整个Architecture。
研究者做了一个小游戏场景SmallVille（类似一个星露谷的村镇）放进了25个NPC在沙盒里运行演示效果，游戏中每个NPC都由语言模型支配，会有自己的合理行为，并根据当前环境和他所做的事，通过LLM生成合理的对话。NPC互相之间也会形成各种互动并记录各自的历史。比如NPC在酒馆听到村长选举的近况，会记住并回家和家人在饭桌上聊天提到。而另一个NPC第二天遇到那位家人时也会听到这些传闻，并且会互相表达支持或反对意见。
论文对NPC的记忆系统的设计大体想法也是NPC对世界的观察和知识作为prompts或前置网络做定义，并指导自己之后的行为和言谈举止。每次做决定前会进行信息获取，从记忆中选择相关的片段输入语言模型以组织当下的行为。论文里举例说明了很多有意思的实现。至少SIMS、沙盒这种天然生成叙事的游戏中Generative Agents效果比脚本好太多，应该也是基于AI的NPC最先会应用的地方。之后可预见的也是一定可以应用在RPG里。

whzfjd · 发表于 2023-4-11 11:32

提示: 作者被禁止或删除内容自动屏蔽

Rary · 发表于 2023-4-11 11:35

玩了下demo，感觉npc间的对话就很npc，所有人感觉都是一个模子刻出来的。
以后是否可以训练各种有差异的语言模型，然后一个npc用一个模型，来增加npc的个性？

泰坦失足 · 发表于 2023-4-11 11:46

Rary 发表于 2023-4-11 11:35
玩了下demo，感觉npc间的对话就很npc，所有人感觉都是一个模子刻出来的。
以后是否可以训练各种有差异的语 ...

在现有模型里最后加一个风格转换, 或者单独用一个模型来转换语言风格都行吧. 现在Chatgpt也能用猫娘风格正常交流. 就是说多了感觉来来回回就那几种变化. 要是熟读钉宫作品估计就能微调出一个傲娇AI了

4790d · 发表于 2023-4-11 13:35

语言风格挺难让机器设定的，首先肯定与人的经历有关，经历和天性会产生各种偏好

知识面高低和偏好会影响人的对话多少以及回答的扣题程度

然后就是所处环境会让人习惯用自身环境的常用语

语言使用频率会影响表达技能，也会决定对话时的质量

单独开语言模型好像不太合适

—— 来自 HUAWEI NOH-AN00, Android 12上的 S1Next-鹅版 v2.5.4

勿徊哉 · 发表于 2023-4-11 13:41

会有ai突发奇想弄死别的ai吗？

UILA · 发表于 2023-4-11 14:06

勿徊哉发表于 2023-4-11 13:41
会有ai突发奇想弄死别的ai吗？

弄死ai不知道，我跟new bing聊天的时候巨魔它就经常让我去死，然后字打到一半被捂嘴

白左 · 发表于 2023-4-11 15:39

提示: 作者被禁止或删除内容自动屏蔽

perfaceNext · 发表于 2023-4-11 15:42

白左发表于 2023-4-11 15:39
模拟人生5配置需求：RTX5090ti 32GB / 内存：256GB

ea如果在做这个不知道会不会重新做

白左 · 发表于 2023-4-11 16:49

提示: 作者被禁止或删除内容自动屏蔽

harry3 · 发表于 2023-4-11 16:55

4790d 发表于 2023-4-11 13:35
语言风格挺难让机器设定的，首先肯定与人的经历有关，经历和天性会产生各种偏好

知识面高低和偏好会影响人 ...

实际上大模型轻轻松松就学完了，characterAI上那么多角色你提供几百字样本，语言风格就拿捏了

windtrack_qh · 发表于 2023-4-11 16:57

生成事件对话可能问题不大，但是这种状态下怕是LOG数据用不了多久就要爆炸....

Pettabuz · 发表于 2023-4-11 16:58

本帖最后由 Pettabuz 于 2023-4-11 16:59 编辑

看了下论文，感觉主要的创新点是设计了短期记忆、反思、规划三部分综合考虑行动，其他全部交给LLM

不过这成本属实有点高，感觉适合网游场景

元宇宙.jpg

Addition- ally, efforts can be made to improve the architecture’s performance, making it more cost-effective. The present study required substan- tial time and resources to simulate 25 agents for two days, costing thousands of dollars in token credit and taking multiple days to com- plete.

—— 来自 motorola XT2301-5, Android 13上的 S1Next-鹅版 v2.5.2-play

Tring · 发表于 2023-4-11 17:00

本帖最后由 Tring 于 2023-4-11 17:02 编辑

其实AI技术研究和其他技术有一个关键区别，只有唯一一个驱动力是最重要的，就是钱，其他的因素都没多重要。
AI在其他领域的商业应用价值逐渐被开发出来，投入资金越来越多，进展也自然越来越快。

但是游戏应用AI这部分，最关键的不是技术门槛，应该说其实不存在什么技术门槛，
关键是没有开发出直接将AI技术转化成钱的商业模式。
一旦有这种模式，资金大量注入后，必然技术也会突飞猛进。

游戏领域的技术研究一直最尴尬的就是这：
最尖端的技术并不能转化成最多的钱，
反而还常有劣币驱逐良币之势。

不过AI画图搞崩手游氪金市场的未来倒是清晰可见了。
看看手游泡沫崩溃后，会不会让传统游戏得到更多资金注入吧。

绕指流光 · 发表于 2023-4-11 17:02

4790d 发表于 2023-4-11 13:35
语言风格挺难让机器设定的，首先肯定与人的经历有关，经历和天性会产生各种偏好

知识面高低和偏好会影响人 ...

这个其实并非障碍，不要用人类的思维考虑复杂度，现在是力大砖飞的时代

对于LLM来说就是fine-tune，你可以尝试找一个字数比较多的人物小传喂给GPT-4，并投喂一些编写好的场景对话语料，然后再让GPT-4扮演这个角色，效果一般都能超出预期。

T2I现在满天飞的CKPT和LORA，关键因素就是训练成本低到消费级硬件也可以搞了
T2T也现在正在这条路上前进，针对T2T的LORA将来一定是门槛更低，也更有趣

Kazuhira · 发表于 2023-4-11 17:14

本帖最后由 Kazuhira 于 2023-4-11 17:18 编辑

挺好的，说起来这样性能开支有多大呀，是不是先用在线上游戏里比较好

我早些时候觉得适合Roguelike，不考虑配置要求的话

4790d · 发表于 2023-4-11 17:44

绕指流光发表于 2023-4-11 17:02
这个其实并非障碍，不要用人类的思维考虑复杂度，现在是力大砖飞的时代

对于LLM来说就是fine-tune，你可 ...

chatgpt不是万能的吧，我自己用过，感觉它在科学问题和政治倾向有所限制，但是具体场景中这些限制也会影响到角色扮演的质量

—— 来自 HUAWEI NOH-AN00, Android 12上的 S1Next-鹅版 v2.5.4

Kairos · 发表于 2023-4-11 18:12

提示: 作者被禁止或删除内容自动屏蔽

deadpeople · 发表于 2023-4-11 22:52

我现在倒是不担心实现的技术难度，而是硬盘的容量够不够NPC不断增加的可供调用的记忆数据消耗

asergh0630rx · 发表于 2023-4-11 23:00

提示: 作者被禁止或删除内容自动屏蔽

StaticAnalysis · 发表于 2023-4-12 04:12

能用AI来节省剧本作家的时间，多制作几个对话的选项和branch就挺好的了

大主教伊瑞尔 · 发表于 2023-4-12 05:03

没看文章，好奇npc是怎么个observe法

例如"B对C在场景x说了一句话"和"D在门口花园前呆了10分钟"之类的事件会被观察到和记忆下来吗，或者说这种组合相对复杂的事件，npc有能力抽象成一个instance吗

血河之舞 · 发表于 2023-4-12 05:40

提示: 作者被禁止或删除内容自动屏蔽

大哀之君 · 发表于 2023-4-12 06:29

比较切合实际的用法应当是预生成一组特别健壮的对话树/互动树并且在网状叙事类RPG的制作过程中节约劳动力。至于抠字儿跟NPC交流我觉得没必要，游戏设计终究还是要把玩家圈定在一个范围内，不能做成一个发散结构

bobosnader · 发表于 2023-4-12 06:32

提示: 作者被禁止或删除内容自动屏蔽

泰坦失足 · 发表于 2023-4-12 08:45

大主教伊瑞尔发表于 2023-4-12 05:03
没看文章，好奇npc是怎么个observe法

例如"B对C在场景x说了一句话"和"D在门口花园前呆了10分钟"之类的事件 ...

每个NPC自带一个小本子记下了它的个性经历, 长期记忆和短期记忆还有每日的经历. 每天还会把当天经历精炼后更新小本子. 本质上还是用GPT强大的任务能力完成

Racyjackman · 发表于 2023-4-12 09:00

感觉矮人要塞已经实现了这部分功能了，不过可能没有GPT这样灵活，但矮人的行为确实是由自己的性格，短期记忆和长期记忆驱动的

PigMourne · 发表于 2023-4-12 09:57

本帖最后由 PigMourne 于 2023-4-12 10:00 编辑

前几年大伙好歹还假模假式的在炼丹过程上玩trick，现在直接靠大模型力大砖飞了，实在是没什么意思。在输入和输出上搞一些trick喂进去，模型本身摆烂，用资本家重金砸出来的成品完事

之前AI Dungoen也差不多是通过玩prompts输入达成效果，只不过生的太早只能用gpt2和3。相比起来这篇站在大模型福利之上，用更长更复杂的prompts、更好的丹炉、还搓了一个像素风demo，确实没有什么更新的理念。

何况The Sim或者矮人要塞好玩的地方根本也不是npc的智力有多高多自由，可控的脚本足够达成设计目的了。就像一个随你行动句句回复但根本讲不出完整故事的DM和一个按模组开团但能把故事讲清楚的老实DM一样，卷人们做出的智能npc能否比这些脚本老东西更好玩，我表示悲观

猫坤 · 发表于 2023-4-12 10:09

与其塞一堆垃圾数据进自己硬盘就为了让NPC变着花样说今天您吃了没之类的废话，还不如直接让它复读山的那边有恶龙快去干死他

大主教伊瑞尔 · 发表于 2023-4-12 10:27

泰坦失足发表于 2023-4-12 08:45
每个NPC自带一个小本子记下了它的个性经历, 长期记忆和短期记忆还有每日的经历. 每天还会把当天经历精炼 ...

因为各种信息的自由组合都可以说是一种经历，所以每个npc的经历其实是无限多的，必须要有选择地保留记忆，我好奇npc是怎么决定一件事是否值得记下来的

好好做人 · 发表于 2023-4-12 12:24

可能对模拟类的有质的飞跃

rpg估计影响很小关键剧情和高级道具不太可能给他们不然有可能卡关/拿不到关键道具
对于送垃圾的npc玩家也没什么交流的兴趣
看看有没有什么公司能给出惊喜吧

oyss · 发表于 2023-4-12 13:37

whzfjd 发表于 2023-4-11 11:32
以后要是依赖 LLM 的话游戏基本只有订阅化这一条路了，AI 功能基本要靠云端算力。 ...

也不需要给每个玩家都有活的AI.

开发生成一份对话互动量超大的文本放游戏里已经比现在的一个NPC只有三两句台词要强很多了.

drx66 · 发表于 2023-4-12 14:20

确实，先从简单的开始
比如生化4RE，里昂和碍事梨的互动对话整挺好。
但重复的台词有点多了。
打人时的台词就那几句。
中后期都听着没新鲜感了
如果能做到一周目的互动的台词几乎不重样，那体验会更上一层

karastar · 发表于 2023-4-12 14:24

互动对话少纯粹就是不值得投入罢了，多几句对话你会多花钱嘛

valand · 发表于 2023-4-12 15:03

因为AI这波行情，大癌股的游戏板块都起飞了

火的意志 · 发表于 2023-4-12 15:36

提示: 作者被禁止或删除内容自动屏蔽

游蜓 · 发表于 2023-4-12 15:39

4790d 发表于 2023-4-11 13:35
语言风格挺难让机器设定的，首先肯定与人的经历有关，经历和天性会产生各种偏好

知识面高低和偏好会影响人 ...

以后让策划或者脚本专门去训练npc对话模型

AeonsTorn · 发表于 2023-4-12 15:40

提示: 作者被禁止或删除内容自动屏蔽

		自动登录	找回密码
密码			立即注册

[新闻] 有人做出来靠GPT模型来驱动的游戏NPC群体

本帖子中包含更多资源

评分

whzfjd whzfjd 当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2021-1-7 头像被屏蔽	发表于 2023-4-11 11:32 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

白左白左当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2011-4-4 头像被屏蔽	发表于 2023-4-11 15:39 来自手机 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

白左白左当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2011-4-4 头像被屏蔽	发表于 2023-4-11 16:49 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

Kairos Kairos 当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2023-3-16 头像被屏蔽	发表于 2023-4-11 18:12 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

asergh0630rx asergh0630rx 当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2016-3-3 头像被屏蔽	发表于 2023-4-11 23:00 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

血河之舞血河之舞当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2022-7-14 头像被屏蔽	发表于 2023-4-12 05:40 来自手机 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

bobosnader bobosnader 当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2007-6-21 头像被屏蔽	发表于 2023-4-12 06:32 来自手机 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

火的意志火的意志当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2017-7-29 头像被屏蔽	发表于 2023-4-12 15:36 来自手机 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

AeonsTorn AeonsTorn 当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2017-10-12 头像被屏蔽	发表于 2023-4-12 15:40 来自手机 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报