研究人员打造统一型参考框架,阐述构建大模型游戏智能体的基本模块
- 麻省理工科技评论
- 2024-08-17 15:03:00
【研究人员打造统一型参考框架,阐述构建大模型游戏智能体的基本模块】
以 ChatGPT 为代表的大语言模型,展现出“类人”的文本理解能力和文本推理能力,已被视作是实现通用人工智能 的关键技术。
尽管大语言模型 能够进行类似于人类的认知处理,但是现有的基于大语言模型的智能代理与人类智能存在着明显区别。
具体来说:当前的大语言模型智能体依赖于通过解码和泛化来从预训练数据中获得已有知识,而人类智能则能通过在现实世界中的实践和体验来发现和学习新知识。
受到人类婴儿智力发展过程的启发,学界提出了“具身认知”这一假说。代理智能,是通过观察环境和与其互动而产生的,即智能的产生来源于整合了物理、社会和语言的现实世界。
数字游戏因其复杂性、多样性、可控性、安全性和可重复性,被认为是培养智能代理的理想环境。
从经典的国际象棋和扑克游戏到现代电子游戏,比如 Atari 游戏、星际争霸 II、Minecraft 和 DOTA II,游戏一直在推动着 AI 研究的发展。
传统的基于强化学习的代理模式,是通过行为层面的策略学习,来实现预期奖励的最大化。
而构建基于大语言模型的游戏代理,能够利用认知能力来深入理解游戏玩法,并能与游戏环境进行交互,在形式上更接近于人类智能。
戳链接查看详情:
网页链接
以 ChatGPT 为代表的大语言模型,展现出“类人”的文本理解能力和文本推理能力,已被视作是实现通用人工智能 的关键技术。
尽管大语言模型 能够进行类似于人类的认知处理,但是现有的基于大语言模型的智能代理与人类智能存在着明显区别。
具体来说:当前的大语言模型智能体依赖于通过解码和泛化来从预训练数据中获得已有知识,而人类智能则能通过在现实世界中的实践和体验来发现和学习新知识。
受到人类婴儿智力发展过程的启发,学界提出了“具身认知”这一假说。代理智能,是通过观察环境和与其互动而产生的,即智能的产生来源于整合了物理、社会和语言的现实世界。
数字游戏因其复杂性、多样性、可控性、安全性和可重复性,被认为是培养智能代理的理想环境。
从经典的国际象棋和扑克游戏到现代电子游戏,比如 Atari 游戏、星际争霸 II、Minecraft 和 DOTA II,游戏一直在推动着 AI 研究的发展。
传统的基于强化学习的代理模式,是通过行为层面的策略学习,来实现预期奖励的最大化。
而构建基于大语言模型的游戏代理,能够利用认知能力来深入理解游戏玩法,并能与游戏环境进行交互,在形式上更接近于人类智能。
戳链接查看详情:
