site stats
【2000亿次开放学习后,DeepMind的智能体成精了】他们专门给智能体打造了一个包含了数十亿游戏任务的“元宇宙”XLand。一些基于RL的智能体已表现出明显的零样本学习能力 (0-shot),比如使用工具、打拦(ridge-fencing)、“捉迷藏”、找立方体、数数、合作或竞争等。
发布时间:
2
数据加载中
Markdown支持
评论加载中...
您可能感兴趣的: 更多