《宝可梦红》成为 LLM 测智新指标?

前天在 Anthropic 的最新发布中,我注意到 Claude Sonnet 3.7 展示了其在 Pokémon 领域的独到之处——竟能运用 Extend Thinking 模式玩《宝可梦红》!这一发现让我好奇心顿起,迫不及待地想与大家分享我的观察。据悉,昨晚官方推特发布了预告,而今天则在 Twitch 平台开启了直播。从直播内容来看,该 AI 首先会捕捉游戏画面,并在画面上进行“标注”,比如指出哪些区域可通行、哪些地方藏有宝可梦等。随后,它还结合了游戏内存中的数据,迅速解析出主角的位置、宝可梦的状态,甚至连地图布局也能清晰呈现。举例来说,当屏幕上出现一片草丛时,它不仅能判断出哪些路径可走,还能从内存中读取主角的精确位置及对方宝可梦的 HP ,就像一个初入游戏的新手玩家。更令人叹服的是,这一切操作均是实时完成的,仿佛它正在“思考”下一步该如何行动。看着它如此娴熟地应对未知环境,我不禁思索:究竟是哪种技术能使 AI 如此完美地融合视觉信息与数据处理?它甚至能够在从未涉足的地图上自主摸索前进,实在令人震撼。想亲眼见证这一切的朋友,可以点击 Twitch 直播入口: https://www.twitch.tv/claudeplayspokemon 。坦白说,尽管描述中提到部分内容是通过预先录入游戏攻略数据实现的,但看到 LLM 能如此“玩转”《宝可梦红》,我相信它在应对未知环境方面的适应能力,未来甚至可能超过许多人类玩家,实现边探索边更新自身知识库的突破。