首个AI冠军:Gemini2.5Pro大模型直播通关《宝可梦蓝》

在刚刚的一场直播中,知名游戏主播Gemini 2.5 Pro成功通关《宝可梦蓝》这款游戏,这一举动引起了广大网友的热烈讨论。谷歌CEO第一时间兴奋官宣,放出通关时刻珍贵影像。相较于一年前只能勉强走到常磐森林的旧模Claude 3.5,Gemini 2.5 Pro的通关表现无疑让人眼前一亮。 大模型的进步让这一成就更显得意义非凡,它不仅让Gemini的自我介绍增添了一条新内容,也引发了网友们的一片赞叹。然而,通关过程看似有些无聊,因为每一步都需要Gemini深思熟虑,这背后显示了大模型对宝可梦游戏的深入理解。 在直播中,Gemini的主要目标是探索华蓝洞穴,寻找和捕获超梦。在完成了一长串行动,到达目标位置之后,Gemini足足思考了40多秒才开启下一步的行动规划。虽然有些迷路,但这些思考过程展示了模型如何理解宝可梦游戏。总结起来,Gemini玩宝可梦的基本步骤包括:截取屏幕截图并检索游戏状态数据、将屏幕截图和游戏信息发送给模型、AI决定是直接响应还是调用专门的智能体、解析响应内容以确定按下哪个按钮、执行按钮按下操作并等待游戏更新等步骤。 如果你对Gemini的宝可梦直播感兴趣,可以在twitch上搜索“gemini plays pokemon”,我们也会在文末奉上链接。虽然已经是联盟冠军,但大模型在宝可梦这款游戏中表现明显不如人类,经常迷路等。这主要是因为大模型“视力不佳”,难以像人类一样解读Game Boy屏幕里的世界。不过,大模型在偏文本的部分已有惊艳表现,比如在宝可梦对战中能够及时理解攻击效果并调整战斗策略。 谷歌率先实现了新的突破,表示还将在这个有趣的挑战中进行更多探索(直播将至少持续数天)。或许未来测试大模型的基准真的会变成谁能更快通关宝可梦了。

话题追踪

本信息来自互联网,不代表导读网立场,如若转载,请注明出处:http://www.frfey.com/news/48460/

(4)

导读信息推荐

发表回复

本站作者后才能评论

    联系我们

    邮件:sooting2000@qq.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们