关闭广告

谷歌推最强Gemini推理模型:月费1800,已拿奥赛金牌,性能超OpenAI o3和Grok 4

智东西2025-08-02 12:00:017292人阅读


智东西
作者 ZeR0
编辑 漠影

智东西8月2日报道,昨夜,谷歌推出其迄今最强推理模型Gemini 2.5 Deep Think。

这是最近在今年国际数学奥林匹克(IMO)上“拿金牌”的模型的变体。近期高级版Gemini Deep Think完美解答了IMO 6道题目中的5道,总分35分(满分42分),达到金牌水平。

该模型需要几个小时才能推理出复杂的数学问题。新发布的版本在日常使用中速度更快、更易用,根据内部评估,在2025年IMO基准测试中仍达到铜牌水平。

谷歌在今年5月的I/O开发者大会上首次预览了Gemini 2.5 Deep Think。新版本进行了“重大改进”。在具有挑战性的编程、科学、知识、推理基准测试中,与OpenAI o3、Grok 4等其他不使用工具的模型相比,Gemini 2.5 Deep Think在LiveCodeBench V6和Humanity’s Last Exam均取得最佳性能。


Gemini app中的Deep Think模型,使用思考技巧来提供更详细、更有创意和更周到的回答,甚至可以帮助数学家来测试数学猜想,还能提高Web开发任务的美观性。


Deep Think支持文本、图像、音频、视频等输入和1M tokens上下文窗口,输出长度为192K tokens。

其工作原理是利用谷歌的并行思维技术,能同时生成多个想法,并同时进行思考,甚至随着时间的推移不断修改或整合不同的想法,最终得出最佳答案。

此外,通过延长推理时间或“思考时间”,谷歌给了Gemini更多的时间来探索不同的假设,并为复杂问题找到创造性的解决方案。

谷歌还开发了新颖的强化学习技术,鼓励模型利用这些扩展的推理路径,从而使Deep Think随时间推移成为更好、更直观的问题解决者。

Deep Think可以帮助人们解决需要创造力、战略规划和逐步改进的问题,例如:

  • 迭代开发和设计:在需要逐块构建复杂事物的任务上的表现出色,比如可以提高网络开发任务的美学和功能。
  • 科学和数学发现:可推理出高度复杂的问题,通过复杂的科学文献帮助制定和探索数学猜想或推理,可能加速发现之路。
  • 算法开发和代码:在棘手的编码问题上特别出色,其中问题制定和仔细考虑权衡和时间复杂性是最重要的。

目前仅有最高级别的Google AI Ultra订阅者可选用“Deep Think”,每月订阅费为249.99美元(约合人民币1803元)。

Deep Think自动与代码执行和谷歌搜索等工具配合使用,并能产生更长的响应。

同时,达到IMO金牌水平的Deep Think模型将进一步测试,并向一小部分数学家和学者分享,用于辅助研究。谷歌计划利用这些反馈来完善该模型的未来版本。

谷歌还正在努力在未来几周内通过Gemini API向一组受信任的测试人员发布带和不带工具的Deep Think,以更好地了解其对开发者和企业用例的可用性。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

深夜暴涨,“超16万人爆仓”

中国基金报 浏览 97 08-23

百年老字号的资本挑战:携创收单品安宫牛黄丸,同仁堂医养四冲港股|港E声

时代周报 浏览 3 01-28

标普将全球最大稳定币运营商Tether资产评级下调至最低等,质疑挂钩美元能力

华尔街见闻官方 浏览 33 11-27

科学家开发“神经蠕虫”,实现颅内电极游走模式

DeepTech深科技 浏览 94 09-22

章宇任素汐是绝配,曼谷街头演绎楚门世界,分手闹剧撞上真人秀

最爱酷影视 浏览 3455 07-11

理想、中国汽研深夜回应“撞飞卡车”,乘龙卡车连续四天发声

21世纪经济报道 浏览 7000 08-04

WTT横滨冠军赛赛程来了!5天战斗决出两项冠军,赛事总奖金360万

乒谈 浏览 7503 08-06

北京105-74大胜广东 球员评价:3人满分,7人及格,2人低迷

篮球资讯达人 浏览 16 01-02

想偷技术?土耳其对印尼出口48架KAAN,真正目标是我国涡扇-15?

密探财经 浏览 867 08-04

华为鸿蒙 HarmonyOS 5 应用市场新增 App 内购项目显示

IT之家 浏览 8547 08-14

单月首次突破6万台 极氪科技10月销量61636台

网易汽车 浏览 30 11-02

日本造出本土首颗2nm晶体管

观察者网 浏览 1378 07-22

19.79万起/超级增程 全新智己LS6上市

网易汽车 浏览 80 09-12

致敬经典,夏威夷一画家在涂鸦墙画出科比08奥运噤声庆祝造型

懂球帝 浏览 61 08-26

「长短剧」牌局开打,爱奇艺Q3要企稳?

节点财经 浏览 84 08-26

纽约州签署《RAISE法案》,推动人工智能安全监管

IT之家 浏览 26 12-21

从轿车变成MPV? 雷克萨斯LS概念车正式发布

网易汽车 浏览 47 10-30

推动人工智能等产学研融合——中国移动广西公司联合共青团广西区委、多所高校出实招

环球网资讯 浏览 9273 08-10

冯仑:分钱的方式,该变就得变了

冯仑风马牛 浏览 385 08-11

朝鲜晚上举行盛大阅兵式 现场画面披露

央视新闻客户端 浏览 48 10-11

周定洋社媒庆祝绝平申花:让我们继续拼、继续冲,一场一场来!

直播吧 浏览 48 09-22
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3