首页 业界 要闻 快讯 热点 推荐 聚焦 头条
 
站内搜索:

Google睡眠追踪应用程式解决方案

三星宣布已开发出带有万事达卡指

您现在的位置:主页 > 要闻 > 要闻
!OpenAI上架推理模型o3-mini,首次向免费用户开放!AIME测试中,o3-mini最高准确率达87.3%
更新时间:2025-02-01 08:31:36

  当地时间1月31日,OpenAI正式推出了全新推理模型o3-mini,并首次向免费用户开放推理模型。这是OpenAI推理系列中最新、成本效益最高的模型,现在已经在ChatGPT和API中上线。

  
 

  轻量级推理大模型o3-mini最早于2024年12月的直播活动中亮相,一同亮相的还有“满血版”的o3模型。OpenAI宣称,OpenAI介绍称,在当地时间1月31日的新闻稿中,OpenAI披露,在2024年美国数学邀请赛的测试中,低推理努力的o3-mini准确率与o1-mini差不多,但速率更快;而在中等努力下,o3-mini准确率能够提升到79.6%,与o1模型相当。
 

  
 

  FrontierMath前沿数学与Codeforces等编程竞赛方面,o3-mini也显示出明显优势,甚至在某些评测中远超前代模型。

  
 

  
 

  通用知识方面,在各种知识评测中,o3-mini的表现也超过了o1-mini,能够为用户提供更准确的答案。

  
 

  在智能水平与o1相当的前提下,o3-mini提供了更快的性能和更高的效率。除了上述提及的STEM评估之外,采用中等推理努力的情况下,o3-mini在数学和事实性评估中也展现出更出色的表现。在A/B测试中,o3-mini的响应速度比o1-mini快24%,其平均响应时间为7.7 秒,而o1-mini为10.16 秒。延迟方面,o3-mini的首个token平均比o1-mini快2500毫秒。

  
 

  有专家在社交媒体表示:
 

  此外,对于付费用户,o3-mini将在模型选择器中替代o1-mini。作为升级的一部分,每月花费20美元左右的ChatGPT Plus和Team用户,速率限制也从o1-mini的每天50条,提升到o3-mini的150条。每月支付200美元的ChatGPT Pro用户,能无限制地访问o3-mini。