当地时间1月31日实盘配资官网开户,OpenAI宣布推出新一代推理模型o3系列的mini版本。据OpenAI介绍,o3-mini是其最具成本效益的推理模型,在科学、数学、编程等领域的能力较强,同时兼具o1-mini的低成本和低延迟特点,o3-mini可与联网搜索功能搭配使用,不过o3-mini还不支持视觉功能。
“o3-mini的能力可设置为低等、中等、高等。能力设置为中等的o3-mini与o1在数学、编程和科学方面的表现相当,但反应速度更快。专家测试人员的评估表明,o3-mini给出的答案比o1-mini更准确且清晰。测试者观察到,在有关现实世界的难题上,o3-mini的主要错误减少了39%。”OpenAI表示。
从能力上看,作为mini版本,o3-mini在一些测试中的表现略超o1。在数学测试AIME 2024、博士水平测试GPQA Diamond、竞赛编码测试Codeforces、软件工程测试sw -bench中,o3-mini得分分别为87.3、79.7、2130、49.3,高于o1的得分83.3、78、1891、48.9。
此外,o3-mini在编码测试LiveBench中表现优于o1,在一般知识测试General knowledge中表现优于o1-mini。从速度上看,o3-mini在A/B测试(一种对比测试)中的平均响应时间为7.7秒,响应速度比o1-mini快24%。
此前国内大模型公司DeepSeek发布DeepSeek-R1,并称该模型性能对标OpenAI o1正式版,该模型不仅开源,API(接口)价格还明显低于o1。DeepSeek-R1输入(缓存命中)、输出定价分别为每百万tokens1元、6元,低于o1的55元、438元。或是迫于压力,OpenAI CEO山姆·奥尔特曼(Sam Altman)在当地时间1月23日宣布,OpenAI将推出新一代o3系列的o3-mini版本,且ChatGPT免费用户将能使用o3-mini。
此次OpenAI正式推出o3-mini后,OpenAI再次强调,ChatGPT是首次向免费用户提供推理模型,用户可以在消息编辑器中选择“Reason”来尝试使用OpenAI 3-mini。不过,付费用户的使用范围更广,可以使用o3-mini的高等能力。ChatGPT Plus和Team用户的流量限制从01 -mini的每日50条增加到03 -mini的每日150条,Pro用户则可以无限制地使用o3-mini。
OpenAI也在提供越来越低的API调用价格,据其介绍,自GPT-4推出以来,每个token的定价下降了95%。o3-mini输入(缓存命中)、输出每百万tokens的定价为0.55美元、4.4美元,仍高于DeepSeek-R1。
虽然DeepSeek并未公开DeepSeek-R1的训练成本,但此前DeepSeek公开了另一个模型DeepSeek-v3的训练预算为“2048个GPU、2个月、近600万美元”,外界认为DeepSeek-R1在能力对标o1的同时,训练成本可能也偏低,这可能意味着DeepSeek团队的技术水平较高。随着DeepSeek近期受到关注,OpenAI客观上也承受了一定压力。
OpenAI正在采取措施维持自身的优势,除了推出o3-mini“应战”,近日还有消息称,OpenAI正在就新一轮融资进行谈判,拟筹资金额高达 400 亿美元,该轮融资将由软银集团牵头,使OpenAI的估值达到3000亿美元,不过该传言尚未得到OpenAI证实。
举报 第一财经广告合作,请点击这里此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。 如需获得授权请联系第一财经版权部:021-22002972或021-22002335;banquan@yicai.com。 文章作者郑栩彤
相关阅读 打响“估值保卫战”!OpenAI奥尔特曼将启程全球“路演”奥尔特曼此行的另一个重要背景是,中国DeepSeek的崛起正在引发投资人对于AI巨额投入的疑惑,他需要向投资人解释为何还需要持续向AI投入大量资金。
158 昨天 15:58 第一财经星翼大模型联动DeepSeek,财经智能体服务能力再升级第一财经星翼大模型以DeepSeek V2.5为基座模型,结合多模态能力和财经专业数据,提供智能化财经信息服务。
538 02-01 19:24 AI的iPhone时刻真的要来了!DeepSeek将影响普通人DeepSeek将推动AI实现“平民化”,而建立在开源的AI系统之上,更多的开发者能够开发出有用的AI应用场景,从而让AI走入普通人的生活。
846 02-01 14:51 黄仁勋与特朗普会面讨论哪些话题?英伟达回应双方讨论了加强美国技术和人工智能领导地位的重要性。
546 02-01 13:10 DeepSeek的“蒸馏模型”超越原创?美国要对“蒸馏技术”下手数据蒸馏是一种业内常见的技术做法实盘配资官网开户,是指通过一系列算法和策略,将原始的、复杂的数据进行去噪、降维、提炼等操作,从而得到更为精炼、有用的数据。
910 01-30 12:40 一财最热 点击关闭