泰国新闻网XTHAI.COM报道,人工智能领域再次迎来重大突破!OpenAI今日重磅发布两款全新旗舰推理模型——o3与o4-mini,这是该公司首次推出能够”用图像思考”的人工智能模型,标志着视觉推理能力迈入全新阶段。
据OpenAI官方介绍,o3是该公司迄今为止最先进的推理模型,在数学、编程、推理、科学及视觉理解等测试中表现卓越,全面超越了公司先前的所有模型。而o4-mini则为开发者提供了价格、速度和性能之间的理想平衡点,这也正是开发者在选择AI模型驱动应用时最为关注的三大要素。
两款新模型的最大亮点在于其独特的”图像思考”能力。用户可以将白板草图或PDF图表等图像上传至ChatGPT,模型会在生成回答前的”思维链”阶段对这些图像进行深度分析。对企业用户而言,这些模型甚至能理解模糊和低质量的扫描图像,并在推理过程中执行缩放或旋转等图像处理任务。
除视觉能力外,o3和o4-mini还能利用ChatGPT中的各种工具生成响应,包括网页浏览、执行Python代码、图像处理和图像生成等。它们就像真正的智能体,能在不到一分钟内自主判断并组合使用各种工具,提供全面详尽的解决方案。
在定价方面,o3每百万输入token收费10美元,每百万输出token收费40美元;o4-mini则维持与o3-mini相同的价格,每百万输入token收费1.1美元,每百万输出token收费4.4美元。
这两款模型现已对OpenAI的Pro、Plus和Team方案订阅者开放使用。OpenAI首席执行官Sam Altman透露,o3和o4-mini可能是GPT-5问世前最后一代独立AI推理模型,未来GPT-5将整合传统模型与推理模型的功能。
在全球AI竞赛日益激烈的背景下,OpenAI此次推出的新模型无疑将进一步巩固其行业领先地位,为人工智能技术的普及应用注入新动力。
#OpenAI #人工智能 #o3模型 #o4mini #图像思考 #推理模型 #ChatGPT #AI技术突破