新闻中心

OpenAI o4-mini— OpenAI推出的小型推理模型

2025-04-17
浏览次数:
返回列表

openai o4-mini 是由openai推出的一款小型推理模型,专为快速且经济高效的推理任务而设计。该模型在数学、编程和视觉任务上表现卓越,在aime 2025和2025基准测试中表现出色,是最佳模型之一。openai o4-mini 支持高容量和高吞吐量的推理任务,适用于快速处理大量问题。它具备多模态能力,能够将图像融入思维链进行推理,支持工具使用,并能快速生成详细且深思熟虑的答案。与前代模型相比,openai o4-mini 在性能和成本效益方面有显著提升。目前,chatgpt plus、pro 和 team 用户可以在模型选择器中找到openai o4-mini和openai o4-mini-high,它们已经取代了o1、o3-mini和o3-mini-high。chatgpt enterprise 和 edu 用户将在一周内获得访问权限。开发者可以通过chat completions api和responses api使用该模型。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

OpenAI o4-mini— OpenAI推出的小型推理模型OpenAI o4-mini的主要功能包括:

  • 快速推理:擅长快速处理数学、编程和视觉任务,适用于高吞吐量场景。
  • 多模态能力:能够结合图像和文本进行推理,支持图像处理。
  • 工具使用:可以调用网络搜索、Python编程等工具辅助解决问题。
  • 性价比高:性能优于前代o3-mini,但价格不变,是升级的首选。
  • 安全可靠:经过安全训练,能够拒绝不当请求。

OpenAI o4-mini的性能表现:

  • 数学推理:在AIME 2025和2025基准测试中,OpenAI o4-mini在不使用工具的情况下准确率达到93.4%,使用Python后准确率提升至98.7%,接近满分。在复杂的数学问题解决能力上,OpenAI o4-mini表现优于前代o3-mini,在某些任务中接近完整版o3。
  • 编程能力
    • SWE-Lancer:OpenAI o4-mini表现优异,支持高效完成复杂的编程任务,收益表现突出。
    • SWE-Bench Verified(软件工程题库):在常见算法、系统设计、API调用等任务中表现卓越,准确率和效率均高于o3-mini。
    • Aider Polyglot Code Editing(多语言代码编辑基准):在代码编辑任务中表现出色,包括整体重写和补丁式修改,性能都优于o3-mini。
  • 多模态能力
    • MMMU(大学水平的视觉数学题库):支持将图像和数学符号结合解题,准确率达到87.5%,远高于前代o1的71.8%。
    • MathVista(视觉数学推理):在几何图形、函数曲线等视觉数学推理任务中表现优异,准确率高达87.5%。
    • CharXiv-Reasoning(科学图表推理):能理解科学论文中的图表和示意图,准确率达到75.4%,显著优于o1的55.1%。
  • 工具使用
    • Scale MultiChallenge(多轮指令遵循):支持处理复杂的多轮指令任务,正确理解执行多轮指令。
    • BrowseComp Agentic Browsing(浏览器任务):基于虚拟浏览器搜索、点击、翻页并整合信息,表现接近o3,远超传统AI搜索能力。
    • Tau-bench 函数调用:在函数调用任务中表现稳定,支持准确生成结构化的API调用,复杂场景下需进一步优化。
  • 综合测试
    • 专家级综合测试(Humanity’s Last Exam):在不使用工具的情况下准确率为14.3%,借助插件后提升至17.7%,不及o3的24.9%,但在小型模型中表现优异。
    • 跨学科PhD级科学题(GPQA Diamond):在科学题上的准确率为81.4%,稍低于o3的83.3%,在小型模型中已经非常出色。

OpenAI o4-mini的项目地址:

Whimsical Whimsical

Whimsical推出的AI思维导图工具

Whimsical 182 查看详情 Whimsical
  • 项目官网:https://www.php.cn/link/fb306d161c5d5ff68fb2512de815a8f9

OpenAI o4-mini的应用场景:

  • 教育辅导:帮助学生解决数学和编程问题。
  • 数据分析:快速生成数据图表和分析结果。
  • 软件开发:生成代码片段,辅助代码调试。
  • 内容创作:提供创意灵感,结合图像生成描述。
  • 日常查询:基于搜索和图像分析回答问题。

以上就是OpenAI o4-mini— OpenAI推出的小型推理模型的详细内容,更多请关注其它相关文章!


# 浏览器  # python  # 软件工程  # 一言  # 前代  # 2025  # api调用  # chatgpt  # ai  # 工具  # 化工推广网站大全最新  # seo990  # 赣州网站优化推广公司  # 香港短视频营销推广案例  # 网站优化如何发外链  # 宝鸡网站建设公司流程  # 网站建设图片logo  # 重庆做网站建设推广方案  # 新歌网站建设路  # 蚌埠网站优化费用  # 率为  # 选择器  # 解决问题  # 多模  # 适用于  # 率达到  # 官网 


相关栏目: 【 行业资讯67740 】 【 技术百科0 】 【 网络运营39195


相关推荐: 360n7锁屏壁纸怎么固定  春运抢票哪个平台好一点  台达变频器power灯是什么意思  联想的固态硬盘如何  市盈率动亏损是什么意思  power在坐标轴中是什么意思  显示器的power是什么意思  calm是什么意思  雅迪电动车上的power是什么意思  soup是什么意思  春运返程如何抢票成功  hp固态硬盘如何安装  kingston是什么_kingston是什么意思  春运抢票最好抢什么票啊  苹果16有哪些款式的  如何安装m.2固态硬盘  苹果16有哪些可以设置  主板如何禁用固态硬盘  单片机怎么计算0xf0  市盈率中的19a是什么意思  datediff函数怎么用视频  市盈率当中17A 18E是什么意思  如何安装台式机固态硬盘  vfp 命令窗口如何实现换行  手机如何运行ping命令  如何用固态硬盘做缓存  如何用命令连接mysql  vi命令如何使用方法  苹果手机16系统有哪些  vue怎么连接typescript  固态硬盘4k如何看  如何通过命令行聊天  vue项目如何用typescript  液位传感器power是什么意思  access中如何使用常用宏命令  如何通过命令检测u盘启动  如何管理员打开cmd命令行窗口  为什么夸克网盘下载不了  typescript书籍哪个好  夸克为什么老是投屏失败  市盈率亏损是什么意思  为什么夸克无法注销账户  vivo手机爱奇艺怎么投屏到电视操作步骤  双十一的哪一天最优惠呢  如何注释typescript  ai文件里无法找到链接文件要怎么解决步骤  如何为服务器配置静态路由?服务器配置静态路由详细教程  自己如何安装固态硬盘  单片机面包板怎么插  尼桑越野车中控前power是什么意思 

搜索