
2025年4月16日,OpenAI团队在X平台上举办了一场问答活动(AMA),详细介绍了他们即将发布的最新进展和技术细节。
在产品发布和路线图方面,OpenAI宣布强化微调功能很快将全面开放,支持公众进行推理模型的微调或强化学习。此外,OpenAI计划在未来几个月内发布一个强大的开源模型,并欢迎开发者提供反馈以提高其实用性。
关于图像生成功能,API中的新功能将很快推出。o3-mini在API中不会支持视觉处理,但o4-mini已经支持视觉输入,并且作为推理小型模型目前可用。更高级的o3-pro模型正在开发中,预计不久后发布。
在模型性能和使用方面,整个GPT-4.1系列专门针对编码和代理任务进行了训练。o3适用于复杂的编码问题或广泛的主题搜索,而o4-mini则更适合快速交互或较小的编码任务。o4-mini具有更高的速率限制,在涉及视觉、数学、科学和某些编码任务的评估中,表现与o3相当。对于需要深入知识和细微差别的任务,o3仍然具有明显优势。
GPT-4.1通过自定义微调可以提升特定场景的性能,减少提示中的示例数量。GPT-4.1训练用于探索可能的解决方案、自我反思和自我纠正。o3和o4-mini都提供了200k个令牌的上下文窗口,最大输出令牌数为100k,并经过了内部和第三方的网络安全评估。
API功能和工具支持方面,Response API能够自动切换开发者和系统消息。一个名为“reasoning effort”的参数可用于控制成本,特别是在o系列模型变得越来越智能时。目前,ChatCompletions或Responses API不支持托管工具,但一旦支持上线,开发者将能够控制启用的工具。
SDK能够自动将Pydantic模式转换为兼容的JSON模式,处理诸如“additionalProperties”等属性。工具如网络搜索、文件搜索和代码解释器在o3和o4-mini的推理阶段被积极使用,尽管这些工具目前仅在ChatGPT中支持,但API支持即将到来。
Agent SDK和Codex CLI也在积极开发中。线程支持将改进对话历史记录和保留。Codex CLI包括多个文档化的批准模式,允许用户根据操作或会话选择模式。Codex CLI旨在运行后台任务,而不是替代IDE工具。
···

OpenAI 宣布在其 API 中推出了两款强大的新推理模型:o3 和 o4-mini。这两款模型在多个领域表现出色,为开发者提供了更多选择。
o3 模型在编程、数学、科学和视觉处理方面实现了行业领先的性能,适用于需要高精度和复杂推理的应用场景。例如,在软件开发中,o3 可以帮助程序员自动生成代码片段,提高开发效率;在科学研究中,它能够辅助研究人员进行数据分析和模型构建。
o4-mini 则是一款更快速且成本效益更高的推理模型,适合对响应时间和成本有更高要求的场景。虽然在某些任务上的表现略逊于 o3,但 o4-mini 的高效性和经济性使其成为许多实际应用的理想选择。
这些新模型的推出进一步巩固了 OpenAI 在人工智能领域的领先地位,并为各行各业的开发者提供了更多工具,以实现更高效、更智能的解决方案。
···

OpenAI近日发布了三款新的推理模型o3、o4-mini及o4-mini-high,代号为Phoenix。这些模型旨在提升ChatGPT的性能和功能。

o3取代了之前的o1版本,而o4-mini和o4-mini-high则分别替换了o3-mini和o3-mini-high。这些新模型支持多种ChatGPT工具,如Python代码执行、搜索、画布操作、文件上传、图像分析以及图像生成等功能。此外,它们还能够提供详细的“结构化思考”,展示明确的推理步骤、搜索结果、Python代码,并且具备可折叠的摘要功能。值得一提的是,这些模型在处理图像和高级视觉推理任务上表现优异,达到了顶尖的基准分数。

这些新模型在准确度、效率以及成本效益方面都有显著提升,并在编码、数学和视觉任务中创造了新的业界纪录。为了确保安全性,这些模型采用了最新的拒绝训练技术、高级风险检测机制,并经过独立审查,确保其始终低于所有高风险安全阈值。

ChatGPT Plus、Pro和Team用户现已可以使用这些新模型,Enterprise和Edu用户将在一周内获得访问权限。免费用户可以通过Think模式试用o4-mini。API和Responses API已支持o3和o4-mini进行高级推理并提供推理摘要(工具支持将在未来几周内推出)。
- 在API中,o4-mini和o3提供200,000个令牌的上下文窗口,最多支持100,000个输出令牌。
- 知识截止日期为2024年6月1日。
此外,Codex CLI现在也作为开源终端编码代理发布,它能将ChatGPT级别的代码推理、实时代码执行、多模态支持和安全沙盒自动化引入终端。OpenAI还为此设立了100万美元的资助计划,以支持使用Codex CLI和OpenAI模型的开源项目。
···

Veo 2 现已正式上线 Google AI Studio 和 Gemini API,这一强大的视频生成工具将使用户能够轻松地将文本和图像提示转化为令人惊叹的视频内容。
通过集成 Veo 2,开发者可以无缝地将其融入现有的工作流程中,从而大幅提升视频制作的效率和质量。Veo 2 利用先进的深度学习技术,能够根据简单的文字描述或图片输入生成高质量的视频,适用于广告、教育、娱乐等多个领域。
应用场景:
- **广告创意**:快速生成吸引眼球的广告视频,提高品牌曝光率。
- **在线教育**:将课程内容可视化,增强学习体验。
- **社交媒体**:创建引人注目的视频内容,吸引更多关注。
详细了解如何使用 Veo 2 及其功能,请访问:https://t.co/jDff8aOTkS
···

最新版本的AI SDK现已集成OpenAI的最新推理模型o3和o4-mini。这些模型在处理复杂推理任务时表现卓越,能够提供更准确、更高效的解决方案。
o3模型专为需要高精度和强大推理能力的应用场景设计,适用于自然语言处理、数据分析和智能决策等领域。而o4-mini则是一款轻量级模型,适合资源受限的环境,如移动设备和边缘计算。
主要特点包括:
- 显著提升的推理性能
- 更高的准确性和可靠性
- 优化的资源利用效率
开发者可以通过访问官方网站获取更多详细信息和技术文档,以便快速上手并充分利用这些先进模型。
···

Codex CLI 是一个开源的本地编程代理工具,它可以将自然语言转换为可运行的代码。只需告诉 Codex CLI 你需要构建、修复或解释的内容,它就能迅速将你的想法变为现实。
这款工具特别适用于开发人员和初学者,能够显著提升编码效率并降低学习曲线。通过简单的命令行界面,用户可以轻松地与 Codex CLI 互动,获得即时反馈。
Codex CLI 的应用场景广泛,包括但不限于:
- 快速原型设计
- 自动化脚本生成
- 代码调试和修复
此外,Codex CLI 还支持多种编程语言,如 Python、JavaScript 和 Java 等,使其成为多语言开发者不可或缺的工具。
无论你是经验丰富的程序员还是刚刚入门的新手,Codex CLI 都能帮助你更高效地完成编程任务。
···

OpenAI今日(2025年4月16日)正式发布了其最新“推理”旗舰模型o3及其精简版o4-mini。o3被定位为目前最强大的多模态推理模型,能在一分钟内自主调用浏览器、Python代码、文件解析与图像生成功能,并首次将“看图思考”融入推理链;而o4-mini则在低延迟和低成本下提供了卓越的数学和编程性能。两款模型已在ChatGPT Plus、Pro、Team以及API上线,并通过新版Preparedness框架完成安全审查。
o系列专注于“深度思考”而非纯语言生成。o3于2024年12月20日宣布预览,名称避开与电信运营商O2冲突;随后在2025年1月31日推出成本版o3-mini;完整版o3则在今天全面开放。核心技术升级方面,Simulated reasoning机制让模型在回答前进行“私密链式反思”,显著降低幻觉;“深度强化学习扩展”验证了“算力增加→推理能力提升”的二次标度规律。官方测试显示o3在真实世界难题上较o1重大错误减少20%。
o3与o4-mini能在链式思考中嵌入图片,解析模糊板书、旋转/缩放示意图,并携带视觉洞察写入最终答案,开启文本-视觉混合推理新范式。模型可评估何时检索网页、编写Python代码或生成图片,并把结果编织成一次性回复,标志着ChatGPT迈向“代理型”助手。此外,o3刷新了Codeforces、SWE-bench及多模态MMMU纪录;o4-mini在AIME 2024/2025与GPQA Diamond等理工基准上,以更低的成本实现同级领先。
价格方面,o3定价为输入每百万Token 10.00美元,输出每百万Token 40.00美元,适用于高精度多模态推理;o4-mini则分别为1.10美元和4.40美元,适用于快速低成本STEM和代码任务。定价较o1同档大幅下降,ChatGPT付费层可在模型选择器直接切换,企业版o3-pro将于数周内上线。
开发者生态方面,o3系列支持Chat Completions、Assistants、Batch API,并原生提供函数调用、结构化输出与开发者消息。开源终端代理Codex CLI可以离线调用o3/o4-mini操控本地代码工作流。此外,o3驱动的网络调研代理能自动搜集并汇总资料,被视为AI代理时代样板。
尽管OpenAI赶在Google Gemini 2.0与DeepSeek等竞品之前发布o3,缩短了安全测试周期,引发外界对其充分性的讨论,但行业观察家指出,o3的多模态与代理特性或将重塑数据分析、科研和软件开发工作流,未来也将对模型透明度和对齐提出更高要求。
···

最新消息:从今天开始,o3和o4-mini两个新模型将在ChatGPT和API平台上正式上线。
这两个模型经过专门训练,具备了更强大的工具使用能力。这一更新标志着人工智能技术在实际应用中的进一步突破,有望显著提升用户体验和工作效率。
主要特点:
- **增强的工具使用能力**:o3和o4-mini能够更好地理解和操作各种工具,从而提供更加精准和实用的回答。
- **更广泛的应用场景**:这些模型将适用于更多领域,如客户服务、技术支持和内容创作等。
- **更高的灵活性**:通过API接口,开发者可以轻松集成这些新模型,实现定制化的解决方案。
此次更新不仅为用户带来了更多的选择,也为企业提供了更强大的AI支持,推动了整个行业的智能化进程。
···

我们很高兴宣布推出全新的/extract v2,这是一项革命性的数据提取工具,为用户提供更强大的功能和更灵活的使用方式。
新版/extract v2支持从多个页面提取数据,并处理分页问题,甚至可以在没有具体URL的情况下,从整个网络中提取数据。这一技术突破由FIRE-1驱动,使数据提取变得更加高效和便捷。
**/extract v2**的核心优势在于其先进的端点设计,允许用户通过简单的提示获取所需数据。这项技术在Launch Week的第三天得到了显著改进,为用户提供了更强大的数据提取能力。
以下是/extract v2的主要功能:
- 多页数据提取
- 自动处理分页
- 无URL全网数据抓取
这些功能使得/extract v2成为数据科学家、研究人员和开发者的理想工具,广泛应用于市场分析、竞争情报、学术研究等多个领域。
···

最新消息,o3和o4-mini两款工具现已正式在Playground平台上架。这两款工具是人工智能开发领域的重要组成部分,旨在为开发者提供更高效、便捷的开发体验。
o3是一款强大的机器学习模型训练工具,支持多种深度学习框架,能够显著提升模型训练的速度和精度。而o4-mini则是一款轻量级的推理引擎,专为边缘计算和移动设备设计,具有低功耗、高性能的特点。
通过在Playground上使用o3和o4-mini,开发者可以轻松地进行模型训练和部署,加速项目从概念到实际应用的过程。此外,Playground还提供了丰富的示例代码和文档,帮助开发者快速上手。
无论你是初学者还是经验丰富的开发者,都可以在Playground平台上找到适合自己的工具和技术资源。

