江信江疑

北京时间 2025 年 10 月 7 日凌晨 1 点，OpenAI 年度开发者大会 Dev Day 2025 举行。本次发布会展示了 OpenAI 从应用集成、Agent 开发到代码辅助的完整工具链，标志着其从模型提供商向 AI 操作系统的战略转型。以下是发布会的主要内容概览： • Apps in ChatGPT：第三方应用可直接集成到 ChatGPT 界面中，OpenAI 提供了基于 MCP 标准构建的 Apps SDK 供开发者使用。首批合作伙伴包括 Figma、Canva、Coursera、Spotify、Zillow 等。用户可在 ChatGPT 内直接与应用交互，无需跳转。OpenAI 年底将开放正式提交和审核流程，并推出应用目录。 • AgentKit：这是生产级 Agent 构建工具包，包含 Agent Builder（可视化工作流编辑器）、Chat Kit（对话界面组件）、Evals for Agents（Agent 评估工具）三大核心组件。它支持拖拽式节点搭建，可快速进行原型开发，还能定义输出格式和样式模板。例如，Ramp 团队使用后迭代周期缩短 70%。 • Codex：Codex 正式版发布，新增 Slack 集成功能，提供 Codex SDK，并增加了企业级控制功能，类似 Claude Code 的代码辅助工具。自 8 月初以来，Codex 的日活跃使用量增长了 10 倍以上，GPT-5 Codex 在发布后三周内已处理超过 40 万亿 tokens。 • API 重大更新： ◦ Sora 2 API：最新视频生成模型 API，可通过简单的 API 调用集成到应用中，支持自定义视频时长、分辨率和风格。 ◦ GPT-5 Pro API：新一代模型接口，面向 API 用户开放，推理速度有显著提升，特别适合处理需要高准确性和深度推理的困难任务。 ◦ Real - Time Mini API：具有实时交互能力，是一款更小、更便宜的语音模型，成本比之前的版本降低了 70%。 ◦ gpt - image 模型：图像生成 API，至此 OpenAI 形成了覆盖文本、图像、视频、实时交互的完整 API 矩阵。 • 平台规模数据：OpenAI 表示目前有 400 万开发者使用其构建应用，每周有 8 亿+ChatGPT 活跃用户，API 平台每分钟处理 60 亿 tokens。这里面需要去强调的几个问题： 1. 如果它重构应用商店目录的话，对用户来说会形成新的选择和认知成本，实际上有点多此一举。更核心的要素是模型能够识别好用户的精准需求。 2. 对服务进行统一的输入输出管理，保证交付的稳定性。这一点上，我觉得可能未来是一个大的趋势。用应用目录的方式，只是把选择权和不确定的权利交给用户，让用户对平台的能力有容忍。但长期来看，一个一体化的服务能力强调的应该是标准化的输入输出服务，而不应该中间有过多的环节和流程去做形态匹配。这个过渡态会继续演进。构建工具流的价值是推进下一步的用户创作，模版化系统的逻辑是成立的，但是也要解决新的问题从现在的状况来看，他发布的这个构建工具流的产品，其实最终目标不一定是要鼓励开发者，更多的是让普通用户解放自己的创作想象力。平台的基础能力是有限的，它能够具象化的场景也是有限的。它只有将创作能力开放给大部分用户的时候，让他们有能力基于日常的场景去构建新的工作流，并最终模板化分享，这就是一个系统体系的逻辑。比如今天大部分的生产力工具或者平台，一个潜在的生意就是卖模板化的服务。一些有序的无序化是满足多种场景需要的构建方式。而无序化的逻辑就是让一部分有序的人来建立工具，把它们对应的场景做结构化处理。在这个大的要义里，才会把整个软件服务的生态和平台价值做到最大化。当然，这其中还有一个要义是看其余的工具平台是不是配合。数据体系的打通它目前还没有解决的是数据体系的问题，相信从服务能力和基础的工作流状况下，短期之内问题不会很大。长期就看有没有能力去打通用户的数据中心，形成一个数据一体化的服务。这一点上，看起来今天一部分厂商需要它流量的时候是会接入的。但更久之后，是用什么样的壁垒来完成这个服务，暂时还不得而知。当然，这里面也还会面临一个新的问题，就是如果它想要成为用户的数据中心，或者一定程度上的数据体系核心整理的话，它对用户的数据结构和分组，还要面临重大的考量。今天单纯存记忆这件事情只是一个切入点。因为用户的数据场景里面，记忆只是一个核心要素，更重要的还是把记忆用在合适的场景里。我想这可能是一个重大挑战。 AI OS 的逻辑背后，是关于供给关系的重新梳理当然，所有的人都会想到 Sam Altman 做 AI OS，本质上它应该也是有这个想法和预期的。但是 AI OS 的核心逻辑不在于它重构了一套系统，而是它要重构一个用户可以接入这套系统服务的核心框架和载体。今天它是用软件在不同的平台上去跑。之前他也买了硬件团队，所以非常确认的是他会做硬件。但是这个硬件会是什么样的形态？它会不会是一个完整的硬件？我想今天可能都一切是未知数。但我们可以试着去梳理一下它这套逻辑背后的那些核心价值点会是什么？硬件的本质是代替用户的数据输入中心。从这一点上来看，它可能要拿取的东西是要帮助用户去做完整的输入。是不是一定需要输出，今天还不太确定。但由于目前它整个系统的动态能力还会有限制，所以我猜可能整个硬件体系里面它应该想的是一个结构化的输入输出的方式，但所有的处理都放在模型端去完成。这个模型体系里面对应的能力： 1. 一部分是需要在硬件本身去解决掉 2. 另外一部分是帮助整个用户的数据做更普世化的梳理和抽离；可能目前看起来，一个可穿戴的设备是符合它的场景预期的，只需要从输入端解决问题，输出端借助用户现有的设备就可以了。所以从现在的状况来看，它要核心拿到用户的输入。第二个价值点是他如何去存储、使用用户的数据。是按照个人的账号系统来做云端的存储，还是按照用户的特征值去抽离出来，做场景化的存储。我觉得在技术上应该不是特别难的事情，更多的是如何去对用户的场景做识别和确认。今天有一堆硬件公司在想要解决这个问题，但是不是有可能它就不应该是一个硬件公司来解决的问题？更应该像是一套服务体系里面的场景化能力，或者垂直小模型需要解决的问题。我暂时没有答案，但这个问题如果乐观的话，他们会在今年年底出一个解决方案，或者他们会买一家类似的公司。服务的 API ，基础模块必选项 OpenAI 这次基本上把目前基础能力里面能开放的能力都增强了，但是对于它来说，这还远远不够。除了本身基础能力体系里面用户看得见的部分，还有很多用户看不见的部分，他们也是会在深入研究的。只是今天不敢贸然发布的原因是因为要考虑整个合作伙伴体系里面，大家对它的生态的价值。所以它会挑一些生态合作伙伴去对它基础能力的补足和增强。但是未来那些太基础模块部分里面，它肯定是要去做更多深化的。不管是文本、音视频还是其余的东西，官方都会想办法来解决需求，因为一定程度上它把这些需求解决掉之后，才会有更稳固的商业体系价值。虽然典型的目标是服务用户的需求，但这里面的需求拆出来，无论是 2B 还是 2C，都是一个非常大的生意，这一点我觉得他们是非常坚定的。 OpenAI 未来会是一家云服务公司一个无法考据数据的结论，等等看。

OpenAI OpenDay 的关键要素

订阅后继续阅读