🔥 今日头条:OpenAI 发布 GPT-5.4:原生支持“操控电脑”,AI Agent 迎来终极形态
OpenAI 再次深夜突袭,正式发布 GPT-5.4。本次更新的核心跨越并非单纯的参数提升,而是**“计算机使用能力”(Computer Use)**的全面解锁。新模型能够像人类一样熟练浏览网页、操作复杂软件、编写并实时调试代码。官方演示了从看板管理到酒店预订的全自动工作流,彻底打破了聊天框的边界。这意味着 AI 正从“高智商对话者”进化为“全能执行者”,Agent(智能体)时代的技术基座已真正成型。
🚀 行业速递 Top 10
- OpenAI 曾明令禁止军事用途,五角大楼却通过微软“借道”测试
尽管 OpenAI 条款禁止军事应用,但消息人士透露,美国国防部通过微软提供的企业级服务,成功绕过限制并在内部测试了相关模型。这暴露了科技巨头在商业利益与伦理底线之间的灰色地带,也暗示了军方对顶级 AI 模型的依赖程度。
- MIT 惊人研究:过度使用 ChatGPT 或导致“认知债”,脑连接减弱 55%
麻省理工学院(MIT)发布的一项新研究引发广泛焦虑:长期依赖 AI 进行思考和创作,可能导致大脑特定区域的功能性连接减弱高达 55%。研究者将这种现象命名为“认知债”(Cognitive Debt),警告人类在享受便利的同时,正面临记忆力衰退和思维惰化的风险。
- Claude 用户量狂飙:每日新增注册突破 100 万
Anthropic 首席产品官 Mike Krieger 宣布,Claude 目前每日新增用户超过 100 万。在 GPT-5.4 发布的前夜,Claude 凭借其卓越的代码能力和自然的对话体验,正在快速蚕食市场份额,双雄争霸格局愈发清晰。
- 算力告急!Claude Code 暂时下架 Opus 4 和 Sonnet 4.5 模型
用户增长过快带来的副作用显现。为了保证系统整体稳定性,Anthropic 不得不暂时在 Claude Code 开发环境中禁用了最高端的 Opus 4 和 Sonnet 4.5 模型。这反映出即使是顶尖 AI 公司,算力瓶颈依然是制约服务扩展的最大短板。
- 字节跳动 AI 困局:算力受限与版权纠纷拖累 Seedance 2.0
字节跳动备受期待的视频模型 Seedance 2.0 遭遇滑铁卢。尽管技术指标亮眼,但受限于高性能计算芯片的短缺以及日益严峻的版权投诉,其大规模部署和商业化进程严重受阻,这也是中国 AI 巨头普遍面临的“成长的烦恼”。
- Google 发布 Workspace CLI:意在终结 Zapier 的自动化霸权
Google 推出了包含 40 多种 Agent 技能的 Workspace 命令行工具。这一举措允许开发者通过代码直接编排文档、邮件和日历等服务,其强大的原生集成能力,极有可能对 Zapier、Make 等第三方自动化平台构成降维打击。
- 警惕“影子 API”:你买的高端模型可能是“掺水”的
最新研究揭露了“Shadow APIs”骗局:大量第三方 API 服务商声称提供 GPT-5 或 Claude Opus 接口,实则在后台偷偷路由到更便宜、更笨的模型(如 Llama 3 小参数版)以赚取巨额差价。开发者需警惕这种“挂羊头卖狗肉”的模型降级风险。
- 手机端离线运行 Qwen 3.5:PocketPal 开源应用发布
随着端侧算力提升,在手机上跑大模型已成现实。开源应用 PocketPal 支持在 iOS 和 Android 设备上离线运行 Qwen 3.5 等模型,为注重隐私和无网环境的用户提供了绝佳的本地 AI 解决方案。
- Vercel 联手 Stripe:让 AI Agent 自己“赚钱”成为可能
Vercel 与支付巨头 Stripe 达成深度集成,旨在帮助开发者构建能够独立处理交易的 AI Agent。这意味着未来的 AI 应用不仅能写代码、做客服,还能直接完成商业闭环,极大地降低了独立开发者的变现门槛。
- 腾讯开源 HY-WU:文本引导图像编辑的新框架
腾讯在 Hugging Face 开源了名为 HY-WU 的神经记忆框架。该技术专注于通过文本指令精确编辑图像,解决了传统模型在修改图片时容易破坏原图细节的痛点,为设计领域的 AI 辅助工具提供了新的技术思路。