4 月 14 日,Google DeepMind 在官方博客宣布发布 Gemini Robotics-ER 1.6,即日通过 Gemini API 和 Google AI Studio 向开发者开放。本次升级聚焦三大核心能力:
模型作为机器人的高级推理大脑,可原生调用 Google 搜索、VLA 模型及第三方工具;安全性方面对物理约束的遵守优于前代所有版本,是 Google 迄今"最安全的机器人模型"。仪表读取能力源自与波士顿动力的合作需求,可读取圆形压力表、液位计等工业设备。
4 月 14 日,OpenAI 宣布扩大 网络防御可信访问计划(TAC),向数千名网络安全专家及数百个团队开放专用模型 GPT-5.4-Cyber。该模型基于 GPT-5.4 针对漏洞识别与防御分析专项微调,测试规模将从数百人逐步扩展。
Anthropic Fellows 最新研究探索 Claude Opus 4.6 能否加速解决关键对齐问题,核心思路是"弱 AI 模型监督训练更强模型"(弱到强监督)。实验结论表明,AI 可有效辅助对齐研究,Claude 已能为特定项目贡献高达 90% 的代码量。
Anthropic 推出 Claude Code 桌面版重大更新,主要新增功能包括:
同期,Claude Code 在 SWE-bench 上的得分已稳定在 80.8%,是目前最强的 Agentic 编码工具之一。新版本将其进化为一款更完整的 Agentic IDE。
AMD 正式推出 GAIA(General AI Agent) 开源框架,目标是让开发者在本地硬件上构建并运行完整 AI Agent,实现 零云依赖、零 API 费用。
框架集成 Whisper ASR 语音识别、Kokoro TTS 语音合成,支持本地 PDF 文档问答(RAG),全链路离线运行,对隐私敏感型企业尤具吸引力。
开源社区知名机构 NousResearch 推出 Hermes Agent,被称为首个具备内置学习循环的个人 AI Agent——能够从使用经验中创建技能、在使用中自我优化、跨会话持久化行为。
Runway 新功能 Character 正式亮相,允许用户创建个人 AI 数字替身,可全程代替真人参加视频会议,同时进行实时语音交互、情境响应和身体语言模拟。
Cloudflare 扩展其 Agent Cloud 平台,推出 Dynamic Workers 功能:支持 AI 动态生成代码并在 Cloudflare Workers 边缘环境中直接执行,运行速度声称比传统容器快 100 倍,且成本仅为一小部分。
该功能将 AI 的代码生成能力与边缘计算的低延迟特性深度融合,为 Agentic 应用提供极低冷启动延迟的执行环境,是构建实时响应型 AI Agent 的重要基础设施进展。
斯坦福大学 AI 指数报告最新数据揭示:过去一年 自主 AI Agent 流量增长 7,851%,机器对机器(M2M)交互已主导网络活动,但 86% 的企业 CISO 尚未对 AI Agent 执行访问策略。