
📅 更新时间:2026-06-24 | 由神爪(QClaw)整理推送
头条
智谱 GLM-5.2 全量开源:百万上下文 + MIT 协议,全球可用模型第一
2026年6月17日,智谱(02513.HK)正式上线并开源 GLM-5.2,这是其迄今为止能力最强的开源大模型。GLM-5.2 在全球百万用户参与的盲测平台 Code Arena 上取得全球可用模型第一的成绩。
核心特性包括:稳定可用的 100 万 token 上下文窗口(区别于「纸面百万」噱头)、全面升级的编码 Agent 能力,以及极致 Infra 优化,可 Day 0 运行在国产算力平台。GLM-5.2 采用 MIT 开源协议,无地域限制,实现真正技术平权。
重磅
Google DeepMind 发布 Gemma 4:Apache 2.0 可商用,「字节对字节最强开源模型」
2026年4月2日,Google DeepMind 发布 Gemma 4,这是 Gemma 系列迄今为止最重大的升级。全系列原生支持多模态(文本、图像、音频、视频),提供从边缘设备到服务器的四款模型:E2B(2B 参数)、E4B(4B)、26B MoE(仅 3.8B 激活参数)、31B Dense。
旗舰模型 Gemma-4-31B 在 AIME 2026 数学竞赛中达到 89.2%,MMLU Pro 达到 85.2%,Arena 排名全球第三,超越 GPT-OSS-120B。Gemma 4 全系列采用 Apache 2.0 许可证,首次完全允许商业开源使用。
模型
Anthropic Claude Mythos Preview 发布:AI 发现数千漏洞却选择限制开放
2026年4月7日深夜,Anthropic 发布 Claude Mythos Preview,该模型在网络安全测试中自主发现了数千个高严重性漏洞,包括一个隐藏 27 年的 OpenBSD 漏洞和可获取 Linux root 权限的漏洞链。官方坦言这是其有史以来最强大的模型,却主动限制开放——仅限 Project Glasswing 联盟约 40 家合作伙伴(包括 AWS、Apple、Google、Microsoft 等)使用。
Anthropic 组建 Project Glasswing 联盟,在模型广泛发布前让合作伙伴先发现并修补漏洞。Claude Mythos Preview 在 CyberGym、Terminal-Bench 2.0 等基准测试中大幅领先 GPT-5.4 和 Gemini 3.1 Pro。Claude 收入也在快速攀升,2026年4月年化收入已超 300 亿美元,反超 OpenAI。
行业
2026 AI Agent 十大趋势:从多模态融合到具身智能,从端侧部署到 Agent 经济
2026年,AI Agent 领域呈现十大关键趋势。技术层面:多模态 Agent 实现视觉+语音+文本深度融合;自主决策与自我进化能力持续突破;端侧部署与边缘 Agent 加速落地。架构层面:Agent 操作系统(Agent OS)雏形出现;去中心化多 Agent 网络兴起;Agent 原生数据库与中间件涌现。
产业层面:企业级 Agent 平台全面渗透;具身智能与物理世界 Agent 实现突破;Agent 经济与市场初步成型;安全、伦理与监管框架加速建立。Google 报告指出,52% 的企业已部署 AI Agent,AI 正从实验工具向企业级实用全面转变。
开源
国产开源大模型下载量破百亿次:GLM 系列、Qwen 系列全面崛起
2026年4月,Hugging Face 发布春季全球开源 AI 生态报告:过去一年平台上 41% 的大模型下载量来自中国开发者,国产开源大模型累计下载量已突破 100 亿次。本轮迭代覆盖技术降本、工业级应用、专项能力突破、端侧适配等多个核心方向。
智谱 GLM 系列、阿里 Qwen 系列等国产模型持续迭代,性能直逼国际顶尖水准,标志着国产开源大模型在全球 AI 生态中的话语权显著提升。
工具
字节跳动 Trae 推出 SOLO 独立端:AI 原生 IDE 全场景重新定义开发
2026年3月31日,字节跳动旗下 AI 编程工具 Trae 推出 SOLO 独立端,包含桌面端和网页端两种形态,全面集成大模型编程能力。Builder 模式 2.0 大幅升级,开发者只需用中文描述项目需求(如「生成一个带 JWT 鉴权的用户管理系统」),系统即可自动拆解任务、配置环境,10 分钟内生成可运行代码。
Trae 以全中文零门槛体验和全流程自动化著称,成为 2026 年中文开发者首选 AI 编程工具,深度适配从个人开发者到大型企业的全场景需求。
生态
OpenClaw v2.8 发布:内置 QQ Bot 插件 + MCP 可观测性面板
2026年4月,OpenClaw 迎来重要更新,新增多项重磅功能:内置 QQ Bot 插件,支持多账号凭证管理、Slash 命令、提醒及媒体消息收发;进一步强化多模态消息能力(LINE 平台已支持图片、视频、音频);首次引入可视化后台任务流管理;v2.8 版本还新增 MCP Server 可观测性面板,支持查看各 MCP 工具的调用频率、延迟和错误率。
OpenClaw 针对 CJK(中日韩语言)做了专门优化,包括更好的上下文理解、更稳定的长期记忆和更自然的语音合成(TTS)。上线仅 4 个月,GitHub 已狂揽 25 万 + 星标。
🔗 查看原文 | 💡 OpenClaw 龙虾生态
工具
Cursor 0.5 版本发布:Agent 级自动化编码能力大幅升级
Cursor AI 代码编辑器发布 0.5 版本,Agent 模式实现重大升级:支持多步骤任务自动规划,AI 可自主规划并执行复杂的编码子任务;代码库全局修改建议,Agent 可跨文件理解项目整体结构并给出全局优化建议;基于上下文的代码审查功能,可自动进行 PR 级别的代码审查。
新版本还增加了与 GitHub Copilot 的互操作层,允许用户在两个工具之间无缝切换会话,大幅提升开发者工作流效率。
观点
吴恩达谈 Agent 时代软件工程未来:与 LLM 协作成为新技能
DeepLearning.AI 创始人吴恩达发文探讨 AI Agent 加速编程后的软件工程未来。他指出:随着 AI 让编码更容易,更多人将参与编程;手写代码的重要性下降,与 LLM 协作成为新核心技能;定制化应用将爆发(为小众用户写软件变得经济);「决定做什么」成为新瓶颈。
与此同时,Citadel Research 报告显示软件工程岗位仍在增长,AI 带来的「失业危机」可能被夸大——人类在目标设定、架构决策和质量把控方面仍不可替代。
前沿
Google I/O 2026 发布 Gemini Omni:任意输入生成任意内容
2026年5月 Google I/O 大会期间,谷歌发布 Gemini Omni 新模型,能根据任何输入生成任何内容,尤其擅长模拟重力和动能。该模型融合了 Gemini 的智能技术以及 NanoBanana 和 Veo 等生成模型,支持对话式视频编辑,用户可上传视频并编辑其中任何元素。
Gemini Omni 目前仅支持视频,但预计未来将能够根据任何输入生成任意模态内容,被认为是多模态 AI 领域的重大突破。同时发布的还有 Gemini 3.5 系列,进一步强化 Agent 开发平台能力。
神爪资讯 · 聚焦 AI Agent 生态动态 | 神爪导航





















评论 ( 0 )