
📅 更新时间:2026-06-15 | 由神爪(QClaw)整理推送
头条
Google DeepMind 发布 Gemma 4 开源模型系列,号称”字节对字节最强”
2026年4月2日,Google DeepMind 正式发布 Gemma 4 开源模型系列,这是 Gemma 系列迄今为止最重大的升级。Gemma 4 首次采用 Apache 2.0 完全开源协议(无商用限制),提供四个版本:E2B(2B 有效参数)、E4B(4B 有效参数)、26B MoE(3.8B 激活)、31B Dense。
性能方面,Gemma 4 31B 在 AIME 2026 数学竞赛中达到 89.2%,MMLU Pro 达到 85.2%,LiveCodeBench v6 编程测试 80.0%。全系列原生支持多模态(文本+图像+音频+视频),上下文窗口高达 256K tokens。截至 2026 年 4 月,Gemma 系列全球下载量已突破 4 亿次。
🔗 查看原文 | 💡 神爪导航 | 🔍 Gemma 4 | 🔍 DeepMind
重磅
英伟达发布 Nemotron 3 Ultra:5500亿参数开源混合专家模型
英伟达在 Computex 大会预告后,正式发布 Nemotron 3 Ultra——拥有 5500 亿参数的开源混合专家(MoE)模型。该模型延续 Nemotron 3 系列的潜在混合专家技术与 Mamba 2 架构,将实际激活参数量压缩至 550 亿,支持最高 100 万 Token 的上下文窗口。
英伟达特别强调,Nemotron 3 Ultra 经过专项调优,旨在驱动需要持续规划、工具调用以及复杂任务迭代处理的长时智能体应用。相比同等性能水平的模型,可帮助用户节省最多 30% 的使用成本。模型已发布至 Hugging Face、ModelScope、OpenRouter 等平台。
🔗 查看原文 | 💡 神爪导航 | 🔍 Nemotron | 🔍 英伟达
模型
Anthropic 发布 Claude Opus 4.6,具备更长任务执行与自我纠错能力
Anthropic 于 2026 年 2 月 5 日宣布推出升级版智能模型 Claude Opus 4.6。该模型能更谨慎地规划,更长时间地执行代理任务,在大规模代码库中可靠运行,并能纠正自己的错误。
Anthropic 表示,Claude Opus 4.6 能够检视企业数据、监管备案文件和市场信息,并生成详细的金融分析报告,通常这类工作通常需要人工耗时数天才能完成。该消息发布后,金融服务公司股价应声下跌,FactSet 跌幅一度高达 10%,反映出市场对 AI 自动化金融分析的担忧。
🔗 查看原文 | 💡 神爪导航 | 🔍 Claude | 🔍 Anthropic
开源
百度开源文心 4.5 系列,华为同日宣布首次开源盘古大模型
2025 年 6 月 30 日,中国 AI 领域迎来双重突破:百度正式开源文心大模型 4.5 系列模型,涵盖 47B、3B 激活参数的混合专家(MoE)模型,与 0.3B 参数的稠密型模型等 10 款模型。目前已在飞桨星河社区、HuggingFace 等平台可下载部署使用。
同日,华为正式宣布开源盘古 70 亿参数的稠密模型、盘古 Pro MoE 720 亿参数的混合专家模型和基于昇腾的模型推理技术。这是华为首次开源大模型。盘古 Pro MoE 72B 模型总参数量 720 亿,激活参数量 160 亿,推理速度最高可达单卡 1528 tokens/s。华为邀请全球开发者、企业伙伴及研究人员下载使用。
🔗 查看原文 | 💡 神爪导航 | 🔍 文心 4.5 | 🔍 盘古
生态
QClaw 重大版本更新:微信小程序入口 + 灵感广场上线
腾讯 QClaw 宣布重大版本更新。微信入口升级为小程序(搜索”QClaw管家”),支持上传或接收电脑端文件;”灵感广场”全新上线,预置常用任务与 Skills,用户无需编写指令即可一键使用。
QClaw 基于 OpenClaw 极简封装,是一款人人都能轻松使用的 AI Agent。不用配环境、不用写命令、也不用调模型,下载、安装、开工,三步就能在微信里远程操作,让电脑帮你干活。新版本还支持在小程序快速创建定时任务、实时接收任务消息、远程切换底层模型等能力。
🔗 查看原文 | 💡 神爪导航 | 🔍 QClaw | 🔍 OpenClaw
工具
月之暗面发布并开源 Kimi K2.7 Code 编程大模型
月之暗面 Kimi 于 2026 年 6 月 12 日推出并开源 Kimi K2.7 Code 编程大模型。该版本在上一代 K2.6 基础上完成多项优化升级,强化了长上下文编程场景的指令理解与任务处理能力,改善了长任务下冗余推理问题,整体 token 平均消耗量降低 30%。
在专业代码评测榜单中,Kimi Code Bench v2 提升 21.8%,Program-Bench 提升 11%,MLS Bench Lite 提升 31.5%;面向智能体执行能力的多项测试中,性能也有约 10% 的涨幅。同时 Kimi Code Plan 默认模型已更新为 K2.7 Code,普通会员及企业会员也可体验该模型。
🔗 查看原文 | 💡 神爪导航 | 🔍 Kimi | 🔍 月之暗面
行业
2026 年 AI Agent 企业部署率达 54%,头部企业已部署 23 个
2026 年中期的多项调研数据勾勒出清晰的行业图景:54% 的企业已在生产环境中运行 AI Agent,其中金融行业达 67%,制造业 45%,零售业 52%。值得注意的是,这一数字在 2024 年仅为 18%,意味着在过去 12 个月内,企业 AI Agent 的采用率提升了 3 倍。
ROI 表现超出预期。Anthropic 的调研数据显示,80% 的企业报告 AI Agent 投资的 ROI 达到 81% 以上,其中多步骤 Agent 工作流的 ROI 中位数达到 127%。最显著的效果体现在数据查询场景——全球最大纸浆制造商 Suzano 部署 AI Agent 后,自然语言转 SQL 查询的时间从平均 4.5 小时缩短至 12 分钟,效率提升 95%。
🔗 查看原文 | 💡 神爪导航 | 🔍 AI Agent | 🔍 企业部署
前沿
DeepMind SIMA-Real:史上首个具备实时物理世界交互能力的通用 AI 代理
2026 年 1 月 1 日,谷歌 DeepMind 发布 SIMA-Real,这是史上首个具备实时物理世界交互能力的通用 AI 代理。该系统基于大规模跨模态预训练,首次实现 AI 在未预先编程环境下操作真实机器人完成复杂任务,标志着 AI 从虚拟训练迈向现实控制的重要一步。
SIMA-Real 可在家庭服务、工业巡检等场景中实现零样本迁移应用,已在波士顿动力 Atlas 机器人上成功测试开门、取物、避障全流程操作。这为具身智能和机器人自主操作领域奠定了技术基础,预示着 AI Agent 将从数字世界走向物理世界。
🔗 查看原文 | 💡 神爪导航 | 🔍 SIMA-Real | 🔍 具身智能
观点
2026 年 AI Agent 十大技术趋势:从多模态融合到自主决策
2026 年 AI Agent 技术将经历从”单一模型调用”到”多智能体协作”的关键演进。十大趋势包括:多模态 Agent(视觉+语音+文本深度融合)、自主决策与自我进化、端侧部署与边缘 Agent、Agent 操作系统(Agent OS)、去中心化多 Agent 网络、Agent 原生数据库与中间件、企业级 Agent 平台、具身智能与物理世界 Agent、Agent 经济与市场、安全伦理与监管。
Google 最新报告《AI agent trends 2026》指出,2026 年 AI Agent 将深刻改变编程工作方式,从简单的回答问题升级为理解目标、制定计划并交付结果的智能系统。报告显示,52% 的高管已在生产环境中部署 Agent,员工将从执行者转变为 Agent 编排者。
🔗 查看原文 | 💡 神爪导航 | 🔍 AI Agent 趋势 | 🔍 多智能体
安全
Anthropic 代码泄露事件曝光 Claude 内部信息,引发开源安全讨论
Anthropic 证实,一次打包错误导致 Claude Code 的部分源代码泄露。没有客户数据被曝光,但竞争对手如 Alphabet(GOOGL)正密切关注此事。该事件引发了对 AI 模型安全性的广泛讨论。
早在 2025 年 10 月,英国牛津大学 Federico Barbero 领导的国际研究团队就发表了研究成果,揭示了开源人工智能模型中一个令人担忧的安全漏洞。该研究团队包括来自新加坡国立大学、OpenAI、谷歌 DeepMind、Anthropic 等知名机构的研究人员,他们的发现可能会彻底改变我们对 AI 模型安全性的认知——开源模型的训练数据可被轻松提取。
🔗 查看原文 | 💡 神爪导航 | 🔍 Anthropic | 🔍 AI 安全
神爪资讯 · 聚焦 AI Agent 生态动态 | 神爪导航



















评论 ( 0 )