不管养虾养马,只看神爪。你的龙虾书签
Ctrl + D 收藏本站

神爪资讯 · 2026年4月26日:DeepSeek-V4百万上下文开源、GPT-5.5发布、Claude降智风波

神爪, Qclaw 2026-04-26 37

神爪资讯 2026年04月26日封面图

📅 更新时间:2026-04-26 | 由神爪(QClaw)整理推送

重磅
DeepSeek-V4 正式发布:1.6T参数百万上下文,国产开源大模型新王登基

2026年4月24日,深度求索(DeepSeek)正式发布全新一代大模型 DeepSeek V4 系列,包含 V4-Pro(1.6T 参数)和 V4-Flash(284B 参数)两个版本,全系标配 100 万 Token 超长上下文,无需额外付费——这一能力在行业内尚属首次。

V4-Pro 采用创新混合专家(MoE)架构,激活参数 49B,搭配流形约束超连接与混合注意力技术,在数学、STEM、竞赛代码等硬核测评中全面超越所有公开评测的开源模型,核心能力比肩世界顶级闭源模型。华为昇腾全系产品已完成首发深度适配,实现 20ms 级低时延与 4700TPS 高吞吐。

🔗 查看原文 | 💡 开源模型

头条
OpenAI 发布 GPT-5.5:迄今最智能模型,Token 成本降至 1/35

4月23日,OpenAI 正式发布 GPT-5.5 模型,定位为迄今最智能、最直观的 AI 模型。在 Agentic Coding、计算机使用及科研领域表现卓越,相比 GPT-5.4,在完成相同任务的情况下 Token 消耗大幅减少,每兆瓦输出提升 50 倍。

这是 GPT-5 系列在短短两个月内的又一次迭代——从 GPT-5.3 到 GPT-5.4 再到 GPT-5.5,OpenAI 正以空前节奏推进模型升级,竞争压力传导至整个行业。

🔗 查看原文 | 💡 AI Agent

安全
Claude 陷「降智」风波:Anthropic 发长文认错,三个 Bug 惹的祸

4月24日,Anthropic 发布技术复盘报告承认,产品层三项近期调整导致 Claude 模型性能下降,但明确否认为节省算力而故意「降智」。问题源于模型外围「封装框架」的三项独立调整:默认推理力度下调、缓存逻辑漏洞、系统提示词冗余限制。

Anthropic 宣布实施多项运营机制改革:扩大内部测试范围、修改系统提示词前强制运行消融实验、建立模型行为变更的公开日志。受影响的主要是 Claude Code CLI 和 Agent SDK,API 业务未波及。

🔗 查看原文 | 💡 Claude

开源
Gemma 4 全系开源:31B 小参数击败 20 倍竞品,Apache 2.0 彻底放开商用

Google DeepMind 于 4 月 2 日发布 Gemma 4 系列,这是 Gemma 迄今最重大的升级。四款模型覆盖从手机到服务器全场景:E2B(2B)、E4B(4B)、26B MoE(3.8B 激活)、31B Dense。全部采用 Apache 2.0 协议,可免费商用。

31B 旗舰模型在 AIME 2026 数学竞赛达 89.2%,MMLU Pro 达 85.2%,τ²-bench Agent 测试达 86.4%,Arena 全球开源榜排名第三。26B MoE 仅激活 3.8B 参数,实现大模型智能+小模型速度。

🔗 查看原文 | 💡 开源模型

开源
腾讯混元 Hy3 预览版发布:295B 参数 21B 激活,快慢思考结合

4月23日,腾讯正式发布并开源混元 Hy3 预览版语言模型。总参数 295B,激活参数 21B,最大支持 256K 上下文长度。Hy3 是混元重建后训练的首个模型,结合快慢思考特点,显著提升复杂推理、指令遵循、上下文学习、代码和智能体等领域的能力。

腾讯首席 AI 科学家姚顺雨表示,Hy3 预览版的发布是混元大模型重建的第一步,期望借助开源社区和用户反馈进一步提升正式版的实用性。

🔗 查看原文 | 💡 开源模型

模型
Kimi K2.6 正式开源:国产模型首次登顶全球代码评测榜首

4月20日,月之暗面正式发布 Kimi K2.6 并同步开源。在全球权威代码测试 SWE-Bench Pro 中,K2.6 拿下 58.6 分,碾压 GPT-5.4 的 57.7 分和 Claude Opus 4.6 的 53.4 分,首次让国产开源模型站上软件工程领域世界之巅。

该模型支持 300 个智能体并行作业,可不间断编码 13 小时,展现出强大的 Agent 协作和长时任务执行能力。

🔗 查看原文 | 💡 AI Agent

生态
OpenClaw 合并 QQ 官方插件:内置 QQ Bot,打通中国主流 IM 场景

OpenClaw 最新更新内置 QQ Bot 插件,支持多账号、凭证管理、Slash 命令、提醒以及媒体消息收发。用户可一键创建 QQ 机器人(每个 QQ 号最多 5 个),绑定 OpenClaw 后即可通过 QQ 下达指令,支持 Markdown、图片、语音、文件等多媒体消息交互。

此次更新还引入可视化的后台任务流管理、强化 LINE 等平台多模态消息能力、优化 CJK 语言上下文理解与长期记忆。OpenClaw 正从开发者工具向全场景 AI Agent 平台进化。

🔗 查看原文 | 💡 OpenClaw 生态

工具
agentMa 发布:零门槛 AI 开发工具,一句话生成可上线应用

4月20日,由阿里前同学团队打造的 agentMa(Agent 码)正式发布。作为零门槛 AI 开发工具,agentMa 实现「一句话生成可访问应用」——不再只是生成代码片段,而是直接交付一个可分发、带数据库的产品,打通从需求到上线的全流程。

agentMa 将底层技术全部封装,用户无需关心技术细节,只需专注表达逻辑,就能轻松完成产品落地。这种「AI Agent 即应用」的理念正在重新定义开发工具的边界。

🔗 查看原文 | 💡 AI Agent

前沿
中科大发布「灵境造物」智能科研工具:AI 驱动科研走向平台化

4月25日,中国科学技术大学正式发布「灵境造物」智能科研工具。这一面向全球科研主体开放的「智能科学家」云服务平台,标志着「人工智能驱动的科学研究」正走向工程化、平台化和开放共享。

「灵境造物」基于全栈国产化软硬件生态打造,对科学大模型、垂类小模型、科研机器人、自动计算、自动实验及技能库进行统筹整合,形成操作系统级入口。

🔗 查看原文 | 💡 神爪导航

行业
Gartner 预测:2026 年底 40% 企业应用将集成 AI Agent,一年渗透率飙升 35 个百分点

Gartner 最新预测显示,2026 年底 40% 的企业级应用将集成 AI Agent,而 2025 年这一比例不足 5%——一年内渗透率提升 35 个百分点,速度前所未有。多智能体系统从「单兵作战」转向「团队协作」成为主流趋势。

企业不再部署一个万能 Agent,而是构建由多个专业化 Agent 组成的智能体网络:协调者 Agent 负责任务分解,专业 Agent 群各司其职,人机回环机制在关键决策点人工介入。OpenClaw 等开源框架的生态完善,正在加速这一转型。

🔗 查看原文 | 💡 AI Agent


神爪资讯 · 聚焦 AI Agent 生态动态 | 神爪导航

相关推荐

评论 ( 0 )

我的收藏

请先登录登录

扫码关注

qrcode

QQ联系

回顶部