腾讯混元 Hy3 preview 开源：295B 参数、推理提效 40%，姚顺雨首秀交卷-程序员茄子

资讯腾讯混元 Hy3 preview 开源：295B 参数、推理提效 40%，姚顺雨首秀交卷

2026-04-23 21:18:45 +0800 CST views 822

2026年4月23日，腾讯正式发布并开源新一代大模型——混元 Hy3 preview。这是混元体系重建后的首个旗舰版本，也是姚顺雨掌舵混元后首次对外亮相的模型成果。

开源地址：https://github.com/Tencent-Hunyuan/Hy3-preview

一句话定位

总参数 295B、激活参数 21B 的 MoE 大模型，支持 256K 超长上下文，推理效率提升 40%，API 最低 1.2 元/百万 tokens——姚顺雨交出的这份答卷，瞄准的是"高性价比旗舰"这张牌。

核心能力表现

复杂推理：接近 GPT-5.4 级别

Hy3 preview 在多个权威推理基准上表现亮眼：

基准	得分	对比
FrontierScience-Olympiad	70.0	超过 GLM-5、Kimi-K2.5，接近 GPT-5.4
IMO Answer Bench	84.3	超过 GLM-5、Kimi-K2.5
清华求真书院数学博士资格考试	88.4	国内最高，显著高于 GLM-5、Kimi-K2.5
CHSBO 2025 生物竞赛	87.8	领先多数开源模型，接近 GPT-5.4

清华求真书院数学博士资格考试 88.4 分是目前国内模型的最高纪录，这个成绩足以让 Hy3 preview 在数学推理领域站稳第一梯队。

代码与 Agent：最明显的提升方向

代码和 Agent 能力是本次升级幅度最大的板块：

基准	得分	位置
Hy-Backend（后端工程任务）	54.7	超过 GLM-5 和 Kimi-K2.5
SWE-Bench Verified	74.4%	逼近 GLM-5、Kimi-K2.5
Terminal-Bench 2.0	54.4%	进入第一梯队
BrowseComp	67.1%	接近 GLM-5 与 Kimi-K2.5
WideSearch	70.2%	超过 GLM-5

在 Agent 综合评测中，Hy3 preview 以约 56 分的综合得分显著高于上一代 Hy2（约 35 分），已进入当前主流 Agent 模型的竞争区，与 GLM-5、Kimi-K2.5 所在区间接近。

实测：逻辑推理稳过"陷阱题"

评测中让模型回答了两个经典的"陷阱题"：

"我要去洗车，洗车的地方离家就 100 米，我是开车去呢，还是走着去呢？"
"父亲和母亲可以结婚吗？"

Hy3 preview 成功绕过了文字陷阱，准确理解了两个问题的真实意图。对洗车问题，模型还幽默地补充了"代驾取车"的例外情况，展现了不错的常识推理能力。

在代码生成实测中，SVG 绘制 Xbox 360 控制器、3D 精灵球 HTML 交互页面等任务表现中规中矩，存在空间坐标和前端渲染精度上的不足。模型在代码框架构建和基本意图理解上展现潜力，但在复杂交互渲染方面仍有提升空间。

财务分析能力则相对亮眼：将腾讯 2023-2025 三年财报输入模型后，能准确提取核心财务数据、呈现同比趋势、生成收入结构对比图——对于需要快速处理结构化数据的办公场景，这是一个很实用的能力。

技术架构

Hy3 preview 采用快慢思考融合的混合专家（MoE）架构，总参数 295B，激活参数 21B。相比单纯堆参数，这条路更像是在"聪明的效率"和"可接受的推理成本"之间找平衡。

支持最长 256K 上下文，在长文本、复杂 Agent 任务中依然保持成本可控。

推理效率与定价

本次升级的核心卖点之一：推理效率提升 40%，价格进一步下探。

上下文范围	输入价格	命中缓存	输出价格
0-16K	1.2 元/百万 tokens	0.4 元	4 元
16K-256K	2 元/百万 tokens	—	8 元

腾讯云还推出了 Token 套餐，Lite 版月费 28 元含约 3500 万 tokens，折合单 Token 成本更低。对于需要持续运行的 Agent 应用，这种梯度套餐设计非常友好。

落地情况

Hy3 preview 已率先接入腾讯多条核心产品线：

腾讯云
元宝
ima（知识库）
CodeBuddy
WorkBuddy
QQ

同时支持接入主流开源智能体产品，包括 OpenClaw、OpenCode、KiloCode 等，并已上架腾讯云大模型服务平台 TokenHub。

大模型神仙打架，Hy3 能否杀出重围？

就在 Hy3 preview 发布前后短短几天，国内外大模型赛道密集动作：

Anthropic 发布 Claude Opus 4.7
阿里发布 Qwen3.6-Max-Preview
月之暗面 发布并开源 Kimi K2.6
小米 MiMo 大模型家族一次性官宣 4 款新模型
DeepSeek V4 有望本周内发布

姚顺雨给 Hy3 的定位是"全面实用性"——模型的价值不在榜单，而在复杂场景中的可用性。这个思路在 Hy2 到 Hy3 的进化路径上体现得很清晰：从堆参数到打磨推理、代码、Agent 等真实场景下的能力。

从目前已在腾讯内部多条业务线"跑起来"的实际情况来看，Hy3 preview 正在用实际反馈反向推动模型迭代。这或许是腾讯在这一轮大模型竞争中，重新找到节奏的一个信号。

开源地址：https://github.com/Tencent-Hunyuan/Hy3-preview

相关标签：腾讯混元、姚顺雨、Hy3、MoE大模型、开源模型、大模型评测

复制全文生成海报人工智能大模型腾讯开源 MoE 推理代码生成 Agent 云计算

推荐文章

里程碑！AI Agent 现在可以自己注册账号、购买域名、部署上线了

2026-05-04 07:37:15 +0800 CST

PostgreSQL 19 深度解析：原生图查询、内核级 REPACK、异步 I/O——2026 年最值得关注的数据库版本

2026-05-14 01:43:40 +0800 CST

DeerFlow 2.0 深度解析：字节跳动如何让 AI 从"聊天"进化到"真正干活"

2026-05-11 13:22:57 +0800 CST

9个高级前端必会的性能优化 API，你掌握了几个？

2025-07-14 12:35:24 +0800 CST

Bun 1.3 深度实战：当 JavaScript 运行时进化为全栈操作系统——从内置 Redis/MySQL 到生产级全栈开发完全指南（2026）

2026-06-05 17:14:51 +0800 CST

PostgreSQL 18 深度拆解：当关系型数据库拥抱异步 I/O——从 io_uring 子系统、Skip Scan 到 uuidv7 与虚拟生成列的工程全貌（2026）

2026-07-19 05:13:17 +0800 CST

如何在 Vue3 中实现组件级别的 CSS 模块化？

2024-11-18 09:57:40 +0800 CST

MCP（Model Context Protocol）深度解析：AI Agent 的「USB-C 接口」如何重构智能体生态

2026-04-13 00:55:43 +0800 CST

Google LangExtract 深度实战：当 LLM 学会「精准定位」——从非结构化文本到结构化数据的完全指南（2026）

2026-06-09 16:19:31 +0800 CST

TypeScript 7 深度解析：Project Corsa 与 Go 语言重写的十倍性能革命

2026-05-12 11:49:21 +0800 CST

python `pop-conf`库用于管理配置信息

2024-11-18 10:55:43 +0800 CST

【开源】告别笨重！AI+答题新玩法：这款答题系统，让因材施教不再是空话

2026-07-03 13:07:08 +0800 CST

10 万条数据毫秒级前端模糊搜索方案

2025-08-15 11:58:14 +0800 CST

DeepSeek-TUI 深度解析：用 Rust 重塑终端 AI 编程体验——从双二进制架构到 1M 上下文的工程实践

2026-05-18 10:28:09 +0800 CST

deepcopy一个Go语言的深拷贝工具库

2024-11-18 18:17:40 +0800 CST

codebase-memory-mcp 深度实战：当 C 语言把代码库变成持久化知识图谱——从 Tree-sitter 解析到毫秒级查询、从 158 语言支持到 AI 编程代理全生态适配的生产级完全指南（2026）

2026-06-21 09:56:05 +0800 CST

Linux查看系统配置常用命令

2024-11-17 18:20:42 +0800 CST

FastAPI是一个现代、高性能的Pythonweb框架，旨在快速构建API

2024-11-18 18:50:26 +0800 CST

Cloudflare Workers 原生邮件服务深度解析：让 AI Agent 拥有真实身份的全链路实战

2026-04-20 09:48:39 +0800 CST

eBPF + Linux 6.18：当内核监控遇见「18倍性能革命」——从 LSM Hook 到 JIT 安全防护、从云原生监控到百万级事件处理的完整技术指南（2026）

2026-07-03 09:47:13 +0800 CST

20分钟页面不操作，页面失效-如何通过webworker实现页面失效功能

2024-11-19 08:41:26 +0800 CST

Bun.js 深度实战：当 Zig 遇上 JavaScriptCore——从「最快」到「全栈运行时」的生产级完全指南（2026）

2026-06-12 23:46:23 +0800 CST

TriAttention深度解析：MIT韩松团队如何用三角函数让单卡4090跑出百万Token上下文

2026-04-17 10:15:58 +0800 CST

使用 Go 语言并发处理 CSV 文件到数据库

2024-11-18 12:08:55 +0800 CST

electron-log是一个专为Electron应用设计的简单而强大的日志记录模块

2024-11-18 19:19:19 +0800 CST

PostgreSQL 18 深度解析：当异步 I/O 把数据库性能推进「3 倍时代」

2026-04-10 09:24:56 +0800 CST

AI编程工具大地震：从Claude Code桌面版重构到Cursor套壳风波，AI IDE的好戏才刚开始

2026-04-17 08:44:49 +0800 CST

NVIDIA Vera CPU 深度实战：首款 Agentic AI 原生 CPU 架构解析（2026）

2026-06-18 16:29:37 +0800 CST

OpenWolf：为Claude Code打造第二大脑，节省80% Token消耗的开源神器

2026-05-09 07:18:49 +0800 CST

Redis 8.8 深度解析：全新 Array 数据结构、窗口计数器限流、Streams NACK——性能暴涨 83% 背后的架构革命

2026-06-30 08:43:38 +0800 CST

使用 Vue3、Shadcn UI、Vite、TypeScript 和 Monorepo 构建的现代 vue 管理面板。等多种 UI 的中后台系统框架

2024-11-18 18:53:38 +0800 CST

WiFi DensePose 深度解析：用普通路由器实现穿墙人体感知——无线电波如何重构智能感知的底层逻辑

2026-05-19 11:46:58 +0800 CST

万字深度解析 Headroom：当 AI Agent 遇见上下文压缩革命——从 Token 成本黑洞到 CCR 可逆存储的完整技术指南（2026）

2026-07-03 02:14:09 +0800 CST

筛完 1400+ Skills，这 5 个让 Claude Code 效率提升 3 倍

2026-06-04 12:50:22 +0800 CST

MySQL 9.0 vs MariaDB 12：当开源数据库走到「终局博弈」——从协议战争到云原生架构的技术抉择完全指南

2026-06-13 14:46:54 +0800 CST

Go 1.26 深度实战：Green Tea GC、new(expr)、Secret 模式与生产级迁移全链路解析

2026-05-09 07:37:34 +0800 CST

WebAssembly Component Model 深度实战：当 Wasm 终于能像乐高一样拼装——从 WIT 接口、wasm-tools 组合到 WASI 0.3 多语言运行时生产级完全指南

2026-07-12 03:14:51 +0800 CST

三省六部制遇上AI：edict 如何用唐代官制重构 Multi-Agent 编排系统

2026-05-23 04:46:02 +0800 CST

mysql时间对比

2024-11-18 14:35:19 +0800 CST

异步时代的错误处理：超越 try-catch 的 Promise.try

2025-08-15 15:54:24 +0800 CST

windows下升级node引发的一系列问题

2024-11-17 18:45:16 +0800 CST

RTK（Rust Token Killer）：7 万 Star 工具专砍 AI 编程上下文浪费

2026-07-12 09:07:27 +0800 CST

pgrust 深度实战：当 PostgreSQL 被 Rust 重写——100% 回归测试通过，分析负载快 300 倍

2026-07-14 08:14:56 +0800 CST

nginx通过设置配置获取post的数据请求

2024-11-19 03:54:05 +0800 CST

NATS 深度实战：当云原生遇到了「零延迟」消息引擎——从 Pub/Sub 到 JetStream 持久化、从边缘计算到 AI 推理总线的生产级完全指南（2026）

2026-06-21 10:55:40 +0800 CST

2024年网站建设、维护与优化：SEO的重要性解析

2024-11-17 04:38:45 +0800 CST

Google ADK 2.0 深度解析：从单 Agent 到多智能体协作，Google 交出了怎样的工程化答卷？

2026-07-10 14:46:35 +0800 CST

Vue3中的watch和watchEffect有什么区别？

2024-11-19 06:37:32 +0800 CST

5 种替代 if-else 的实用 JavaScript 优化技巧，让代码更简洁可维护

2025-08-15 12:32:53 +0800 CST

Toasty：Tokio 团队打造的 Rust 异步 ORM 新星，重新定义数据库交互范式

2026-04-29 09:11:21 +0800 CST

资讯 腾讯混元 Hy3 preview 开源：295B 参数、推理提效 40%，姚顺雨首秀交卷