Kimi K2.6 实测:Claude 1/6价格,原生多模态编码,能吃截图能迭代
月之暗面放出 K2.6 code preview,原生多模态 + Agent 能力 + 低价,国产模型难得的亮点组合
背景
上周,Kimi 放出了 K2.6 code preview,在海外开发者圈子里引起了一波讨论。
说实话,最近国产模型发布频率太高,有点测不过来。但 K2.6 的两个亮点让我决定亲自试一轮:
- 某些 Agent 工作流中,效果可与 Claude Opus 4.6 媲美,价格仅为 1/8
- 原生多模态模型——在国产模型中比较罕见
加上 Hermes Agent 团队官方夸赞了 K2.6 在 Tool Calling 和 Agentic loops 的表现,三个点凑在一起,值得真刀真枪跑一轮。
于是我把它挂进 OpenClaw 和 Hermes,跑了几个真实任务。
核心亮点
原生多模态
K2.6 和 Gemini 3 一样,是原生多模态模型。这意味着它原生支持图片、视频输入,不需要额外封装。
这对独立开发者来说有多重要?
做独立开发的人都懂:我们每天面对的从来不只是纯文本。截图、设计稿、录屏、报错弹窗、页面走查图——这些才是日常。
一个模型如果吃不了图、吃不了视频(录屏),就意味着需要中途切换模型。切一次,思路断一次。
所以,便宜 + 原生多模态 + Agent 能力,这几个点放在一起,是值得认真对待的组合。
实测体验
测试一:多页面网站复刻
任务:用 Figma 设计稿完整复刻一个网站。
说实话,这个在意料之内——全站、多页面、还带复杂组件的复刻任务想一把过精修,Claude Opus 也做不到。
但后续发现了一些惊喜:
好评一:K2.6 真的能吃反馈截图
把"当前效果 + 原件"一起丢给它,说"现在的效果不完整,你只完成了首页",它能直接识别并给出修改方案。
这种沟通方式,在不支持多模态的编程模型里,没法用——你只能把图里的东西翻译成文字。太累了。
好评二:能找到图里要修改的位置
圈了两个修改区域,告诉它修改要求。位置改对了,第五张卡片部分露出的效果没特别说明,它也自己实现了。
存疑:偶尔进程停滞
经过分析,发现是 OpenClaw 的一个 bug——用特定接口(openai/completions)打 K2.6 时,会自动把 tool call id 里的非字母数字部分去掉,导致下一轮调用时报错。
OpenClaw 最新版本已经修复了这个 bug(详见 GitHub Issue)。
测试二:Hermes 工作流
切换到 Hermes 测试,有两个原因:
- 想看 K2.6 离开 OpenClaw 之后还能不能打
- 验证模型在各种工具链里的稳定性
结果:在 Hermes 里同样能稳定跑通,工具链兼容性良好。
结论:适合谁用
几轮迭代下来,K2.6 磨到了"能用于精细打磨"的状态。
对独立开发者来说,这就够了。
我们写代码不需要追求一把过出完美成品——那是神仙。
我们真正需要的是:
一个能看懂截图、能听懂反馈、能多轮迭代的粗胚生成器。把前 90% 的活甩给它,最后一轮精修留给 Claude 或 Codex。
K2.6 的定位:便宜 + 多模态 + Agent 能力 = 独立开发者的日常编码搭档。
关键参数对比
| 指标 | Kimi K2.6 | Claude Opus 4.6 |
|---|---|---|
| 价格 | 较低 | 较高 |
| 价格比 | — | K2.6 约为 1/8 |
| 原生多模态 | ✅ | ✅ |
| Tool Calling | 良好(Hermes 官方认可) | ✅ |
| Agentic loops | 良好(Hermes 官方认可) | ✅ |
一句话总结
K2.6 的价值不在于单次任务打败最强模型,而在于它把"多模态理解 + Agent 工作流 + 低成本"三个东西同时做到了一起。对于每天需要和截图、设计稿、反馈图打交道的独立开发者,这是一个值得放进工具箱的选项。
适合场景:前端页面复刻、多轮迭代修改、日常编码辅助
不适合场景:超复杂全栈应用、需要一次出成品的精修任务