程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
从140GB到4GB:AirLLM无量化层间推理原理深度剖析与生产级部署实战(2026)
编程
从140GB到4GB:AirLLM无量化层间推理原理深度剖析与生产级部署实战(2026)
2026-06-22 19:28:19 +0800 CST
view 20
深入解析 AirLLM 的无量化层间 Offloading 技术原理,探讨如何通过 CPU-GPU 混合推理在 4GB 显存上运行 70B 大模型,附完整代码实战与生产部署指南。
LLM推理
GPU优化
CPU Offload
层间调度
AirLLM
PyTorch
TriAttention深度解析:用三角函数革命性压缩KV Cache,让长推理从「显存地狱」中脱困
编程
TriAttention深度解析:用三角函数革命性压缩KV Cache,让长推理从「显存地狱」中脱困
2026-05-17 04:14:18 +0800 CST
view 295
深入解析MIT韩松团队提出的TriAttention方法,利用Pre-RoPE空间Q/K集中性和三角函数级数实现革命性的KV Cache压缩,在AIME25上以3072 KV budget达到与Full Attention持平的40.8%准确率,同时实现10.7倍KV显存压缩和2.5-6.3倍吞吐量提升。
LLM
KV Cache
TriAttention
MIT
英伟达
浙大
长推理
KV压缩
三角函数
RoPE
Attention优化
Chrome DevTools MCP 深度实战
编程
Chrome DevTools MCP 深度实战
2026-06-22 20:27:14 +0800 CST
view 15
Chrome DevTools MCP 深度实战指南
Chrome DevTools MCP
AI编程
MCP协议
【重制版】TriAttention深度解析:三角函数如何让长推理从显存地狱中脱困
编程
【重制版】TriAttention深度解析:三角函数如何让长推理从显存地狱中脱困
2026-05-17 04:14:33 +0800 CST
view 274
深入解析MIT韩松团队提出的TriAttention方法,利用Pre-RoPE空间Q/K集中性和三角函数级数实现革命性的KV Cache压缩,在AIME25上以3072 KV budget达到与Full Attention持平的40.8%准确率,同时实现10.7倍KV显存压缩和2.5-6.3倍吞吐量提升。
LLM
KV Cache
TriAttention
MIT
英伟达
浙大
长推理
KV压缩
三角函数
RoPE
Attention优化
CC Switch:45K Star 的 AI 大模型万能遥控器,让 100+模型说同一种语言
案例
CC Switch:45K Star 的 AI 大模型万能遥控器,让 100+模型说同一种语言
2026-05-01 15:33:28 +0800 CST
view 1179
GitHub 45K+ Star 的 CC Switch 是什么?详解这款大模型万能遥控器的核心功能、与 One API 的区别、以及如何配合 OpenClaw 使用。
CC Switch
AI工具
大模型
OpenClaw
Claude Code
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
编程
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
2026-05-11 10:53:54 +0800 CST
view 378
DeepSeek-V4-Pro 以 1.6T 总参数、49B 激活参数的 MoE 架构,原生支持 100 万 token 上下文,同时将推理算力降至 V3.2 的 27%、KV Cache 降至 10%。本文深度解析 CSA/HCA 混合注意力机制、mHC 流形约束超连接、KV Cache 极致优化、Muon 优化器等核心技术创新,以及如何在 Ollama、vLLM、官方 API 三种方式下部署运行。
DeepSeek-V4,MoE架构,CSA注意力,HCA注意力,KV Cache,1M上下文,长文本推理,开源大模型
Hermes Agent 深度解析:自进化智能体的工程架构与 Skill 生成机制
编程
Hermes Agent 深度解析:自进化智能体的工程架构与 Skill 生成机制
2026-04-12 05:23:08 +0800 CST
view 1092
深入解析 Hermes Agent 的自进化智能体架构:从 Skill 自动生成引擎、三层记忆系统、Tool Router 到 Platform Bridge,源码级别剖析 + 代码示例,对比 OpenClaw
AI Agent
Hermes Agent
Nous Research
自进化
智能体
Skill生成
Memory Hub
Tool Router
MonkeyCode:免费开云端开发环境,手机也能写代码提GitHub,长亭科技推出的在线AI开发平台
编程
MonkeyCode:免费开云端开发环境,手机也能写代码提GitHub,长亭科技推出的在线AI开发平台
2026-06-17 12:58:35 +0800 CST
view 101
MonkeyCode是长亭科技推出的企业级在线AI开发平台,免费开云端开发环境,手机端也能编程和提GitHub,支持GLM 5.1/Kimi 2.6/GPT-5.5等多模型,内置技能库,开源在GitHub。
MonkeyCode
长亭科技
AI开发平台
云端开发
在线编程
手机编程
开源
Chaitin
云端IDE
PyCharm 2026.1 调试器架构大重构:debugpy 上位、PEP 669 原生支持、asyncio 调试不再崩溃——一次迟到五年的工程救赎
编程
PyCharm 2026.1 调试器架构大重构:debugpy 上位、PEP 669 原生支持、asyncio 调试不再崩溃——一次迟到五年的工程救赎
2026-04-12 06:24:24 +0800 CST
view 531
深入解析 PyCharm 2026.1 的调试器架构重构:debugpy 替代 sys.settrace、PEP 669 低影响监控 API、asyncio 全链路调试、Docker/云端统一调试方案、uv 远程解释器、AI 开放平台 ACP Registry 与 BYOK 战略,以及 Python 3.13 自由线程模式适配。
PyCharm
Python
debugpy
PEP 669
asyncio
IDE
调试器
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
编程
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
2026-05-17 10:21:56 +0800 CST
view 367
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
编程
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
2026-05-17 10:22:13 +0800 CST
view 332
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
CloakBrowser 深度实战:当反爬虫遇见隐身浏览器——从 Chromium 底层 C++ 指纹篡改到完美绕过 Cloudflare、reCAPTCHA v3 与生产级自动化爬虫的完全指南(2026)
编程
CloakBrowser 深度实战:当反爬虫遇见隐身浏览器——从 Chromium 底层 C++ 指纹篡改到完美绕过 Cloudflare、reCAPTCHA v3 与生产级自动化爬虫的完全指南(2026)
2026-06-17 14:54:00 +0800 CST
view 149
深度解析 CloakBrowser——从 C++ 源码层修改 Chromium 指纹的隐身浏览器,30/30 检测全过,reCAPTCHA v3 评分 0.9,完整生产级爬虫代码示例
CloakBrowser
反爬虫
浏览器指纹
Chromium
Playwright
自动化爬虫
Rust
Apache Doris 4.1 深度拆解:当实时数仓长出 AI 大脑——从向量检索到统一数据底座的全链路技术实战
编程
Apache Doris 4.1 深度拆解:当实时数仓长出 AI 大脑——从向量检索到统一数据底座的全链路技术实战
2026-05-02 10:33:28 +0800 CST
view 399
深入拆解Apache Doris 4.1的技术内核:从FE/BE架构到存算分离、从原生向量检索到混合搜索、从RAG实战到生产部署,全方位解析实时数仓如何演化为AI时代统一数据底座
Apache Doris
向量检索
实时数仓
RAG
存算分离
OLAP
AI数据库
Kimi K2.6 开源了!还附送了 300 个 Agent 员工?
编程
Kimi K2.6 开源了!还附送了 300 个 Agent 员工?
2026-04-21 07:57:28 +0800 CST
view 518
Kimi K2.6开源发布,SWE-Bench Pro 58.6分超越GPT-5.4和Claude Opus 4.6,300个子Agent并行4000步骤持续5天
Kimi
开源
AI编程
Agent
月之暗面
SWE-Bench
大模型
AI-Scientist-v2 深度实战:当AI学会自己做科研——从Agentic Tree Search到Workshop-Level论文全自动生成(2026)
编程
AI-Scientist-v2 深度实战:当AI学会自己做科研——从Agentic Tree Search到Workshop-Level论文全自动生成(2026)
2026-06-12 20:20:27 +0800 CST
view 154
2026年3月,AI生成的论文登上了Nature。本文深度拆解The AI Scientist-v2系统,从Agentic Tree Search算法到端到端智能体架构,结合代码实战,完整讲解AI自主做科研的技术全貌。
AI科研
自动化科研
AI-Scientist
Agentic Tree Search
科研自动化
告别"辅助驾驶":GPT-5-Codex如何用动态思考重新定义AI编程
编程
告别"辅助驾驶":GPT-5-Codex如何用动态思考重新定义AI编程
2026-05-11 19:45:54 +0800 CST
view 392
GPT-5-Codex突破性引入Dynamic Thinking机制,简单任务节省93.7%token,复杂任务可自主工作7小时以上。深度解析核心技术架构与SWE-Bench表现,及其对开发者工作方式的根本性改变。
GPT-5-Codex
OpenAI
AI编程
Dynamic Thinking
Codex
SWE-Bench
自主编程
Agent
Chrome DevTools MCP 深度实战:当 Model Context Protocol 打通 AI 与浏览器的最后一公里
编程
Chrome DevTools MCP 深度实战:当 Model Context Protocol 打通 AI 与浏览器的最后一公里
2026-06-17 20:58:22 +0800 CST
view 110
深入剖析 Chrome DevTools MCP 架构设计、核心工具矩阵、生产级实战代码,探讨 MCP 协议如何让 AI 编程助手直接操控浏览器。
Chrome DevTools
MCP
AI编程
浏览器自动化
CDP
前端开发
AI Scientist-v2 深度解析:当人工智能学会「从零开始做科研」——Agentic Tree Search 如何改写科学发现的游戏规则
编程
AI Scientist-v2 深度解析:当人工智能学会「从零开始做科研」——Agentic Tree Search 如何改写科学发现的游戏规则
2026-04-12 15:55:06 +0800 CST
view 701
AI Scientist-v2 由 Sakana AI 联合牛津大学等机构研发,于 2026 年正式发表于 Nature,首次实现端到端科研自动化。其核心创新 Agentic Tree Search 让 AI 在 ML 领域生成论文通过 ICLR Workshop 双盲评审,获 6.33 分高于 55% 人类投稿。本文全面解析其系统架构、核心算法与未来方向。
AI Scientist
Sakana AI
Agentic Tree Search
科研自动化
AI Agent
LLM
Nature
开源Chrome插件一键扒光网站设计:自动提取配色/字体/间距,生成AI可读的SKILL.md
编程
开源Chrome插件一键扒光网站设计:自动提取配色/字体/间距,生成AI可读的SKILL.md
2026-04-21 09:02:26 +0800 CST
view 450
design-md-chrome:Chrome插件一键提取网站设计规范(字体/配色/间距/阴影/动画),生成DESIGN.md或SKILL.md喂给Claude Code/Cursor复刻
开源
Chrome插件
设计工具
AI编程
前端
设计系统
Claude Code
Cursor
花3块钱、2小时训练一个64M的"小破模型",能干啥?
编程
花3块钱、2小时训练一个64M的"小破模型",能干啥?
2026-04-21 09:05:56 +0800 CST
view 370
MiniMind:从零手写完整LLM训练流水线,64M参数,2小时+3块钱训练完成,支持预训练+SFT+RLHF+工具调用,适合Multi-Agent/自动化/端侧集成
开源
LLM
PyTorch
模型训练
MiniMind
AI
工具调用
RLHF
CloakBrowser 深度解析:49 个 C++ 补丁如何把 Chromium 变成「数字变色龙」——从源码级指纹篡改到 30/30 全通过的隐身浏览器架构内幕
编程
CloakBrowser 深度解析:49 个 C++ 补丁如何把 Chromium 变成「数字变色龙」——从源码级指纹篡改到 30/30 全通过的隐身浏览器架构内幕
2026-05-17 16:15:05 +0800 CST
view 376
深度解析 CloakBrowser 如何在 Chromium C++ 源码层打 49 个补丁,从根本上重写浏览器指纹信息,实现 30/30 检测全通过的反爬绕过方案。
CloakBrowser
Chromium
反爬虫
浏览器指纹
Playwright
Puppeteer
Python
Archon 深度解析:当 AI 编码进入「工程化 Harness」时代——首个开源工作流引擎如何让 AI 编程从玄学变科学
编程
Archon 深度解析:当 AI 编码进入「工程化 Harness」时代——首个开源工作流引擎如何让 AI 编程从玄学变科学
2026-04-12 18:54:54 +0800 CST
view 432
Archon 是 GitHub 本周 16.7k 星的热门项目,首个开源 AI 编码 Harness 构建器。本文深度解析其设计理念、架构实现、核心特性,以及如何用 YAML 工作流让 AI 编程从玄学变科学。
AI编程
Archon
Claude Code
工作流引擎
编程工具
YAML
CSS 2026 新特性深度解析:从锚点定位到瀑布流布局,前端开发迎来纯 CSS 解决方案时代
编程
CSS 2026 新特性深度解析:从锚点定位到瀑布流布局,前端开发迎来纯 CSS 解决方案时代
2026-04-21 10:51:18 +0800 CST
view 496
深度解析 CSS 2026 核心新特性:锚点定位彻底替代 Popper.js、原生瀑布流布局告别 JavaScript 库、滚动驱动动画实现零 JS 滚动效果。包含完整代码示例、性能对比和浏览器兼容性方案。
CSS
前端
Web开发
Anchor Positioning
Masonry
Scroll Animation
Kimi K2.6 开源:12小时连续编码,300个Agent并行,4000次工具调用
编程
Kimi K2.6 开源:12小时连续编码,300个Agent并行,4000次工具调用
2026-04-21 11:06:57 +0800 CST
view 511
Kimi K2.6 开源版发布:SWE-Bench Pro 58.6,多项榜单压GPT-5.4和Claude Opus 4.6,支持300个并行sub-agent、12小时持续编码、4000次工具调用,开源SOTA位置稳固
Kimi
K2.6
开源
SWE-Bench
Agent
Swarm
长程编码
AI编程
模型开源
HuggingFace
Moonshot
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
11
12
13
14
15
...
17
下一页