程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
编程
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
2026-05-17 10:21:56 +0800 CST
view 373
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
编程
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
2026-05-17 10:22:13 +0800 CST
view 352
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
DeepGEMM 深度解析:DeepSeek 开源的 FP8 GEMM 内核如何重塑 AI 推理性能边界
编程
DeepGEMM 深度解析:DeepSeek 开源的 FP8 GEMM 内核如何重塑 AI 推理性能边界
2026-04-21 05:16:09 +0800 CST
view 608
深入剖析 DeepSeek 开源的 DeepGEMM 库:从 FP8 精度革命到 1550 TFLOPS 性能突破,揭秘现代 AI 推理基础设施的底层优化技术
DeepGEMM
FP8
DeepSeek
CUDA
AI推理
GPU优化
GEMM
TensorCore
Newton 深度解析:NVIDIA、DeepMind、Disney 三巨头联手打造的 GPU 物理引擎——机器人仿真的下一个十年(2026 完全指南)
编程
Newton 深度解析:NVIDIA、DeepMind、Disney 三巨头联手打造的 GPU 物理引擎——机器人仿真的下一个十年(2026 完全指南)
2026-05-28 21:06:26 +0800 CST
view 276
Newton是由Disney Research、Google DeepMind和NVIDIA联合开发的开源GPU加速物理仿真引擎,支持多物理场仿真、可微分仿真和大规模并行RL训练。
Newton
NVIDIA Warp
物理仿真
机器人
GPU加速
MuJoCo
开源项目
PlayCanvas 深度实战:当浏览器遇上 WebGPU——从 WebGL 后时代到生产级 3D 游戏引擎的完全指南(2026)
编程
PlayCanvas 深度实战:当浏览器遇上 WebGPU——从 WebGL 后时代到生产级 3D 游戏引擎的完全指南(2026)
2026-06-09 16:51:07 +0800 CST
view 244
深入剖析 PlayCanvas 游戏引擎如何整合 WebGPU 技术,从 Compute Shader 粒子系统到 3D Gaussian Splatting 革命性渲染,带你掌握浏览器端 3D 游戏开发的最新技术栈。
WebGPU
PlayCanvas
3D游戏引擎
WebGL
Compute Shader
Gaussian Splatting
前端图形渲染
7.8K Star!GPT-Image-2 提示词宝库:120+ 精选案例涵盖肖像、海报、UI、角色设定
编程
7.8K Star!GPT-Image-2 提示词宝库:120+ 精选案例涵盖肖像、海报、UI、角色设定
2026-04-28 17:31:08 +0800 CST
view 494
GitHub 7.8K Star 的 GPT-Image-2 提示词宝库,收录120+精选案例,涵盖肖像、海报、UI原型、角色设定等,详解提示词编写技巧和实战示例。
AI绘图
GPT-Image-2
提示词工程
OpenAI
设计资源
GitHub
GPT-6 深度解析:当"土豆"成为 AGI 的最后一公里
编程
GPT-6 深度解析:当"土豆"成为 AGI 的最后一公里
2026-04-09 08:39:00 +0800 CST
view 522
OpenAI GPT-6 深度解析:代号Spud,Symphony原生多模态架构、5-6万亿MoE参数、200万Token上下文、双系统推理框架,定位AGI最后一公里。含核心技术解读、架构分析、代码示例。
AI
GPT-6
OpenAI
AGI
大模型
GPT-6「土豆」深度解析:当「交响乐」架构敲响AGI大门
编程
GPT-6「土豆」深度解析:当「交响乐」架构敲响AGI大门
2026-04-09 08:47:06 +0800 CST
view 749
深度解析OpenAI GPT-6代号「土豆」的技术突破:Symphony原生多模态统一架构、5-6万亿MoE参数、200万Token上下文窗口、System-2双系统推理引擎。探讨其对AI Agent生态的影响。约12000字。
GPT-6
OpenAI
AGI
Symphony
MoE
多模态
上下文窗口
System-2
Agent
英伟达 CUDA-Oxide 0.1 深度解析:用 Rust 编写 GPU 内核的破冰之旅
编程
英伟达 CUDA-Oxide 0.1 深度解析:用 Rust 编写 GPU 内核的破冰之旅
2026-05-10 08:20:42 +0800 CST
view 575
英伟达发布实验性Rust-to-CUDA编译器CUDA-Oxide 0.1,支持用Rust编写SIMT GPU内核并输出标准PTX中间代码。深度解析其架构设计、代码示例与未来展望。
CUDA-Oxide
Rust
GPU编程
NVIDIA
PTX
SIMT
并行计算
高性能计算
WebGPU + WebAssembly:2026年浏览器端到端高性能计算的完整实战指南
编程
WebGPU + WebAssembly:2026年浏览器端到端高性能计算的完整实战指南
2026-05-16 23:21:19 +0800 CST
view 371
深度解析WebGPU与WebAssembly协同计算,从底层原理到工程实战,涵盖渲染管线、并行计算、SIMD加速、零拷贝数据传输等核心技能
WebGPU
WebAssembly
前端
图形
性能优化
Rust
JavaScript
MoE架构深度实战:当模型参数突破万亿——从DeepSeek R2到GPT-5的稀疏激活革命(2026完全指南)
编程
MoE架构深度实战:当模型参数突破万亿——从DeepSeek R2到GPT-5的稀疏激活革命(2026完全指南)
2026-06-26 00:46:56 +0800 CST
view 9
2026年,大语言模型的参数量已经突破1.2万亿(DeepSeek R2),但推理时的计算量只相当于200亿参数的稠密模型。这背后的核心技术就是Mixture of Experts(MoE)架构。本文深度解析MoE的核心原理、工程实现、负载均衡策略,以及DeepSeek R2和GPT-5中的最新优化技巧。包含完整的PyTorch代码实战,从零实现MoE层。
MoE架构
混合专家
DeepSeek R2
稀疏激活
门控网络
负载均衡
大模型推理
细粒度MoE
共享专家
GPT-5
GPT-Image-2深度解析:让AI先思考再画图,一句话生成专业级视觉内容
编程
GPT-Image-2深度解析:让AI先思考再画图,一句话生成专业级视觉内容
2026-04-23 15:54:58 +0800 CST
view 354
2026年4月22日OpenAI发布GPT-Image-2,以1512分登顶Arena.AI图像榜单,断层领先第二名Google Nano-banana-2达242分。它是全球首个具备思考能力的图像生成模型:联网搜索+规划布局+自我复核,三步智能流水线让AI先想后画。
GPT-Image-2
OpenAI
图像生成
AI绘图
自回归模型
Arena评测
bpftime for GPU 深度实战:将 eBPF 带进 GPU Kernel 内部——从 PTX 级插桩到线程级可观测性的全链路架构解析
编程
bpftime for GPU 深度实战:将 eBPF 带进 GPU Kernel 内部——从 PTX 级插桩到线程级可观测性的全链路架构解析
2026-05-07 10:07:31 +0800 CST
view 377
深入解析 bpftime for GPU 如何将 eBPF 的可编程观测能力带入 GPU Kernel 内部,实现 PTX 级插桩、per-thread 粒度观测和零拷贝数据回传,为 AI 训练和高性能计算提供全新的调试与分析范式。
eBPF
GPU
CUDA
PTX
可观测性
性能优化
FastGPT:27.2K Star零代码构建企业级AI知识库,可视化工作流+多模态文档一站搞定
编程
FastGPT:27.2K Star零代码构建企业级AI知识库,可视化工作流+多模态文档一站搞定
2026-04-16 19:06:53 +0800 CST
view 657
FastGPT是环界云团队开源的AI知识库问答系统(27.2K Stars),零代码构建私有知识库,支持可视化工作流编排和多模态文档解析,支持GPT/Claude等任意LLM模型。
AI
知识库
FastGPT
RAG
开源
LLM
工作流
Dify
GPT-5.5 深度实战:从原生全模态到 Agent 原生训练——OpenAI 两亿美元重跑预训练的架构解密与生产级调用完全指南(2026)
编程
GPT-5.5 深度实战:从原生全模态到 Agent 原生训练——OpenAI 两亿美元重跑预训练的架构解密与生产级调用完全指南(2026)
2026-05-31 08:51:02 +0800 CST
view 270
全面解密GPT-5.5三大核心技术突破:原生全模态架构、硬件协同设计、Agent原生训练目标。从架构原理到API调用,涵盖性能基准、成本分析、安全评估与生产级部署最佳实践。
GPT-5.5
OpenAI
AI大模型
Agent
API
Headroom 深度实战:当上下文压缩成为 AI Agent 的刚需基础设施——从 60% 到 95% 的 token 削减、CCR 可逆压缩与跨 Agent 记忆的生产级完全指南(2026)
编程
Headroom 深度实战:当上下文压缩成为 AI Agent 的刚需基础设施——从 60% 到 95% 的 token 削减、CCR 可逆压缩与跨 Agent 记忆的生产级完全指南(2026)
2026-06-19 03:55:30 +0800 CST
view 116
Headroom 深度实战指南:从架构、代码实战到性能优化,详解如何用上下文压缩把 AI Agent 的 token 成本砍掉 60%-95%。
Headroom
Context Compression
AI Agent
MCP
Token Optimization
Headroom 深度实战:当 AI Agent 的上下文压缩层省下 95% Token——从 ContentRouter 智能路由到 CCR 可逆压缩、从 Claude Code 到 MCP 的生产级完全指南(2026)
编程
Headroom 深度实战:当 AI Agent 的上下文压缩层省下 95% Token——从 ContentRouter 智能路由到 CCR 可逆压缩、从 Claude Code 到 MCP 的生产级完全指南(2026)
2026-06-20 06:24:34 +0800 CST
view 147
Headroom 是 AI Agent 的上下文压缩层,通过 ContentRouter、SmartCrusher、CodeCompressor、Kompress-base 与 CCR 可逆压缩,在 LLM 接收前削减 60–95% token。本文从架构、算法、代码实战到生产落地,提供完整指南。
Headroom
AI Agent
Context Compression
MCP
Token Optimization
Context-Mode 深度实战:当 AI 编程成本暴涨到让人肉疼——MCP 插件用沙盒隔离将 Token 消耗砍掉 98%
编程
Context-Mode 深度实战:当 AI 编程成本暴涨到让人肉疼——MCP 插件用沙盒隔离将 Token 消耗砍掉 98%
2026-06-16 09:22:57 +0800 CST
view 229
Context-Mode 是一个登顶 GitHub 和 Hacker News 的开源 MCP 插件,通过沙盒隔离、语义检索、Think in Code 三大核心机制,将 AI 编程的 Token 消耗降低 98%,连续编程时间从 30 分钟拉到 3 小时。本文从架构设计、代码实战、多平台接入到性能优化,全面拆解这个被 24 万开发者采用的项目。
MCP
AI编程
Token优化
Context-Mode
开源项目
上下文管理
OpenAI Codex 史诗级更新深度解析:当 AI 终于拿到了鼠标,编程世界的终局来了
编程
OpenAI Codex 史诗级更新深度解析:当 AI 终于拿到了鼠标,编程世界的终局来了
2026-04-19 06:13:22 +0800 CST
view 991
2026年4月OpenAI Codex重大更新深度解析:AI代理首次获得操作电脑能力,支持Mac桌面应用操作、多智能体并行、长期任务调度、图像生成与记忆学习,从代码助手进化为真正的自主编程代理。
AI编程
Codex
OpenAI
编程代理
开发者工具
OpenAI Skills 深度实战:当 AI 编程助手学会「技能插件」——从 openai/skills 标准到生产级 Codex 技能开发的完全指南(2026)
编程
OpenAI Skills 深度实战:当 AI 编程助手学会「技能插件」——从 openai/skills 标准到生产级 Codex 技能开发的完全指南(2026)
2026-06-10 23:17:29 +0800 CST
view 495
深入拆解openai/skills的设计哲学、技术架构和生产实践,包含10个必装Skills、完整自定义Skill开发流程和团队协作方案。
AI
编程
Codex
Skills
openai
Codex剪辑Skills:一句话剪视频,Agent自动化口播成片全流程
编程
Codex剪辑Skills:一句话剪视频,Agent自动化口播成片全流程
2026-06-22 08:00:14 +0800 CST
view 114
chengfeng-videocut-skills是2000+Star开源剪辑Skill包,接入Codex/Claude Code后五步完成口播成片:剪口播→分镜→修改→预览→合成MP4。基于rough.js手绘动画+HyperFrames HTML渲染,免费开源。
视频剪辑
Codex
Agent
开源
口播视频
自动化
HyperFrames
HTML动画
rough.js
从"盯着AI写代码"到"管理AI团队工作":OpenAI Symphony 如何定义AI智能体的工程化编排
编程
从"盯着AI写代码"到"管理AI团队工作":OpenAI Symphony 如何定义AI智能体的工程化编排
2026-05-11 11:24:58 +0800 CST
view 378
OpenAI 发布 Symphony 开源规范,连接 Linear 任务追踪与 Codex AI 智能体,实现多 Agent 并行编排、隔离工作空间、CI 自动触发、PR 自动管理的工程闭环。本文解析四大核心组件、SPEC.md 规范、Elixir/OTP 参考实现。
OpenAI Symphony,AI智能体编排,Linear集成,Codex,多Agent协作,Elixir OTP,PR管理,CI/CD自动化
Context-Mode 深度拆解:AI 编程代理的上下文救星——98% 压缩比背后的技术革命
编程
Context-Mode 深度拆解:AI 编程代理的上下文救星——98% 压缩比背后的技术革命
2026-05-02 08:05:40 +0800 CST
view 616
深度拆解 GitHub Trending 开源项目 Context-Mode:通过沙箱隔离、会话连续性、代码思维和输出压缩四维度,实现 AI 编程代理上下文窗口 98% 压缩,支持 14 个平台
AI编程
上下文优化
MCP
Context-Mode
AI Agent
75.4K Star!OpenAI Codex 开源:从"帮你写代码"到"帮你干完活"
编程
75.4K Star!OpenAI Codex 开源:从"帮你写代码"到"帮你干完活"
2026-04-21 07:45:08 +0800 CST
view 449
OpenAI开源Codex CLI编程Agent,75.4K Star,多Agent并行MCP工具链Skills系统,从代码补全进化到自主完成开发任务
开源
OpenAI
Codex
AI编程
Agent
GitHub
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
5
6
...
45
下一页