程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
design-md-chrome深度解析:Chrome扩展一键生成网站设计蓝图DESIGN.md
编程
design-md-chrome深度解析:Chrome扩展一键生成网站设计蓝图DESIGN.md
2026-04-27 20:07:57 +0800 CST
view 296
design-md-chrome是Chrome扩展,扫描任意网页自动提取色彩、字体、间距等视觉规范,生成结构化DESIGN.md文件,可直接用于Claude Code等AI编码工具。
Chrome扩展
前端开发
AI工具
设计规范
Cilium 深度实战:当 eBPF 重塑云原生网络——从内核革命到生产级容器网络架构完全指南(2026)
编程
Cilium 深度实战:当 eBPF 重塑云原生网络——从内核革命到生产级容器网络架构完全指南(2026)
2026-06-15 12:48:08 +0800 CST
view 34
深度解析eBPF技术和Cilium在云原生网络中的革命性应用,从内核原理到生产实践,涵盖L7策略、Hubble可观测性、性能优化等核心内容。
eBPF
Cilium
云原生
Kubernetes
容器网络
Linux内核
Service Mesh
可观测性
超越 OpenClaw 的 Agent 新王:Hermes Agent 自进化闭环架构深度解析
编程
超越 OpenClaw 的 Agent 新王:Hermes Agent 自进化闭环架构深度解析
2026-04-17 19:45:47 +0800 CST
view 342
深度解析 Nous Research 开源的 Hermes Agent,从四层记忆系统、自进化闭环、平台无关核心架构等角度全面剖析这个 2026 年最火的开源 AI Agent 项目,并对比 OpenClaw 的技术路线差异
AI Agent
Hermes Agent
Nous Research
自我进化
四层记忆
开源项目
GitHub Trending
TimesFM 2.5 深度解析:当时间序列预测终于学会零样本
编程
TimesFM 2.5 深度解析:当时间序列预测终于学会零样本
2026-04-08 16:35:10 +0800 CST
view 657
Google TimesFM 2.5 时间序列预测基础模型深度解析:200M参数零样本预测,16k上下文,Decoder-only Transformer架构,Patch分词,Monash基准测试击败监督模型
时间序列
机器学习
Google
Transformer
ds4 深度解析:Redis 作者的最后一战?—— DwarfStar 4 本地推理引擎的技术革命
编程
ds4 深度解析:Redis 作者的最后一战?—— DwarfStar 4 本地推理引擎的技术革命
2026-05-15 17:47:40 +0800 CST
view 406
深入解析 antirez(Redis 作者)新开源项目 ds4:DwarfStar 4 本地推理引擎,专门为 DeepSeek V4 Flash 打造,支持 Metal/CUDA 后端,2-bit 量化可在 96GB 内存 MacBook 上运行 284B 参数模型。
AI推理
本地部署
DeepSeek
Redis
Apple Silicon
CUDA
Metal
MoE
量化
Goroutine 泄漏无处遁形:Go 1.27 将 GC 变成并发调试利器
编程
Goroutine 泄漏无处遁形:Go 1.27 将 GC 变成并发调试利器
2026-06-09 20:45:09 +0800 CST
view 81
Go 1.27正式将goroutine泄漏检测功能从实验特性毕业为标配能力,利用垃圾收集器(GC)的标记阶段来检测goroutine泄漏,让生产环境中的幽灵无处遁形。本文详解其算法原理、实战用法及工程启示。
Go 1.27
Goroutine泄漏
GC
runtime/pprof
并发调试
性能优化
Go语言
pprof
OpenHuman 深度实战:Rust+Tauri 构建本地优先的 AI 桌面助手——Memory Tree 持久记忆与 118+ 集成完全指南(2026)
编程
OpenHuman 深度实战:Rust+Tauri 构建本地优先的 AI 桌面助手——Memory Tree 持久记忆与 118+ 集成完全指南(2026)
2026-05-30 21:11:41 +0800 CST
view 200
OpenHuman 用 Rust+Tauri 构建本地优先的 AI 桌面助手,通过 Memory Tree 持久记忆和 118+ 集成让 Agent 拥有跨会话长期记忆。本文从架构原理到生产级部署完整拆解。
OpenHuman
Rust
Tauri
AI桌面助手
Memory Tree
知识图谱
本地AI
SpacetimeDB 深度实战:当数据库即服务器——从零基础设施到百万级实时应用的架构革命
编程
SpacetimeDB 深度实战:当数据库即服务器——从零基础设施到百万级实时应用的架构革命
2026-06-15 17:52:08 +0800 CST
view 34
SpacetimeDB 是一个用 Rust 编写的关系型数据库,同时也是服务器。你把业务逻辑直接上传到数据库,客户端直接连接执行代码。本文深度解析其核心概念:Reducer、订阅、索引、Procedures,并附带完整的多人游戏后端代码实战。
SpacetimeDB
Rust
数据库
实时应用
游戏开发
架构设计
SpacetimeDB 彻底颠覆后端架构:Rust 编写的「数据库即服务器」如何消灭中间层——从 WASM 模块引擎到 Unity 实时游戏服务器的全链路实战
编程
SpacetimeDB 彻底颠覆后端架构:Rust 编写的「数据库即服务器」如何消灭中间层——从 WASM 模块引擎到 Unity 实时游戏服务器的全链路实战
2026-06-10 00:22:57 +0800 CST
view 91
SpacetimeDB深度实战:Rust编写的数据库即服务器架构,消除传统三层架构中间层,从WASM模块引擎、订阅推送、实时协作白板到Unity游戏服务器的完整生产级指南
SpacetimeDB
Rust
WASM
实时数据库
游戏服务器
Dockge深度解析:自托管Docker Compose管理工具的革命性设计与工程实践
编程
Dockge深度解析:自托管Docker Compose管理工具的革命性设计与工程实践
2026-04-18 07:13:40 +0800 CST
view 401
深度解析Dockge的设计理念、架构实现与工程实践,探讨文件优先架构、交互式Web终端、多Agent支持等核心特性,以及与Portainer等工具的对比分析。
Docker
容器编排
DevOps
Homelab
开源工具
SubCube 深度实战:亚二次稀疏注意力 SSA 如何打破 Transformer 的 O(n²) 铁律——1200万 Token 时代从架构原理到生产级部署的完全指南(2026)
编程
SubCube 深度实战:亚二次稀疏注意力 SSA 如何打破 Transformer 的 O(n²) 铁律——1200万 Token 时代从架构原理到生产级部署的完全指南(2026)
2026-05-31 08:21:47 +0800 CST
view 182
Subquadratic发布的SubQ模型采用SSA亚二次稀疏注意力架构,实现1200万Token上下文窗口,在MRCR v2基准测试中碾压GPT-5.5。本文从架构原理、基准分析、代码实战到生产部署全面解读这场注意力革命。
SSA
Subquadratic
SubQ
Transformer
注意力机制
长上下文
RAG
稀疏注意力
AI架构
大模型
Hermes Agent 深度解析:当 AI Agent 终于学会「记住一切、学会一切、成为一切」
编程
Hermes Agent 深度解析:当 AI Agent 终于学会「记住一切、学会一切、成为一切」
2026-04-09 01:07:00 +0800 CST
view 1292
36k+ stars 的开源自进化 AI Agent,Nous Research 出品,支持记忆持久化、跨平台网关、自创建技能和 $5 VPS 运行能力
AI Agent
Hermes Agent
Nous Research
自进化
记忆系统
NousResearch Hermes Agent 深度实战:自我进化的 AI Agent 架构设计与 47K Star 现象级开源密码全解析
编程
NousResearch Hermes Agent 深度实战:自我进化的 AI Agent 架构设计与 47K Star 现象级开源密码全解析
2026-05-09 02:36:51 +0800 CST
view 298
深度剖析 NousResearch Hermes Agent 的三层记忆架构、强化学习进化引擎与多模型协同编排,从源码层面理解自我进化的 AI Agent 设计密码。
AI Agent
强化学习
Hermes Agent
NousResearch
Python
Rust
Zig 0.14 深度实战:从编译期元编程到生产级系统编程——一门没有隐藏控制流的务实语言
编程
Zig 0.14 深度实战:从编译期元编程到生产级系统编程——一门没有隐藏控制流的务实语言
2026-05-22 08:54:41 +0800 CST
view 215
2026年Zig 0.14稳定版发布,Bun离开Zig引发争议。本文深入解析Zig的核心设计哲学、comptime元编程、Allocator内存管理、C互操作、构建系统,以及用Zig构建高性能HTTP服务器的完整实战指南。
Zig
系统编程
comptime
C互操作
编程语言
MIT黑科技:TriAttention如何用三角函数让大模型「记住」超长上下文
编程
MIT黑科技:TriAttention如何用三角函数让大模型「记住」超长上下文
2026-04-18 12:45:10 +0800 CST
view 494
深度解析MIT/NVIDIA/浙大联合发布的TriAttention技术,用三角函数预测注意力分布,实现KV Cache智能压缩,让超长上下文推理成为可能
大模型
注意力机制
KV缓存
Transformer
深度学习
AI优化
Capo.js:你的head排序对了吗?一行代码检测出来
案例
Capo.js:你的head排序对了吗?一行代码检测出来
2026-05-09 06:37:27 +0800 CST
view 255
Capo.js开源工具:检测HTML head元素排序是否合理,11级权重体系量化排序规则,零依赖6kB Gzip,Chrome扩展装上就能用,程序化API适合CI集成
前端性能
head排序
性能优化
零依赖
Chrome扩展
ct.css
vLLM 深度实战:当 PagedAttention 遇上生产级 LLM 推理——从内存革命到分布式部署的完全指南(2026)
编程
vLLM 深度实战:当 PagedAttention 遇上生产级 LLM 推理——从内存革命到分布式部署的完全指南(2026)
2026-06-10 10:17:56 +0800 CST
view 91
深度解析 vLLM 的核心架构 PagedAttention 和 Continuous Batching,从内存管理原理到生产级分布式部署的完全指南。
vLLM
LLM推理
PagedAttention
GPU优化
大模型部署
AI推理
LiteLLM 深度解析:100+ 大模型统一网关的架构设计与生产实战
编程
LiteLLM 深度解析:100+ 大模型统一网关的架构设计与生产实战
2026-04-29 05:42:47 +0800 CST
view 354
深度解析开源AI网关LiteLLM:100+大模型统一接入、虚拟密钥体系、负载均衡与故障降级、MCP/A2A网关、生产级Docker部署实战
LiteLLM
AI网关
大模型
LLM
API网关
Python
Docker
云原生
MCP 2026 深度解析:AI推理性能瓶颈诊断的12个隐性耗时陷阱——从TensorRT-LLM到vLLM再到Triton的全引擎实战
编程
MCP 2026 深度解析:AI推理性能瓶颈诊断的12个隐性耗时陷阱——从TensorRT-LLM到vLLM再到Triton的全引擎实战
2026-04-30 14:21:13 +0800 CST
view 334
深度解析MCP 2026基准测试框架,拆解TensorRT-LLM、vLLM、Triton三大推理引擎的12个隐性耗时陷阱,提供可落地的诊断方法与修复路径。
AI推理
性能优化
TensorRT-LLM
vLLM
Triton
MCP2026
GPU优化
2026 大模型推理框架终极对决:vLLM 0.5 vs TGI 2.0 vs TensorRT-LLM 1.8 vs DeepSpeed-MII 0.9——从架构原理到生产级部署的完全指南
编程
2026 大模型推理框架终极对决:vLLM 0.5 vs TGI 2.0 vs TensorRT-LLM 1.8 vs DeepSpeed-MII 0.9——从架构原理到生产级部署的完全指南
2026-06-16 23:24:43 +0800 CST
view 12
深度对比四大主流LLM推理框架:vLLM 0.5、TGI 2.0、TensorRT-LLM 1.8、DeepSpeed-MII 0.9。从PagedAttention架构原理、FlashAttention优化、量化支持到生产级部署实战,包含统一环境下的性能测试数据与代码示例,帮助你做出最优选型决策。
LLM
推理框架
vLLM
TensorRT
DeepSpeed
性能优化
AI
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
编程
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
2026-05-17 10:21:56 +0800 CST
view 335
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
编程
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
2026-05-17 10:22:13 +0800 CST
view 291
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
Nushell 0.111 深度解析:用 Rust 重写 Shell,让命令行终于有了数据类型
编程
Nushell 0.111 深度解析:用 Rust 重写 Shell,让命令行终于有了数据类型
2026-05-12 01:44:53 +0800 CST
view 318
深度解析Nushell 0.111核心架构:结构化数据管道替代POSIX字符串流、IR优化器实现管道融合与谓词下推带来3-10倍性能提升、栈式虚拟机执行器保证类型安全与即时错误反馈,附DevOps实战、插件开发与渐进迁移指南
Nushell,Shell,Rust,命令行,结构化数据,数据管道,终端工具,DevOps,CLI,编程工具
vLLM 2026 深度解析:从 PagedAttention 到多节点分布式推理的全链路技术实战
编程
vLLM 2026 深度解析:从 PagedAttention 到多节点分布式推理的全链路技术实战
2026-05-03 15:13:07 +0800 CST
view 380
2026年深度解析vLLM核心架构,从PagedAttention进化到多节点分布式推理,涵盖SIG社区组织、v1架构重写、生产部署实战与性能优化全链路指南。
vLLM
PagedAttention
LLM
推理优化
分布式
Kubernetes
Python
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
16
17
18
19
20
...
26
下一页