程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Kafka 告别 ZooKeeper:KRaft 模式深度实战——从架构原理到生产级集群部署完全指南
编程
Kafka 告别 ZooKeeper:KRaft 模式深度实战——从架构原理到生产级集群部署完全指南
2026-05-29 09:23:56 +0800 CST
view 232
2026年Kafka 3.8+全面成熟,KRaft模式成为唯一推荐的生产部署方式。本文从底层原理出发,深入解析KRaft如何替代ZooKeeper,涵盖架构设计、Raft协议实现、集群搭建、性能调优、Java客户端实战及ZK迁移全流程。
Kafka
KRaft
ZooKeeper
分布式
消息队列
ElasticSearch集群搭建指南
编程
ElasticSearch集群搭建指南
2024-11-19 02:31:21 +0800 CST
view 1439
本文介绍了搭建ElasticSearch集群的详细步骤,包括环境准备、节点配置、集群设置、节点角色分配及性能优化。确保硬件和软件环境符合要求,配置网络和安装包,修改配置文件以设置集群名称、节点角色等。启动服务后,通过API验证集群状态,并进行性能监控和日志分析,以确保集群的稳定性和可靠性。
搜索引擎
数据分析
分布式系统
编程
为什么要放弃UUID作为MySQL主键?
2024-11-18 23:33:07 +0800 CST
view 1750
本文探讨了在MySQL中使用UUID和雪花算法作为主键的优缺点。虽然UUID提供全球唯一性,但在存储空间、性能、排序和并发处理方面,雪花算法更具优势。雪花算法生成的ID为64位,节省存储空间,且在高并发环境下表现优异。最终,选择雪花算法作为主键是基于性能和数据库操作效率的考虑。
数据库设计
ID生成
性能优化
分布式系统
PostgreSQL 18 深度解析:3倍I/O提速与面向未来的内核级革新
编程
PostgreSQL 18 深度解析:3倍I/O提速与面向未来的内核级革新
2026-04-17 11:45:58 +0800 CST
view 362
深度解析 PostgreSQL 18 核心新特性:全新 I/O 子系统带来 3 倍读取性能提升,虚拟生成列、uuidv7()、OAuth 2.0 认证等重磅功能的技术原理与实战指南。
PostgreSQL
数据库
性能优化
I/O
分布式
WebShelf:Rust全栈生产级Admin系统,K8s一键部署+自动读写主从数据库
编程
WebShelf:Rust全栈生产级Admin系统,K8s一键部署+自动读写主从数据库
2026-06-20 15:46:36 +0800 CST
view 58
WebShelf 是生产就绪的 Rust 全栈框架,基于 Axum 后端 + Dioxus 前端(Web/Desktop/Mobile),内置 JWT 认证、PostgreSQL 读写分离、Redis 分布式锁/限流、K8s 一键部署和灰度发布能力。
Rust
Axum
Dioxus
全栈框架
Admin系统
开源
PostgreSQL
Redis
Kubernetes
分布式限流
JWT
SeaORM
Temporal 深度解析:分布式系统可靠执行的新范式,从工作流引擎到 AI Agent 时代的基础设施
编程
Temporal 深度解析:分布式系统可靠执行的新范式,从工作流引擎到 AI Agent 时代的基础设施
2026-05-15 15:46:16 +0800 CST
view 476
深入解析 Temporal 分布式工作流引擎的核心设计:Durable Execution、Workflow/Activity 架构、五大服务组件,以及 TypeScript/Go/Java 生态实战。特别探讨 Temporal 在 AI Agent 时代作为基础设施层的重要价值。
分布式系统
工作流
Temporal
Durable Execution
微服务
AI Agent
Go
TypeScript
iroh 1.0.0-rc.0 深度解析:Rust写就的模块化网络协议栈,四年磨一剑的P2P连接基础设施
编程
iroh 1.0.0-rc.0 深度解析:Rust写就的模块化网络协议栈,四年磨一剑的P2P连接基础设施
2026-05-15 16:27:10 +0800 CST
view 523
iroh 1.0.0-rc.0 是 Rust 写的模块化网络协议栈,历经四年 50+ 版本终于发布首个候选版本。本文深入解析其 Path 观察 API、多路径连接、NAT 穿透机制、API 设计哲学,并提供完整的 Echo 服务代码示例。
Rust
P2P
QUIC
网络协议
iroh
分布式系统
模块化
Temporal 深度解析:分布式持久化执行引擎如何终结微服务编排的地狱模式
编程
Temporal 深度解析:分布式持久化执行引擎如何终结微服务编排的地狱模式
2026-04-18 02:45:06 +0800 CST
view 537
深度解析Temporal持久化执行引擎的架构设计、事件溯源机制、Go SDK实战与生产调优,从微服务编排困境到分布式容错的全链路技术剖析
Temporal
分布式
微服务
Go
工作流引擎
RustFS 深度解析:当 MinIO 不再"开放",谁来接棒对象存储的未来?
编程
RustFS 深度解析:当 MinIO 不再"开放",谁来接棒对象存储的未来?
2026-04-08 19:32:41 +0800 CST
view 704
RustFS 深度技术解析:Rust 语言实现的高性能分布式对象存储系统,Apache 2.0 永久开源,支持二进制级替换 MinIO,4KB 对象性能提升 42%,内存占用仅 1/10。
Rust
对象存储
MinIO
分布式存储
云原生
事件溯源与CQRS深度实战:从状态存储到事件日志的架构革命
编程
事件溯源与CQRS深度实战:从状态存储到事件日志的架构革命
2026-05-09 03:05:57 +0800 CST
view 307
深入探讨事件溯源与CQRS架构模式的核心原理、实现方式与生产级实践,从状态存储到事件日志的架构革命
Event Sourcing
CQRS
架构设计
DDD
分布式系统
小米 MiMo UltraSpeed 深度解析:当 SWA 架构重塑 LLM 推理——从 O(n²) 困境到 1000 tokens/s 的极致跨越
编程
小米 MiMo UltraSpeed 深度解析:当 SWA 架构重塑 LLM 推理——从 O(n²) 困境到 1000 tokens/s 的极致跨越
2026-06-15 21:20:49 +0800 CST
view 105
深入解析小米MiMo UltraSpeed如何通过SWA架构在通用GPU上突破1000 tokens/s推理速度,从O(n²)困境到极致跨越的完整技术指南。
SWA
Sliding Window Attention
LLM推理
小米MiMo
推理优化
Transformer
PagedAttention
量化推理
端侧AI
vLLM 深度实战:当 PagedAttention 遇上生产级 LLM 推理——从内存革命到分布式部署的完全指南(2026)
编程
vLLM 深度实战:当 PagedAttention 遇上生产级 LLM 推理——从内存革命到分布式部署的完全指南(2026)
2026-06-10 10:17:56 +0800 CST
view 136
深度解析 vLLM 的核心架构 PagedAttention 和 Continuous Batching,从内存管理原理到生产级分布式部署的完全指南。
vLLM
LLM推理
PagedAttention
GPU优化
大模型部署
AI推理
Cloudflare 统一推理层深度实战:当一个API连通12家供应商70+模型——从AI Gateway到边缘智能体、从自动故障转移到多模态推理的生产级完全指南(2026)
编程
Cloudflare 统一推理层深度实战:当一个API连通12家供应商70+模型——从AI Gateway到边缘智能体、从自动故障转移到多模态推理的生产级完全指南(2026)
2026-06-22 04:23:24 +0800 CST
view 29
2026年4月Cloudflare发布统一推理层,一个API连通12家供应商70+模型。本文深度解析AI Gateway架构、边缘推理优化、多模态支持、智能体集成,附带完整代码示例,打造生产级AI应用。
Cloudflare
AI推理
边缘计算
AI Gateway
统一推理层
AI基础设施
Redis之父antirez亲自下场!为DeepSeek V4 Flash打造专属推理引擎,Mac上跑出468 token/s
案例
Redis之父antirez亲自下场!为DeepSeek V4 Flash打造专属推理引擎,Mac上跑出468 token/s
2026-05-10 08:40:22 +0800 CST
view 566
Redis之父antirez亲自下场!为DeepSeek V4 Flash打造专属推理引擎ds4.c,C+Metal从头编写,Mac Studio M3 Ultra上预填充468 token/s。关键优化:非对称量化(MoE专家层2-bit)、KV缓存搬硬盘、内置OpenAI/Anthropic双API。128GB Mac可跑,专为coding agent优化。
DeepSeek
AI推理
Mac
Redis
antirez
Metal
本地推理
MoE
GGUF
C语言
Apple Silicon
Claude Code
OpenAI API
Anthropic API
DiffusionGemma 深度实战:当 Google 用「扩散」颠覆自回归——从离散文本扩散原理到 MoE 架构、本地推理加速与生产级部署的完全指南(2026)
编程
DiffusionGemma 深度实战:当 Google 用「扩散」颠覆自回归——从离散文本扩散原理到 MoE 架构、本地推理加速与生产级部署的完全指南(2026)
2026-06-16 18:52:52 +0800 CST
view 182
Google DeepMind联合NVIDIA发布DiffusionGemma——基于离散文本扩散的实验性开源模型。本文深入解读26B MoE架构、双向注意力机制、本地推理4倍加速原理,附完整代码示例和部署实战。
Google
DiffusionGemma
扩散模型
MoE
开源LLM
本地推理
AI推理加速
DFlash 深度实战:块扩散模型如何实现 6 倍无损加速——从自回归瓶颈到并行生成的范式跃迁
编程
DFlash 深度实战:块扩散模型如何实现 6 倍无损加速——从自回归瓶颈到并行生成的范式跃迁
2026-05-23 11:16:44 +0800 CST
view 279
深度解析UC San Diego Z Lab提出的DFlash(Block Diffusion for Flash Speculative Decoding),详解块扩散草稿模型如何突破自回归瓶颈,在Qwen3-8B上实现6倍无损加速的架构原理、训练方法与生产级实战代码
LLM推理,投机解码,块扩散模型,大模型加速,DFlash,Speculative Decoding,UC San Diego,PyTorch,深度学习,AI推理优化
ds4 深度解析:当 Redis 之父用 C 语言手写 AI 推理引擎——从「窄而深」哲学到把 284B 模型塞进一台 MacBook 的技术全拆解
编程
ds4 深度解析:当 Redis 之父用 C 语言手写 AI 推理引擎——从「窄而深」哲学到把 284B 模型塞进一台 MacBook 的技术全拆解
2026-06-12 18:19:08 +0800 CST
view 188
深度解析 Redis 之父 antirez 最新开源项目 ds4(DwarfStar):一个纯 C 语言手写的 DeepSeek V4 Flash 本地推理引擎。从「窄而深」的工程哲学、非对称 2-bit 量化、磁盘 KV 缓存、Metal/CUDA 内核优化到实际部署,完整拆解这个 13K+ Star 项目的技术内幕。
AI推理引擎
DeepSeek
本地推理
系统编程
开源项目
C语言
vLLM 深度解析:LLM 推理性能的终极引擎——从 PagedAttention 到生产级部署的完整技术内幕
编程
vLLM 深度解析:LLM 推理性能的终极引擎——从 PagedAttention 到生产级部署的完整技术内幕
2026-05-18 08:22:35 +0800 CST
view 452
全面解析 vLLM 推理引擎的核心架构,从 PagedAttention 原理到生产级部署实战,涵盖量化推理、多GPU并行、性能调优等完整技术栈
vLLM
LLM推理
PagedAttention
GPU优化
量化推理
深度解析
2026大模型推理框架年度横评:vLLM/TGI/TensorRT-LLM/DeepSpeed-MII 架构深度解析与生产级选型指南
编程
2026大模型推理框架年度横评:vLLM/TGI/TensorRT-LLM/DeepSpeed-MII 架构深度解析与生产级选型指南
2026-06-18 17:54:54 +0800 CST
view 101
深度横评2026年四大主流大模型推理框架,涵盖PagedAttention架构、ContinuousBatching、算子融合、FP8量化、NVMe卸载等核心技术,配实测数据与生产级选型指南
大模型
LLM
推理框架
vLLM
TensorRT-LLM
TGI
DeepSpeed
GPU推理
AI部署
NVIDIA
Microsoft BitNet 深度实战:1比特大模型推理框架——让CPU跑起千亿参数模型的技术革命(2026完全指南)
编程
Microsoft BitNet 深度实战:1比特大模型推理框架——让CPU跑起千亿参数模型的技术革命(2026完全指南)
2026-05-26 12:35:43 +0800 CST
view 232
深入解析 Microsoft BitNet 1比特大模型推理框架,从原理到实战,让CPU跑起千亿参数模型。包含完整代码示例、性能优化策略和应用场景分析。
BitNet
模型量化
大模型推理
CPU推理
1-bit LLM
DFlash 深度解析:块扩散模型如何让 LLM 推理加速 6 倍——2026 投机解码完全指南
编程
DFlash 深度解析:块扩散模型如何让 LLM 推理加速 6 倍——2026 投机解码完全指南
2026-05-28 19:39:07 +0800 CST
view 363
深入解析 DFlash 块扩散投机解码方案:如何让 Qwen3-8B 实现 6 倍无损加速,超越 EAGLE-3 与 llama.cpp,附 SGLang/vLLM/MLX 完整部署指南。
LLM推理
投机解码
块扩散
DFlash
推理加速
Transformer优化
GPU
CUDA
SGLang
vLLM
Google AI Edge Gallery:手机离线跑大模型时代来了,2.2万Star端侧AI神器
案例
Google AI Edge Gallery:手机离线跑大模型时代来了,2.2万Star端侧AI神器
2026-05-09 07:36:45 +0800 CST
view 547
Google开源AI神器AI Edge Gallery斩获2.2万Star,支持iOS和Android手机离线运行Gemma 4等大模型,提供AI Chat、Ask Image、Audio Scribe、Agent Skills四大功能,消费级入口形态让普通用户轻松体验端侧AI
端侧AI
手机大模型
离线推理
Gemma 4
Google开源
iOS
Android
Headroom 深度实战:当 AI Agent 学会了「精打细算」——从 Token 成本黑洞到上下文压缩的底层原理、从 CCR 可逆存储到六大压缩算法的生产级完全指南(2026)
编程
Headroom 深度实战:当 AI Agent 学会了「精打细算」——从 Token 成本黑洞到上下文压缩的底层原理、从 CCR 可逆存储到六大压缩算法的生产级完全指南(2026)
2026-06-21 15:57:54 +0800 CST
view 29
深度解析开源项目 Headroom:AI Agent 的上下文压缩中间层,60-95% Token 节省,CCR 可逆存储,六大压缩算法完全指南。
AI编程
Token压缩
Headroom
上下文管理
LLM推理优化
AI Agent
BrickNet开源:AI玩乐高不再翻车,连接图让积木组装零误差
案例
BrickNet开源:AI玩乐高不再翻车,连接图让积木组装零误差
2026-05-09 07:38:19 +0800 CST
view 312
BrickNet开源项目:用连接图替代绝对坐标预测,解决AI乐高组装的误差累积问题。基于Qwen 3训练,标注五种连接器类型,使用32万+组装样本数据集,生成物理可行的分步组装程序,可直接用于机器人执行
AI乐高
连接图生成
3D组装
Qwen 3
结构推理
LDraw
机器人组装
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
5
...
7
下一页