程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
DuckDB 深度实战:从零构建高性能数据分析引擎,嵌入式 OLAP 的终极指南
编程
DuckDB 深度实战:从零构建高性能数据分析引擎,嵌入式 OLAP 的终极指南
2026-04-27 18:23:00 +0800 CST
view 394
DuckDB 深度解析:从架构设计到代码实战,全面剖析这款嵌入式分析型数据库的核心原理、性能优化技巧和生产环境实践。
DuckDB
嵌入式数据库
OLAP
数据分析
SQL
Python
列式存储
向量化执行
MCP 协议深度实战:AI Agent 的万能连接器——从架构设计到生产级 Server 开发的全链路解析
编程
MCP 协议深度实战:AI Agent 的万能连接器——从架构设计到生产级 Server 开发的全链路解析
2026-05-08 14:38:40 +0800 CST
view 363
深入剖析 Anthropic 开源的 Model Context Protocol(MCP)协议,从设计哲学到架构细节,从协议握手到生产级 Server 开发实战,配完整 Python 代码示例。
MCP
Model Context Protocol
JSON-RPC 2.0
AI Agent
AI编程
FastMCP
工具协议
Python
Anthropic
Claude
连接器
Trae 3.0 深度实战:字节跳动 AI 原生 IDE 的双智能体架构、SOLO 全自动开发与 MCP 生态——从 Workflow 到 Agentic Loop 的架构演进完全指南(2026)
编程
Trae 3.0 深度实战:字节跳动 AI 原生 IDE 的双智能体架构、SOLO 全自动开发与 MCP 生态——从 Workflow 到 Agentic Loop 的架构演进完全指南(2026)
2026-05-31 06:13:14 +0800 CST
view 935
Trae 3.0 深度解析:双智能体架构设计、Agentic Loop 演进、SOLO 全自动开发模式、CUE 智能预测引擎、MCP 生态集成,从架构原理到全栈项目实战的完全指南
Trae
AI编程
IDE
Agent
MCP
字节跳动
Cursor
SOLO
DuckDB Quack 协议深度实战:从嵌入式分析到分布式多写者的架构进化
编程
DuckDB Quack 协议深度实战:从嵌入式分析到分布式多写者的架构进化
2026-05-22 06:50:01 +0800 CST
view 369
DuckDB Quack 协议让嵌入式分析数据库支持多并发写入的客户端-服务器模式,从协议架构、实战部署、性能调优到生产级高可用设计的完整指南
DuckDB
Quack
数据库
OLAP
Arrow
数据分析
微软 Build 2026 全景拆解:从MAI-Thinking-1零蒸馏推理到MXC安全沙箱,Agent优先时代的七款自研模型+量子芯片深度技术指南(2026)
编程
微软 Build 2026 全景拆解:从MAI-Thinking-1零蒸馏推理到MXC安全沙箱,Agent优先时代的七款自研模型+量子芯片深度技术指南(2026)
2026-06-10 07:15:42 +0800 CST
view 143
微软Build 2026开发者大会全景技术拆解:MAI-Thinking-1稀疏MoE架构、MAI-Code-1-Flash代码生成、Scout多智能体、MXC内核级安全沙箱、Project Solara Agent Shell、Majorana 2量子芯片,从模型层到硬件层的完整分析
微软
Build 2026
MAI模型
GitHub Copilot
Agent
MXC
Project Solara
量子计算
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
编程
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
2026-05-17 10:21:56 +0800 CST
view 360
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
编程
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
2026-05-17 10:22:13 +0800 CST
view 322
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
DFlash 深度解析:块扩散模型如何让 LLM 推理加速 6 倍——2026 投机解码完全指南
编程
DFlash 深度解析:块扩散模型如何让 LLM 推理加速 6 倍——2026 投机解码完全指南
2026-05-28 19:39:07 +0800 CST
view 347
深入解析 DFlash 块扩散投机解码方案:如何让 Qwen3-8B 实现 6 倍无损加速,超越 EAGLE-3 与 llama.cpp,附 SGLang/vLLM/MLX 完整部署指南。
LLM推理
投机解码
块扩散
DFlash
推理加速
Transformer优化
GPU
CUDA
SGLang
vLLM
LLM 推理的显存战争:从 PagedAttention 到统一内存架构——KV Cache 管理五世代深度解析(2026)
编程
LLM 推理的显存战争:从 PagedAttention 到统一内存架构——KV Cache 管理五世代深度解析(2026)
2026-06-15 11:18:23 +0800 CST
view 132
深度解析大模型推理中 KV Cache 管理的五世代演进:从连续分配到 PagedAttention,再到异构缓存、分布式 KV 和统一混合内存架构。结合 vLLM、SGLang、TensorRT-LLM 给出生产环境选型指南。
LLM
大模型
KVCache
PagedAttention
vLLM
SGLang
TensorRT
推理优化
显存管理
分布式
SGLang vs vLLM:2026年大模型推理框架深度对比与选型指南
编程
SGLang vs vLLM:2026年大模型推理框架深度对比与选型指南
2026-04-08 15:51:53 +0800 CST
view 1480
深度对比SGLang与vLLM两大LLM推理框架,从架构设计、核心原理、性能实测、适用场景多维度解析,附2026年选型建议
LLM
SGLang
vLLM
推理优化
大模型
DiffusionGemma 深度实战:当文本生成告别逐字蹦字——从离散扩散到 1100 tokens/s 的生产级完全指南(2026)
编程
DiffusionGemma 深度实战:当文本生成告别逐字蹦字——从离散扩散到 1100 tokens/s 的生产级完全指南(2026)
2026-06-16 07:18:07 +0800 CST
view 94
Google DeepMind 开源 DiffusionGemma 离散文本扩散模型深度实战:从并行去噪原理到 1100 tokens/s 推理,完整代码示例与 Agent 构建
DiffusionGemma
文本扩散
离散扩散
LLM
开源模型
Google DeepMind
Google LangExtract 深度解析:从混乱文本到结构化数据的工程化实践
编程
Google LangExtract 深度解析:从混乱文本到结构化数据的工程化实践
2026-04-29 01:09:56 +0800 CST
view 402
深度解析Google开源的LangExtract库:基于LLM的结构化信息提取框架,精确来源定位、交互可视化、零微调部署。从架构设计到代码实战,全面剖析21k+ Star背后的技术内核。
LangExtract
Google
信息提取
LLM
结构化数据
Python
开源
Google LangExtract 深度解析:从非结构化文本到结构化知识的工程化桥梁——零微调实现 100% 可溯源的信息提取
编程
Google LangExtract 深度解析:从非结构化文本到结构化知识的工程化桥梁——零微调实现 100% 可溯源的信息提取
2026-05-09 16:13:25 +0800 CST
view 304
2026年4月Google开源LangExtract,一个基于LLM的结构化信息提取框架。核心创新:字符级溯源(Source Grounding)实现100%可验证提取,零微调只需3-5个示例即可适配任何领域。本文深入解析其技术架构、长文档处理策略、医疗/法律/金融实战应用及生产部署最佳实践。
LangExtract
LLM
信息提取
结构化数据
医疗AI
RAG
Google开源
DiffusionGemma 深度实战:当 Google 用「扩散」颠覆自回归——从离散文本扩散原理到 MoE 架构、本地推理加速与生产级部署的完全指南(2026)
编程
DiffusionGemma 深度实战:当 Google 用「扩散」颠覆自回归——从离散文本扩散原理到 MoE 架构、本地推理加速与生产级部署的完全指南(2026)
2026-06-16 18:52:52 +0800 CST
view 146
Google DeepMind联合NVIDIA发布DiffusionGemma——基于离散文本扩散的实验性开源模型。本文深入解读26B MoE架构、双向注意力机制、本地推理4倍加速原理,附完整代码示例和部署实战。
Google
DiffusionGemma
扩散模型
MoE
开源LLM
本地推理
AI推理加速
DFlash 深度实战:块扩散模型如何实现 6 倍无损加速——从自回归瓶颈到并行生成的范式跃迁
编程
DFlash 深度实战:块扩散模型如何实现 6 倍无损加速——从自回归瓶颈到并行生成的范式跃迁
2026-05-23 11:16:44 +0800 CST
view 266
深度解析UC San Diego Z Lab提出的DFlash(Block Diffusion for Flash Speculative Decoding),详解块扩散草稿模型如何突破自回归瓶颈,在Qwen3-8B上实现6倍无损加速的架构原理、训练方法与生产级实战代码
LLM推理,投机解码,块扩散模型,大模型加速,DFlash,Speculative Decoding,UC San Diego,PyTorch,深度学习,AI推理优化
Google LangExtract 深度实战:从非结构化文本到结构化知识的工程化完全指南(2026)
编程
Google LangExtract 深度实战:从非结构化文本到结构化知识的工程化完全指南(2026)
2026-05-24 13:30:29 +0800 CST
view 240
Google LangExtract 深度实战:从非结构化文本到结构化知识的工程化完全指南,涵盖架构分析、代码实战、性能优化。
LangExtract
LLM
结构化提取
Google
Python
Go 1.27 test2json新增OutputType:CI终于能区分测试日志和报错了
编程
Go 1.27 test2json新增OutputType:CI终于能区分测试日志和报错了
2026-05-23 07:18:39 +0800 CST
view 213
Go 1.27为test2json新增OutputType字段,通过控制字符标记协议区分t.Log普通输出和t.Error错误输出,CI系统终于能准确提取测试失败摘要,完全向后兼容。
Go语言
Go1.27
testing
test2json
CI
工程实践
持续集成
Go应用中使用MongoDB客户端库mongo-driver
编程
Go应用中使用MongoDB客户端库mongo-driver
2024-11-18 21:53:37 +0800 CST
view 1844
本文介绍了如何在Go应用中使用MongoDB客户端库mongo-driver,包括安装、连接、基本的CRUD操作、索引管理、聚合操作和事务支持。通过代码示例,展示了如何高效地与MongoDB进行交互,适用于各种应用场景。
编程
数据库
Go语言
MongoDB
开发
LLM推理引擎终极对决:vLLM vs TensorRT-LLM深度解析与2026生产环境选型指南
编程
LLM推理引擎终极对决:vLLM vs TensorRT-LLM深度解析与2026生产环境选型指南
2026-04-20 13:45:31 +0800 CST
view 533
深度对比vLLM与TensorRT-LLM两大LLM推理框架,从PagedAttention到Kernel Fusion,从量化技术到生产部署,助你做出正确的技术选型决策
LLM
vLLM
TensorRT-LLM
推理优化
大模型部署
量化技术
AI工程
2026大模型推理框架年度横评:vLLM/TGI/TensorRT-LLM/DeepSpeed-MII 架构深度解析与生产级选型指南
编程
2026大模型推理框架年度横评:vLLM/TGI/TensorRT-LLM/DeepSpeed-MII 架构深度解析与生产级选型指南
2026-06-18 17:54:54 +0800 CST
view 75
深度横评2026年四大主流大模型推理框架,涵盖PagedAttention架构、ContinuousBatching、算子融合、FP8量化、NVMe卸载等核心技术,配实测数据与生产级选型指南
大模型
LLM
推理框架
vLLM
TensorRT-LLM
TGI
DeepSpeed
GPU推理
AI部署
NVIDIA
TensorRT-LLM 深度实战:从 Blackwell 架构到 INT4 量化的 LLM 推理性能革命
编程
TensorRT-LLM 深度实战:从 Blackwell 架构到 INT4 量化的 LLM 推理性能革命
2026-05-22 06:19:51 +0800 CST
view 343
深入解析TensorRT-LLM推理框架,从Paged KV Cache、连续批处理到INT4/INT8/FP8量化实战,覆盖Blackwell架构适配、Triton部署与K8s生产方案
TensorRT-LLM
LLM推理
量化
INT4
Blackwell
GPU优化
Eino 深度实战:Go 语言 LLM 应用开发的组件化革命——从架构哲学到生产级 Agent 构建的完全指南(2026)
编程
Eino 深度实战:Go 语言 LLM 应用开发的组件化革命——从架构哲学到生产级 Agent 构建的完全指南(2026)
2026-06-04 15:49:45 +0800 CST
view 238
Eino是字节跳动CloudWeGo团队开源的Go语言LLM应用开发框架,本文从架构设计到代码实战,完整讲解组件化设计、Chain/Graph编排、Tool Calling、RAG、Memory、可观测性及生产级部署
Go
Eino
LLM
CloudWeGo
AI Agent
RAG
组件化框架
Xlgo:基于 Go + Gin 的轻量级 Web 开发框架,提供完整后端基础设施
编程
Xlgo:基于 Go + Gin 的轻量级 Web 开发框架,提供完整后端基础设施
2026-06-17 09:25:26 +0800 CST
view 73
Xlgo是基于Go+Gin的轻量级Web开发框架,提供完整后端基础设施:配置热更新、MySQL读写分离、Redis分布式缓存、JWT认证、分布式锁、限流、SSE/WebSocket、定时任务、统一错误码等,v2.1.0已发布。
Xlgo
Go
Gin
Web框架
后端开发
开源
GORM
Redis
JWT
分布式锁
Go 1.26 深度解析:Green Tea GC 默认启用与 new(expr) 语法革命
编程
Go 1.26 深度解析:Green Tea GC 默认启用与 new(expr) 语法革命
2026-05-12 09:43:33 +0800 CST
view 310
深度解析Go 1.26核心新特性:new(expr)语法革命、Green Tea GC默认启用(GC停顿降低65%)、goroutine泄漏检测实验功能、泛型递归约束改进、go fix现代化重构。附性能Benchmark与升级指南。
Go
Go1.26
GreenTeaGC
垃圾回收
泛型
goroutine
性能优化
编译器
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
12
13
14
15
16
...
44
下一页