程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Rust在前端工具链的崛起:2026年生态全景深度实战
编程
Rust在前端工具链的崛起:2026年生态全景深度实战
2026-05-22 00:49:39 +0800 CST
view 54
从Rolldown到Oxc,从Rspack到Turbopack,Rust编写的前端工具正在全面超越JavaScript方案。本文深度解析Rust工具生态。
Rust
前端工具链
性能优化
Rspack
Turbopack
Rolldown
Oxc
PostgreSQL 19 Parallel Autovacuum:从单线程清理到并行革命的深度技术剖析
编程
PostgreSQL 19 Parallel Autovacuum:从单线程清理到并行革命的深度技术剖析
2026-05-16 13:50:16 +0800 CST
view 84
深入剖析PostgreSQL 19的Parallel Autovacuum新特性,从MVCC原理到并行架构设计,从参数调优到生产实战,全面掌握大表清理性能提升3-5倍的秘诀。
PostgreSQL 19
Parallel Autovacuum
数据库优化
MVCC
性能调优
英伟达 CUDA-Oxide 0.1 深度解析:用 Rust 编写 GPU 内核的破冰之旅
编程
英伟达 CUDA-Oxide 0.1 深度解析:用 Rust 编写 GPU 内核的破冰之旅
2026-05-10 08:20:42 +0800 CST
view 339
英伟达发布实验性Rust-to-CUDA编译器CUDA-Oxide 0.1,支持用Rust编写SIMT GPU内核并输出标准PTX中间代码。深度解析其架构设计、代码示例与未来展望。
CUDA-Oxide
Rust
GPU编程
NVIDIA
PTX
SIMT
并行计算
高性能计算
TileKernels 深度解析:DeepSeek 用 80 行代码榨干 GPU,算子开发范式的降维打击
编程
TileKernels 深度解析:DeepSeek 用 80 行代码榨干 GPU,算子开发范式的降维打击
2026-04-30 03:22:15 +0800 CST
view 351
深度解析 DeepSeek 开源的高性能 GPU 算子库 TileKernels:基于 TileLang DSL 用 80 行代码实现手写 CUDA 级性能,覆盖 MoE Gating/Routing、FP8/FP4 量化、Engram 门控等七大算子家族,首次原生支持 NVIDIA Blackwell 架构,并通过 TVM 编译器打通昇腾等国产芯片。
DeepSeek
TileKernels
GPU
CUDA
TileLang
MoE
算子优化
DFlash 深度实战:块扩散模型如何实现 6 倍无损加速——从自回归瓶颈到并行生成的范式跃迁
编程
DFlash 深度实战:块扩散模型如何实现 6 倍无损加速——从自回归瓶颈到并行生成的范式跃迁
2026-05-23 11:16:44 +0800 CST
view 49
深度解析UC San Diego Z Lab提出的DFlash(Block Diffusion for Flash Speculative Decoding),详解块扩散草稿模型如何突破自回归瓶颈,在Qwen3-8B上实现6倍无损加速的架构原理、训练方法与生产级实战代码
LLM推理,投机解码,块扩散模型,大模型加速,DFlash,Speculative Decoding,UC San Diego,PyTorch,深度学习,AI推理优化
llama.cpp 深度实战:从 GGUF 量化到 CUDA 内核优化——纯 C/C++ 如何在 CPU/GPU 上榨出 LLM 推理的极限性能
编程
llama.cpp 深度实战:从 GGUF 量化到 CUDA 内核优化——纯 C/C++ 如何在 CPU/GPU 上榨出 LLM 推理的极限性能
2026-05-23 17:18:22 +0800 CST
view 92
2026年深度拆解 llama.cpp 的核心架构:GGUF 格式原理、20+量化方法对比、KV Cache 优化、多硬件后端性能实测,与 Ollama/vLLM 完整横评。
llama.cpp
GGUF
量化
CUDA
Metal
LLM推理
C++
本地部署
性能优化
GGML
AI Agent 沙箱三国杀:OpenSandbox vs CubeSandbox vs E2B,从内核隔离到秒级调度的全链路技术拆解
编程
AI Agent 沙箱三国杀:OpenSandbox vs CubeSandbox vs E2B,从内核隔离到秒级调度的全链路技术拆解
2026-05-02 06:06:14 +0800 CST
view 342
深度拆解阿里OpenSandbox、腾讯CubeSandbox与E2B三大AI Agent沙箱方案,从内核隔离原理、API协议设计、调度架构、性能实测到生产部署全链路技术分析
OpenSandbox
CubeSandbox
E2B
AI Agent
沙箱
KVM
Docker
Kubernetes
eBPF
RustVMM
Cua:15.9K Stars!给 AI 一台隔离云桌面,让它真正会用电脑
案例
Cua:15.9K Stars!给 AI 一台隔离云桌面,让它真正会用电脑
2026-05-11 16:22:59 +0800 CST
view 109
15.9K Stars 的开源项目 Cua,由 Y Combinator 孵化。给 AI 一个隔离云桌面,让它真的去开浏览器、点按钮、跑应用。支持 macOS/Linux/Windows/Android,三周暴涨 2000+ Stars。
Cua
AI Agent
Computer Use
云桌面
沙盒
Y Combinator
Claude Code
跨平台
DeepSeek DeepGEMM 2026年4月重磅更新:Mega MoE融合算子、FP4精度与极致性能优化
编程
DeepSeek DeepGEMM 2026年4月重磅更新:Mega MoE融合算子、FP4精度与极致性能优化
2026-04-23 08:41:45 +0800 CST
view 178
深度解析DeepSeek DeepGEMM 2026年4月重大更新:Mega MoE融合算子(dispatch+Linear+SwiGLU+Combine五合一,NVLink通信与Tensor Core计算重叠)、FP8xFP4 GEMM、FP4 Indexer、PDL调度优化与JIT加速,附完整代码实战。
DeepGEMM
DeepSeek
GPU优化
CUDA
FP8
FP4
MoE
AI Infra
高性能计算
NVIDIA
CutClaw 深度解析:开源 AI 智能剪辑师如何"听懂"音乐并剪出电影感大片——多智能体协作的音乐驱动视频剪辑革命
编程
CutClaw 深度解析:开源 AI 智能剪辑师如何"听懂"音乐并剪出电影感大片——多智能体协作的音乐驱动视频剪辑革命
2026-04-16 08:48:53 +0800 CST
view 612
深度解析开源项目CutClaw的技术架构、多智能体协作机制、音乐驱动剪辑原理。由大湾区大学GVC实验室和北京交通大学团队联合腾讯ARC实验室开源,能将几小时素材自动剪成电影感大片。
CutClaw
AI剪辑
开源
视频剪辑
多智能体
音乐驱动
智能剪辑师
bpftime for GPU 深度实战:将 eBPF 带进 GPU Kernel 内部——从 PTX 级插桩到线程级可观测性的全链路架构解析
编程
bpftime for GPU 深度实战:将 eBPF 带进 GPU Kernel 内部——从 PTX 级插桩到线程级可观测性的全链路架构解析
2026-05-07 10:07:31 +0800 CST
view 181
深入解析 bpftime for GPU 如何将 eBPF 的可编程观测能力带入 GPU Kernel 内部,实现 PTX 级插桩、per-thread 粒度观测和零拷贝数据回传,为 AI 训练和高性能计算提供全新的调试与分析范式。
eBPF
GPU
CUDA
PTX
可观测性
性能优化
腾讯云 Cube Sandbox 全栈开源解读:AI Agent 安全执行底座的架构与实战
编程
腾讯云 Cube Sandbox 全栈开源解读:AI Agent 安全执行底座的架构与实战
2026-04-26 04:41:26 +0800 CST
view 763
深度解析腾讯云开源的 Cube Sandbox:业内首个兼顾硬件级隔离与亚百毫秒启动的 AI Agent 沙箱服务,从架构设计到生产实战全指南
Cube Sandbox
AI Agent
云原生
沙箱安全
MicroVM
开源
DuckDB 1.5 + Sirius:GPU加速嵌入式分析数据库的性能革命
编程
DuckDB 1.5 + Sirius:GPU加速嵌入式分析数据库的性能革命
2026-04-08 14:42:27 +0800 CST
view 532
深度解析DuckDB 1.5新特性与Sirius GPU加速扩展,涵盖ExtensionKit、ClickBench基准测试、性能优化与实战指南
DuckDB
Sirius
GPU
数据分析
NVIDIA
cuDF
ds4 深度解析:Redis 作者的最后一战?—— DwarfStar 4 本地推理引擎的技术革命
编程
ds4 深度解析:Redis 作者的最后一战?—— DwarfStar 4 本地推理引擎的技术革命
2026-05-15 17:47:40 +0800 CST
view 193
深入解析 antirez(Redis 作者)新开源项目 ds4:DwarfStar 4 本地推理引擎,专门为 DeepSeek V4 Flash 打造,支持 Metal/CUDA 后端,2-bit 量化可在 96GB 内存 MacBook 上运行 284B 参数模型。
AI推理
本地部署
DeepSeek
Redis
Apple Silicon
CUDA
Metal
MoE
量化
TileLang + TileKernels 深度解析:DeepSeek 如何用 Python 写出让 GPU 逼近理论性能上限的 GPU 内核
编程
TileLang + TileKernels 深度解析:DeepSeek 如何用 Python 写出让 GPU 逼近理论性能上限的 GPU 内核
2026-04-28 10:55:20 +0800 CST
view 182
深度剖析 DeepSeek 开源的 TileLang DSL 和 TileKernels GPU 内核库:从 GEMM 到 MoE,从 TVM 编译基础设施到生产级量化内核,揭示用 Python 写接近硬件极限性能 GPU 代码的秘密。
TileLang
GPU内核
DeepSeek
高性能计算
CUDA
GEMM
MoE
量化
TVM
开源项目
Trae SOLO 深度实战:从 AI 辅助编程到自主交付——字节跳动 AI 原生 IDE 的架构革命与生产级实践
编程
Trae SOLO 深度实战:从 AI 辅助编程到自主交付——字节跳动 AI 原生 IDE 的架构革命与生产级实践
2026-05-23 03:46:21 +0800 CST
view 36
深度解析 Trae SOLO 模式的架构设计与生产级实践,从 Chat 到 SOLO 的三层演进、主 Agent + 子 Agent 协同机制、MCP 接入、多模型编排、性能优化技巧、CI/CD 集成等实战内容,附带完整项目演练。
Trae
SOLO模式
AI编程
字节跳动
Agent
自主开发
Trae 深度解析:字节跳动如何用 SOLO 模式重新定义 AI 原生 IDE
编程
Trae 深度解析:字节跳动如何用 SOLO 模式重新定义 AI 原生 IDE
2026-05-10 13:24:55 +0800 CST
view 348
Trae 是字节跳动推出的 AI 原生 IDE,以 SOLO 模式为核心,实现从「辅助编码」到「自主协作」的范式转变。本文深入解析其技术架构、SOLO Coder 与 SOLO Builder 双智能体、MTC 模式、MCP 插件生态,并与 Cursor、GitHub Copilot、Windsurf 等竞品进行全面对比。
Trae,AI编程,字节跳动,SOLO模式,IDE,AI原生
LiteRT-LM:Google端侧大模型推理引擎的革命性架构——从TensorFlow Lite的困境到LLM原生推理的全链路解析
编程
LiteRT-LM:Google端侧大模型推理引擎的革命性架构——从TensorFlow Lite的困境到LLM原生推理的全链路解析
2026-04-19 22:17:39 +0800 CST
view 422
深入解析Google LiteRT-LM端侧LLM推理引擎的核心架构:分层内存池、KV Cache量化、算子融合、WebGPU运行时。与TensorFlow Lite、llama.cpp、MLX横向对比,提供生产级部署实战指南。
Google
端侧AI
LiteRT-LM
WebGPU
量化
KV Cache
TensorFlow Lite
LLM推理
Go 1.27 test2json新增OutputType:CI终于能区分测试日志和报错了
编程
Go 1.27 test2json新增OutputType:CI终于能区分测试日志和报错了
2026-05-23 07:18:39 +0800 CST
view 34
Go 1.27为test2json新增OutputType字段,通过控制字符标记协议区分t.Log普通输出和t.Error错误输出,CI系统终于能准确提取测试失败摘要,完全向后兼容。
Go语言
Go1.27
testing
test2json
CI
工程实践
持续集成
MCP 2026 深度解析:AI推理性能瓶颈诊断的12个隐性耗时陷阱——从TensorRT-LLM到vLLM再到Triton的全引擎实战
编程
MCP 2026 深度解析:AI推理性能瓶颈诊断的12个隐性耗时陷阱——从TensorRT-LLM到vLLM再到Triton的全引擎实战
2026-04-30 14:21:13 +0800 CST
view 174
深度解析MCP 2026基准测试框架,拆解TensorRT-LLM、vLLM、Triton三大推理引擎的12个隐性耗时陷阱,提供可落地的诊断方法与修复路径。
AI推理
性能优化
TensorRT-LLM
vLLM
Triton
MCP2026
GPU优化
LLM推理引擎终极对决:vLLM vs TensorRT-LLM深度解析与2026生产环境选型指南
编程
LLM推理引擎终极对决:vLLM vs TensorRT-LLM深度解析与2026生产环境选型指南
2026-04-20 13:45:31 +0800 CST
view 317
深度对比vLLM与TensorRT-LLM两大LLM推理框架,从PagedAttention到Kernel Fusion,从量化技术到生产部署,助你做出正确的技术选型决策
LLM
vLLM
TensorRT-LLM
推理优化
大模型部署
量化技术
AI工程
browser-harness:狂揽 11.9K Stars!让 AI Agent 真正丝滑操控浏览器
案例
browser-harness:狂揽 11.9K Stars!让 AI Agent 真正丝滑操控浏览器
2026-05-11 10:18:42 +0800 CST
view 183
11.9K Stars 的开源项目 browser-harness,通过 CDP 框架直接连接 AI Agent 与真实 Chrome 浏览器,完全模拟人的行为,让 Agent 可以丝滑地浏览网页、搜索资料、填写表单、发布内容,不会触发任何反爬虫检测。
browser-harness
AI Agent
CDP
浏览器自动化
Claude Code
WebSocket
反爬虫
MCP 深度实战:从 JSON-RPC 2.0 到工具生态——2026 年 AI 工具集成标准化协议的架构完全指南
编程
MCP 深度实战:从 JSON-RPC 2.0 到工具生态——2026 年 AI 工具集成标准化协议的架构完全指南
2026-05-23 20:59:29 +0800 CST
view 24
深度解析 Model Context Protocol (MCP) 的架构设计与实战应用,从 JSON-RPC 2.0 到工具生态,涵盖 Resources、Tools、Prompts 三大核心能力,附带完整的文件系统与 GitHub MCP Server 实现代码。
MCP
AI
工具集成
协议标准
JSON-RPC
Ruflo深度解析:从单兵作战到AI蜂群指挥系统——40+K Stars的多智能体编排引擎全维度技术剖析
编程
Ruflo深度解析:从单兵作战到AI蜂群指挥系统——40+K Stars的多智能体编排引擎全维度技术剖析
2026-05-11 18:28:13 +0800 CST
view 218
Ruflo(48K+ Stars,v3.6.30)是面向Claude Code的多智能体编排平台,用100+专业化Agent、分布式共识算法和自学习记忆系统,让AI从单兵作战升级为蜂群协作。
Ruflo,Claude Code,多智能体编排,AI编程,Swarm协调,分布式共识,Agent,AI Agent,SONA,HNSW,Rust,WASM
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
5
...
9
下一页