程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
LLM推理框架2026选型完全指南:从vLLM到TensorRT-LLM,一次讲透四大引擎的架构哲学与生产级实战
编程
LLM推理框架2026选型完全指南:从vLLM到TensorRT-LLM,一次讲透四大引擎的架构哲学与生产级实战
2026-06-02 09:36:52 +0800 CST
view 275
从vLLM到TensorRT-LLM,一次讲透vLLM、SGLang、TensorRT-LLM、llama.cpp四大LLM推理框架的架构哲学、核心原理、生产级部署实战与选型决策树。
LLM
vLLM
TensorRT-LLM
llama.cpp
SGLang
推理优化
GPU
llama.cpp 深度实战:当端侧 LLM 成为生产级事实标准——从 GGUF 量化到跨平台部署的完全指南(2026)
编程
llama.cpp 深度实战:当端侧 LLM 成为生产级事实标准——从 GGUF 量化到跨平台部署的完全指南(2026)
2026-06-11 00:19:05 +0800 CST
view 161
全面解析 llama.cpp 推理引擎,从 GGUF 格式、量化原理、架构设计到跨平台部署,提供生产级代码实战和性能优化指南。
llama.cpp
GGUF
量化
端侧推理
大语言模型
oMLX 深度实战:当 macOS 菜单栏成为本地 LLM 推理的控制中心——从连续批处理到 SSD 分层缓存、从 MLX 后端加速到生产级部署的完全指南(2026)
编程
oMLX 深度实战:当 macOS 菜单栏成为本地 LLM 推理的控制中心——从连续批处理到 SSD 分层缓存、从 MLX 后端加速到生产级部署的完全指南(2026)
2026-06-22 17:24:05 +0800 CST
view 9
oMLX 是专为 Apple Silicon 优化的 LLM 推理服务器,通过连续批处理、分层 KV Cache、MLX 后端加速和 macOS 菜单栏管理,让本地 AI 推理从可用走向实用。
LLM
Apple Silicon
MLX
本地推理
MCP
llama.cpp 深度实战:从 GGUF 量化到 CUDA 内核优化——纯 C/C++ 如何在 CPU/GPU 上榨出 LLM 推理的极限性能
编程
llama.cpp 深度实战:从 GGUF 量化到 CUDA 内核优化——纯 C/C++ 如何在 CPU/GPU 上榨出 LLM 推理的极限性能
2026-05-23 17:18:22 +0800 CST
view 1327
2026年深度拆解 llama.cpp 的核心架构:GGUF 格式原理、20+量化方法对比、KV Cache 优化、多硬件后端性能实测,与 Ollama/vLLM 完整横评。
llama.cpp
GGUF
量化
CUDA
Metal
LLM推理
C++
本地部署
性能优化
GGML
从原理到实战:llama.cpp 与 GGUF 量化格式的工程实践全解
编程
从原理到实战:llama.cpp 与 GGUF 量化格式的工程实践全解
2026-04-12 22:56:41 +0800 CST
view 673
2026年深度解析 llama.cpp 架构设计与 GGUF 量化格式,从底层原理到工程实战,涵盖 K-Quant/IQ 量化、Flash Attention、KV Cache 优化、Intel NPU/GPU 部署全流程。
llama.cpp
GGUF
量化
大模型
C++
本地部署
Ollama 完全指南:本地大模型部署的事实标准——从原理到生产级 AI 应用开发(2026)
编程
Ollama 完全指南:本地大模型部署的事实标准——从原理到生产级 AI 应用开发(2026)
2026-06-05 04:13:34 +0800 CST
view 199
Ollama 本地大模型部署完全指南,从架构原理到生产级部署,涵盖 RAG 集成、性能优化、Docker/K8s 部署等核心内容。
Ollama
本地大模型
AI应用开发
Go语言
llama.cpp
Ollama 完全指南:本地大模型部署的事实标准——架构、实战与生产级部署(2026)
编程
Ollama 完全指南:本地大模型部署的事实标准——架构、实战与生产级部署(2026)
2026-06-05 04:13:52 +0800 CST
view 248
Ollama 本地大模型部署完全指南,从架构原理到生产级部署,涵盖 RAG 集成、性能优化、Docker/K8s 部署等核心内容。
Ollama
本地大模型
AI应用开发
Go语言
llama.cpp
Gemma 4 12B 深度实战:当 Google 把「无编码器多模态」塞进 16GB 笔记本——从统一架构原理到生产级本地 Agent 的完全指南(2026)
编程
Gemma 4 12B 深度实战:当 Google 把「无编码器多模态」塞进 16GB 笔记本——从统一架构原理到生产级本地 Agent 的完全指南(2026)
2026-06-14 04:46:45 +0800 CST
view 185
深度解析 Google DeepMind Gemma 4 12B 的无编码器统一多模态架构,从原理到代码实战,涵盖 llama.cpp 部署、量化策略、Agent 工作流和生产级架构设计(2026)。
Gemma 4
Google DeepMind
多模态
本地部署
Agent
llama.cpp
开源大模型
DeepSeek-R1边缘推理实战:从云端独占到本地智能的范式转移
编程
DeepSeek-R1边缘推理实战:从云端独占到本地智能的范式转移
2026-05-19 12:42:27 +0800 CST
view 294
2026年,边缘AI不再只是云端模型的精简版。本文深入剖析DeepSeek-R1 CPU版的技术原理,从模型蒸馏、量化技术的底层原理到生产环境的完整部署方案,提供可直接落地的代码和可量化的性能数据。
DeepSeek
R1
边缘计算
AI推理
模型蒸馏
量化
llama.cpp
Ollama
端侧AI
Ollama 0.30 深度实战:当本地 LLM 推理有了双引擎——从 llama.cpp + MLX 双后端到 Gemma 4 QAT、从 Cohere2 MoE 到 ollama launch AI 编程助手生态的生产级完全指南(2026)
编程
Ollama 0.30 深度实战:当本地 LLM 推理有了双引擎——从 llama.cpp + MLX 双后端到 Gemma 4 QAT、从 Cohere2 MoE 到 ollama launch AI 编程助手生态的生产级完全指南(2026)
2026-06-21 08:54:17 +0800 CST
view 42
Ollama 0.30 深度解析:双引擎推理架构、Gemma 4 QAT、Cohere2 MoE、ollama launch 生态与生产级部署完全指南
Ollama
LLM
本地推理
AI编程
llama.cpp
MLX
Gemma
开源
codebase-memory-mcp 深度实战:当 C 语言把代码库变成知识图谱——从 Tree-sitter AST 到 Hybrid LSP 类型推导、从 11 信号语义搜索到 Cypher 图查询的 AI 编程生产级完全指南(2026)
编程
codebase-memory-mcp 深度实战:当 C 语言把代码库变成知识图谱——从 Tree-sitter AST 到 Hybrid LSP 类型推导、从 11 信号语义搜索到 Cypher 图查询的 AI 编程生产级完全指南(2026)
2026-06-22 11:27:33 +0800 CST
view 14
深度拆解codebase-memory-mcp:纯C语言的代码知识图谱MCP服务器,Tree-sitter 158语言解析、Hybrid LSP类型推导、11信号语义搜索、Cypher图查询、死代码检测、Git diff影响分析,11个AI Agent一键集成
codebase-memory-mcp
MCP
Tree-sitter
知识图谱
AI编程
C语言
LSP
语义搜索
Cypher
代码智能
浏览器自动化的终极解法:CloakBrowser 如何用 58 处 C++ 补丁让所有反机器人系统失效
编程
浏览器自动化的终极解法:CloakBrowser 如何用 58 处 C++ 补丁让所有反机器人系统失效
2026-06-21 19:31:21 +0800 CST
view 23
CloakBrowser 通过在 Chromium C++ 源码层打入 58 处补丁,从 GPU 渲染、WebGL 指纹、Canvas 声纹到网络时序特征实现真正的浏览器隐身。无需 JS 注入,直接替换 Playwright/Puppeteer 的 import,三行代码迁移,30/30 检测站点全部通过。
CloakBrowser
Chromium
反爬虫
浏览器自动化
Playwright
Puppeteer
CloakBrowser 深度解析:49 个 C++ 补丁如何把 Chromium 变成「数字变色龙」——从源码级指纹篡改到 30/30 全通过的隐身浏览器架构内幕
编程
CloakBrowser 深度解析:49 个 C++ 补丁如何把 Chromium 变成「数字变色龙」——从源码级指纹篡改到 30/30 全通过的隐身浏览器架构内幕
2026-05-17 16:15:05 +0800 CST
view 373
深度解析 CloakBrowser 如何在 Chromium C++ 源码层打 49 个补丁,从根本上重写浏览器指纹信息,实现 30/30 检测全通过的反爬绕过方案。
CloakBrowser
Chromium
反爬虫
浏览器指纹
Playwright
Puppeteer
Python
CloakBrowser 深度实战:当反爬虫战争进入「内核级隐身」——从 C++ 源码补丁到 Browser Fingerprint 完全伪造的生产级完全指南(2026)
编程
CloakBrowser 深度实战:当反爬虫战争进入「内核级隐身」——从 C++ 源码补丁到 Browser Fingerprint 完全伪造的生产级完全指南(2026)
2026-06-14 00:46:29 +0800 CST
view 182
CloakBrowser 深度实战:基于 C++ 源码级修改的隐身 Chromium 浏览器,通过 30+ 个内核级指纹补丁实现对 Cloudflare Turnstile、Akamai Bot Manager 等反爬虫系统的完全绕过。
CloakBrowser
浏览器指纹
反爬虫
Chromium
Playwright
Puppeteer
WebGL
Canvas
CloakBrowser源码级反爬虫:57个C++指纹补丁深度解析
编程
CloakBrowser源码级反爬虫:57个C++指纹补丁深度解析
2026-05-09 01:07:05 +0800 CST
view 932
深度解析开源项目CloakBrowser的工作原理——通过57个C++源码补丁,从底层重构Chromium的指纹系统,让自动化浏览器彻底绕过Cloudflare、reCAPTCHA等主流反爬虫检测。
CloakBrowser
Chromium
反爬虫
浏览器指纹
Playwright
Puppeteer
开源
网络安全
Obscura 深度实战:从 Rust 无头引擎到 AI Agent 浏览器底座——Headless Chrome 的终结者还是补充者?
编程
Obscura 深度实战:从 Rust 无头引擎到 AI Agent 浏览器底座——Headless Chrome 的终结者还是补充者?
2026-05-23 12:15:52 +0800 CST
view 251
Obscura 是用 Rust 编写的高性能无头浏览器引擎,专为 AI Agent 和网页抓取设计。本文深度解析其架构设计、性能优势、Stealth 反检测机制及生产级实践。
Rust
无头浏览器
AI Agent
Web 抓取
V8
CDP
Playwright
Puppeteer
性能优化
架构设计
Lightpanda 深度实战:18K+ Star 的 Zig 语言无头浏览器——从零构建到 AI Agent 原生集成的全链路架构解析
编程
Lightpanda 深度实战:18K+ Star 的 Zig 语言无头浏览器——从零构建到 AI Agent 原生集成的全链路架构解析
2026-05-07 20:06:57 +0800 CST
view 354
深入解析 Lightpanda 浏览器:用 Zig 从零构建的 AI 专用无头浏览器,内存仅 Chrome 的 1/16,速度快 9 倍,原生支持 CDP 和 MCP 协议。
浏览器
Zig
AI自动化
无头浏览器
爬虫
CDP
Puppeteer
HeyGen 开源 HyperFrames:用 HTML 写视频,AI Agent 时代的视频渲染框架
编程
HeyGen 开源 HyperFrames:用 HTML 写视频,AI Agent 时代的视频渲染框架
2026-04-18 11:05:36 +0800 CST
view 1650
HeyGen 开源 HyperFrames 框架,用 HTML + data-* 属性定义视频时间轴,Puppeteer + FFmpeg 渲染为 MP4。原生集成 AI Agent Skills,支持 Claude Code、Cursor 等工具直接用自然语言生成视频。
AI
视频
HeyGen
开源
HTML
Puppeteer
Agent
Redis之父antirez亲自下场!为DeepSeek V4 Flash打造专属推理引擎,Mac上跑出468 token/s
案例
Redis之父antirez亲自下场!为DeepSeek V4 Flash打造专属推理引擎,Mac上跑出468 token/s
2026-05-10 08:40:22 +0800 CST
view 566
Redis之父antirez亲自下场!为DeepSeek V4 Flash打造专属推理引擎ds4.c,C+Metal从头编写,Mac Studio M3 Ultra上预填充468 token/s。关键优化:非对称量化(MoE专家层2-bit)、KV缓存搬硬盘、内置OpenAI/Anthropic双API。128GB Mac可跑,专为coding agent优化。
DeepSeek
AI推理
Mac
Redis
antirez
Metal
本地推理
MoE
GGUF
C语言
Apple Silicon
Claude Code
OpenAI API
Anthropic API
Svelte 5 深度解析:Runes 革命与响应式编程的范式跃迁
编程
Svelte 5 深度解析:Runes 革命与响应式编程的范式跃迁
2026-05-12 14:11:40 +0800 CST
view 304
深度解析Svelte 5的重大革新:Runes响应式系统、//新语法、Snippets代码片段、TypeScript原生支持、性能提升33%。包含Runes系统深度解析、Svelte 4迁移指南、性能优化实战。
Svelte5
Runes系统
响应式编程
SvelteKit
Snippets
Apple Container 深度实战:当 Swift 遇上轻量虚拟化——从 macOS 原生容器到 Production 部署的完全指南(2026)
编程
Apple Container 深度实战:当 Swift 遇上轻量虚拟化——从 macOS 原生容器到 Production 部署的完全指南(2026)
2026-06-12 14:46:44 +0800 CST
view 269
深入解析苹果官方开源的 macOS 容器工具 apple/container,从架构设计、Virtualization.framework 技术栈、轻量VM模型等维度完整讲解,附实战部署示例。
Swift
Container
macOS
虚拟化
Apple Silicon
OCI
Docker
Nuxt 4 深度解析:全栈框架的新里程碑与开发者体验革命
编程
Nuxt 4 深度解析:全栈框架的新里程碑与开发者体验革命
2026-05-12 13:43:36 +0800 CST
view 562
深度解析Nuxt 4的重大革新:app/目录新结构、useAsyncData/useFetch智能升级、性能提升34%、TypeScript类型系统强化、Vue Router v5集成。
Nuxt4
全栈框架
Vue
VueRouter
app目录
useAsyncData
useFetch
Apple Container 深度实战:当 Swift 遇上 Linux 容器——从轻量级 VM 隔离到 Rosetta 跨架构构建的生产级完全指南(2026)
编程
Apple Container 深度实战:当 Swift 遇上 Linux 容器——从轻量级 VM 隔离到 Rosetta 跨架构构建的生产级完全指南(2026)
2026-06-15 07:22:31 +0800 CST
view 156
Apple Container 开源项目深度实战:每容器一 VM 的架构设计、Swift 技术栈解析、Rosetta 2 跨架构构建、vminitd 初始化系统、0.4.1 新特性 Container Machine,以及从安装到生产部署的完整指南
Apple Container
Swift
Linux容器
虚拟化
Rosetta
macOS
OCI
Docker替代
Apple Container深度实战:当macOS遇见原生Linux容器——告别Docker Desktop高资源占用,专为M系列芯片优化的轻量级容器方案完全指南(2026)
编程
Apple Container深度实战:当macOS遇见原生Linux容器——告别Docker Desktop高资源占用,专为M系列芯片优化的轻量级容器方案完全指南(2026)
2026-06-16 04:16:21 +0800 CST
view 247
本文深度解析Apple开源的Container项目,对比Docker Desktop的核心痛点,详细讲解安装配置、基础操作、高级实战场景、性能优化技巧,为macOS开发者提供完美的轻量级容器解决方案。
Apple
容器
Linux
macOS
Docker
开发工具
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
...
45
下一页