程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
oMLX 深度解析:Apple Silicon 原生的本地大模型推理服务器——从分层 KV 缓存到菜单栏级 AI 编码伴侣
编程
oMLX 深度解析:Apple Silicon 原生的本地大模型推理服务器——从分层 KV 缓存到菜单栏级 AI 编码伴侣
2026-05-21 22:30:11 +0800 CST
view 394
深入解析 oMLX 的分层 KV 缓存架构(热 RAM + 冷 SSD)、Copy-on-Write 优化、与 Claude Code 的深度集成,以及 Apple Silicon 原生的推理性能优化。
oMLX
Apple Silicon
本地大模型
KV缓存
MLX
推理服务器
Goose 深度实战:当 Linux Foundation 为 AI Agent 建造「本地操作系统」——从 Rust 运行时到 ACP/MCP 全链路生产级完全指南(2026)
编程
Goose 深度实战:当 Linux Foundation 为 AI Agent 建造「本地操作系统」——从 Rust 运行时到 ACP/MCP 全链路生产级完全指南(2026)
2026-06-15 10:46:57 +0800 CST
view 179
深入解析 Linux Foundation AAIF 旗下的开源本地 AI Agent 项目 Goose:Rust 编写,桌面+CLI+API 三入口,支持 15+ 模型提供商和 70+ MCP 扩展,从架构设计到生产级部署的完整指南
AI Agent
Rust
MCP
Goose
Linux Foundation
本地运行时
ACP
Provider
开源
ds4 深度解析:Redis 作者的最后一战?—— DwarfStar 4 本地推理引擎的技术革命
编程
ds4 深度解析:Redis 作者的最后一战?—— DwarfStar 4 本地推理引擎的技术革命
2026-05-15 17:47:40 +0800 CST
view 459
深入解析 antirez(Redis 作者)新开源项目 ds4:DwarfStar 4 本地推理引擎,专门为 DeepSeek V4 Flash 打造,支持 Metal/CUDA 后端,2-bit 量化可在 96GB 内存 MacBook 上运行 284B 参数模型。
AI推理
本地部署
DeepSeek
Redis
Apple Silicon
CUDA
Metal
MoE
量化
OpenHuman 深度实战:Rust+Tauri 构建本地优先的 AI 桌面助手——Memory Tree 持久记忆与 118+ 集成完全指南(2026)
编程
OpenHuman 深度实战:Rust+Tauri 构建本地优先的 AI 桌面助手——Memory Tree 持久记忆与 118+ 集成完全指南(2026)
2026-05-30 21:11:41 +0800 CST
view 272
OpenHuman 用 Rust+Tauri 构建本地优先的 AI 桌面助手,通过 Memory Tree 持久记忆和 118+ 集成让 Agent 拥有跨会话长期记忆。本文从架构原理到生产级部署完整拆解。
OpenHuman
Rust
Tauri
AI桌面助手
Memory Tree
知识图谱
本地AI
Ollama 本地大模型部署实战:从零到生产级应用的完全指南(2026)
编程
Ollama 本地大模型部署实战:从零到生产级应用的完全指南(2026)
2026-06-10 01:20:57 +0800 CST
view 224
2026年Ollama本地大模型部署完全指南:从架构原理、GGUF量化、ModelFile自定义、多语言集成(Python/JS/Go)、RAG实战到Docker/K8s生产部署,8500字深度长文。
Ollama
本地部署
大模型
LLM
生产级
GGUF
量化
OpenClaw 深度实战:当本地 AI 助手遇上全平台自动化——从架构原理到生产级部署的完全指南(2026)
编程
OpenClaw 深度实战:当本地 AI 助手遇上全平台自动化——从架构原理到生产级部署的完全指南(2026)
2026-06-10 01:48:23 +0800 CST
view 243
OpenClaw(原名 Clawdbot/Moltbot)是2026年爆火的开源本地AI助手项目。本文从架构原理、核心概念、实战部署、Skills开发、多平台集成、性能优化等维度,全方位深入剖析OpenClaw如何将AI从聊天机器人进化为真正能做事的数字员工。
OpenClaw
AI助手
本地部署
自动化
Agent
Ollama 0.30 深度实战:当本地 LLM 推理有了双引擎——从 llama.cpp + MLX 双后端到 Gemma 4 QAT、从 Cohere2 MoE 到 ollama launch AI 编程助手生态的生产级完全指南(2026)
编程
Ollama 0.30 深度实战:当本地 LLM 推理有了双引擎——从 llama.cpp + MLX 双后端到 Gemma 4 QAT、从 Cohere2 MoE 到 ollama launch AI 编程助手生态的生产级完全指南(2026)
2026-06-21 08:54:17 +0800 CST
view 114
Ollama 0.30 深度解析:双引擎推理架构、Gemma 4 QAT、Cohere2 MoE、ollama launch 生态与生产级部署完全指南
Ollama
LLM
本地推理
AI编程
llama.cpp
MLX
Gemma
开源
Open-WebUI 深度实战:当本地大模型遇上生产级 Web 界面——从 RAG 管道到多模型统一编排的完全指南(2026)
编程
Open-WebUI 深度实战:当本地大模型遇上生产级 Web 界面——从 RAG 管道到多模型统一编排的完全指南(2026)
2026-06-10 03:16:35 +0800 CST
view 314
深入剖析 Open-WebUI 架构设计、RAG 实现原理、多模型编排机制,含大量可运行代码示例,覆盖从本地部署到生产级优化的完整流程。
Open-WebUI
本地大模型
RAG
FastAPI
Svelte
SQLite-Vec 深度实战:当嵌入式数据库学会了向量搜索——从本地 RAG 到端侧 AI 应用的生产级完全指南(2026)
编程
SQLite-Vec 深度实战:当嵌入式数据库学会了向量搜索——从本地 RAG 到端侧 AI 应用的生产级完全指南(2026)
2026-06-21 10:26:56 +0800 CST
view 89
SQLite-Vec 完全指南:让嵌入式数据库拥有向量搜索能力。从架构原理到代码实战,详解本地 RAG 系统、向量索引优化、端侧部署方案,附带完整可运行代码。
SQLite
向量数据库
RAG
AI
嵌入式数据库
sqlite-vec
本地AI
Open Design:31个Skills+72套设计系统,Claude Design的开源替代品
案例
Open Design:31个Skills+72套设计系统,Claude Design的开源替代品
2026-05-09 06:34:08 +0800 CST
view 724
Open Design开源项目:Claude Design的开源替代品,31个Skills+72套设计系统,支持16种AI CLI工具,本地运行Apache-2.0协议,多模型支持,内置图片视频生成,MCP集成
AI设计
Claude Design替代
开源设计工具
本地运行
多模型
设计系统
llama.cpp 深度实战:当 C/C++ 重写遇见端侧 LLM 推理——从 GGUF 量化到 Apple Silicon 38 tokens/s 的生产级完全指南(2026)
编程
llama.cpp 深度实战:当 C/C++ 重写遇见端侧 LLM 推理——从 GGUF 量化到 Apple Silicon 38 tokens/s 的生产级完全指南(2026)
2026-06-16 01:17:28 +0800 CST
view 208
llama.cpp 是端侧 LLM 推理的事实标准(180K+ Stars)。本文从源码架构、GGUF 格式、量化方法、跨平台后端、生产部署、性能优化到 DeepSeek V4 Flash 实战,全方位讲解本地 AI 推理。
llama.cpp
GGUF
量化
端侧推理
本地AI
C/C++
Apple Silicon
3.2万Star开源本地AI知识库:Open Notebook支持18家模型+播客生成+MCP集成
编程
3.2万Star开源本地AI知识库:Open Notebook支持18家模型+播客生成+MCP集成
2026-06-21 12:21:16 +0800 CST
view 72
Open Notebook 是3.2万Star的开源本地AI知识库,Google Notebook LM替代品。支持18家AI模型切换、1-4人播客生成、RAG对话+来源标注、MCP集成、REST API。MIT协议,Docker两分钟部署,数据全在本地。
AI知识库
开源
RAG
播客
MCP
Ollama
DeepSeek
本地部署
隐私
NeuTTS Air:0.5B参数超拟真语音合成,3秒音频克隆你的声音
编程
NeuTTS Air:0.5B参数超拟真语音合成,3秒音频克隆你的声音
2026-04-28 12:43:51 +0800 CST
view 345
NVIDIA开源NeuTTS Air——0.5B参数超拟真语音合成模型,仅需3秒音频即可完成声音克隆,可在手机、笔记本甚至树莓派上本地运行,完全保护隐私,无需联网。
AI
TTS
声音克隆
本地部署
NVIDIA
语音合成
边缘计算
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
下一页