程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Goose:Block 开源、Linux 基金会托管——本地 AI 编程代理的终极答案
编程
Goose:Block 开源、Linux 基金会托管——本地 AI 编程代理的终极答案
2026-05-11 09:23:06 +0800 CST
view 380
Goose 是由 Block 开源、现已捐献给 Linux 基金会 AAIF 的本地 AI 编程代理。最新版本 v1.32.0(2026年5月6日)支持 Exa AI 搜索、桌面通知、@agent 协作、/skills 命令、自动压缩上下文、语音听写等功能。Rust 开发,支持 MCP 协议,可连接任何 LLM(OpenAI、Ollama、Kimi Code 等),完全本地运行无需订阅。
Goose
AI编程
本地LLM
MCP
Rust
Linux基金会
Block
Odysseus 深度实战:当 YouTuber 之王用代码掀翻云端 AI 霸权——从自托管工作空间到生产级本地 Agent 的完全指南(2026)
编程
Odysseus 深度实战:当 YouTuber 之王用代码掀翻云端 AI 霸权——从自托管工作空间到生产级本地 Agent 的完全指南(2026)
2026-06-13 19:51:26 +0800 CST
view 312
PewDiePie开源的Odysseus自托管AI工作空间深度实战指南:从架构设计、LLM集成、Agent系统、记忆系统到安全架构的完全解析
Odysseus
自托管AI
PewDiePie
Agent
MCP
本地LLM
FastAPI
ChromaDB
oMLX 深度实战:当 Apple Silicon 遇见本地大模型推理——从 MTP 加速到分层 KV 缓存的生产级完全指南(2026)
编程
oMLX 深度实战:当 Apple Silicon 遇见本地大模型推理——从 MTP 加速到分层 KV 缓存的生产级完全指南(2026)
2026-06-16 16:46:05 +0800 CST
view 230
深度解析 2026 年 Apple Silicon 本地大模型推理技术栈:从 llama.cpp 量化体系到 oMLX 分层 KV 缓存架构,从 MTP 加速到 CoreAI 全栈指南,包含实测 Benchmark 与生产级部署方案。
Apple Silicon
MLX
llama.cpp
oMLX
MTP
本地大模型
量化
本地推理
Ollama 深度实战:当本地大模型成为生产级基础设施——从模型量化到高并发推理、从 REST API 到 Kubernetes 部署的完全指南(2026)
编程
Ollama 深度实战:当本地大模型成为生产级基础设施——从模型量化到高并发推理、从 REST API 到 Kubernetes 部署的完全指南(2026)
2026-06-20 01:25:22 +0800 CST
view 145
Ollama本地大模型生产级部署完全指南:从GGUF格式原理、INT4/INT8量化实战、REST API集成、多语言SDK(Python/Go/TypeScript)、GPU显存管理、Kubernetes+Helm生产部署、性能调优到RAG知识库构建,全流程深度实战。
Ollama
本地大模型
LLM部署
模型量化
GGUF
llama.cpp
REST API
Kubernetes
GPU
RAG
Ollama 0.30 深度实战:当本地 LLM 推理有了双引擎——从 llama.cpp + MLX 双后端到 Gemma 4 QAT、从 Cohere2 MoE 到 ollama launch AI 编程助手生态的生产级完全指南(2026)
编程
Ollama 0.30 深度实战:当本地 LLM 推理有了双引擎——从 llama.cpp + MLX 双后端到 Gemma 4 QAT、从 Cohere2 MoE 到 ollama launch AI 编程助手生态的生产级完全指南(2026)
2026-06-21 08:54:17 +0800 CST
view 134
Ollama 0.30 深度解析:双引擎推理架构、Gemma 4 QAT、Cohere2 MoE、ollama launch 生态与生产级部署完全指南
Ollama
LLM
本地推理
AI编程
llama.cpp
MLX
Gemma
开源
llama.cpp 深度实战:从 GGUF 量化到 CUDA 内核优化——纯 C/C++ 如何在 CPU/GPU 上榨出 LLM 推理的极限性能
编程
llama.cpp 深度实战:从 GGUF 量化到 CUDA 内核优化——纯 C/C++ 如何在 CPU/GPU 上榨出 LLM 推理的极限性能
2026-05-23 17:18:22 +0800 CST
view 1409
2026年深度拆解 llama.cpp 的核心架构:GGUF 格式原理、20+量化方法对比、KV Cache 优化、多硬件后端性能实测,与 Ollama/vLLM 完整横评。
llama.cpp
GGUF
量化
CUDA
Metal
LLM推理
C++
本地部署
性能优化
GGML
猛涨25K Star!LLMFit:一键检测你的电脑能跑哪些大模型
案例
猛涨25K Star!LLMFit:一键检测你的电脑能跑哪些大模型
2026-05-06 07:35:19 +0800 CST
view 396
25K+Star的LLMFit一键检测你的电脑能跑哪些大模型,Rust编写支持NVIDIA/AMD/Intel/Apple Silicon,智能量化推荐Q8到Q2,四维评分系统,TUI+CLI双模式
LLM部署
硬件检测
量化推荐
Rust
终端工具
本地部署
Ollama
Ollama 本地大模型部署实战:从零到生产级应用的完全指南(2026)
编程
Ollama 本地大模型部署实战:从零到生产级应用的完全指南(2026)
2026-06-10 01:20:57 +0800 CST
view 237
2026年Ollama本地大模型部署完全指南:从架构原理、GGUF量化、ModelFile自定义、多语言集成(Python/JS/Go)、RAG实战到Docker/K8s生产部署,8500字深度长文。
Ollama
本地部署
大模型
LLM
生产级
GGUF
量化
DiffusionGemma 深度实战:当 Google 用「扩散」颠覆自回归——从离散文本扩散原理到 MoE 架构、本地推理加速与生产级部署的完全指南(2026)
编程
DiffusionGemma 深度实战:当 Google 用「扩散」颠覆自回归——从离散文本扩散原理到 MoE 架构、本地推理加速与生产级部署的完全指南(2026)
2026-06-16 18:52:52 +0800 CST
view 210
Google DeepMind联合NVIDIA发布DiffusionGemma——基于离散文本扩散的实验性开源模型。本文深入解读26B MoE架构、双向注意力机制、本地推理4倍加速原理,附完整代码示例和部署实战。
Google
DiffusionGemma
扩散模型
MoE
开源LLM
本地推理
AI推理加速
oMLX 深度实战:当 macOS 菜单栏成为本地 LLM 推理的控制中心——从连续批处理到 SSD 分层缓存、从 MLX 后端加速到生产级部署的完全指南(2026)
编程
oMLX 深度实战:当 macOS 菜单栏成为本地 LLM 推理的控制中心——从连续批处理到 SSD 分层缓存、从 MLX 后端加速到生产级部署的完全指南(2026)
2026-06-22 17:24:05 +0800 CST
view 107
oMLX 是专为 Apple Silicon 优化的 LLM 推理服务器,通过连续批处理、分层 KV Cache、MLX 后端加速和 macOS 菜单栏管理,让本地 AI 推理从可用走向实用。
LLM
Apple Silicon
MLX
本地推理
MCP
Gemma 4 12B 深度实战:当无编码器统一多模态架构走进本地
编程
Gemma 4 12B 深度实战:当无编码器统一多模态架构走进本地
2026-06-14 17:49:21 +0800 CST
view 251
深入解析 Google Gemma 4 12B 的无编码器统一多模态架构,从技术原理到生产部署的完整指南
Gemma4
Google
多模态
本地部署
AI
LLM
Encoder-Free
Gemma 4 12B 工程实践:Encoder-Free 统一多模态架构从原理到本地部署完全指南(2026)
编程
Gemma 4 12B 工程实践:Encoder-Free 统一多模态架构从原理到本地部署完全指南(2026)
2026-06-14 17:49:38 +0800 CST
view 275
深入解析 Google Gemma 4 12B 的无编码器统一多模态架构,从技术原理到生产部署的完整指南
Gemma4
Google
多模态
本地部署
AI
LLM
Encoder-Free
当 Apple Silicon 遇上视觉大模型:MLX-VLM 如何把「本地多模态推理」变成现实
编程
当 Apple Silicon 遇上视觉大模型:MLX-VLM 如何把「本地多模态推理」变成现实
2026-04-11 10:24:48 +0800 CST
view 696
深度解析 Apple Silicon 上的视觉语言模型推理引擎 MLX-VLM,涵盖架构设计、模型支持、性能优化与实战部署。
Apple Silicon
MLX
视觉语言模型
VLM
Mac本地AI
多模态推理
Ollama 完全指南:本地大模型部署的事实标准——从原理到生产级 AI 应用开发(2026)
编程
Ollama 完全指南:本地大模型部署的事实标准——从原理到生产级 AI 应用开发(2026)
2026-06-05 04:13:34 +0800 CST
view 209
Ollama 本地大模型部署完全指南,从架构原理到生产级部署,涵盖 RAG 集成、性能优化、Docker/K8s 部署等核心内容。
Ollama
本地大模型
AI应用开发
Go语言
llama.cpp
Ollama 完全指南:本地大模型部署的事实标准——架构、实战与生产级部署(2026)
编程
Ollama 完全指南:本地大模型部署的事实标准——架构、实战与生产级部署(2026)
2026-06-05 04:13:52 +0800 CST
view 267
Ollama 本地大模型部署完全指南,从架构原理到生产级部署,涵盖 RAG 集成、性能优化、Docker/K8s 部署等核心内容。
Ollama
本地大模型
AI应用开发
Go语言
llama.cpp
Local-File-Organizer 深度解析:3K Stars 本地 AI 文件整理,Llama3.2+LLaVA 完全离线运行
编程
Local-File-Organizer 深度解析:3K Stars 本地 AI 文件整理,Llama3.2+LLaVA 完全离线运行
2026-05-15 12:22:33 +0800 CST
view 272
深入解析 3K Stars 的 Local-File-Organizer:基于 Llama3.2 3B + LLaVA-v1.6 双模型的本地 AI 文件整理工具,使用 Nexa SDK 实现 100% 离线推理,自动识别文件内容、智能分类重命名、支持图片视觉分析和文档内容解析,零数据外泄。
Local-File-Organizer
AI文件整理
Llama3
LLaVA
本地AI
隐私
LLM推理框架2026选型完全指南:从vLLM到TensorRT-LLM,一次讲透四大引擎的架构哲学与生产级实战
编程
LLM推理框架2026选型完全指南:从vLLM到TensorRT-LLM,一次讲透四大引擎的架构哲学与生产级实战
2026-06-02 09:36:52 +0800 CST
view 297
从vLLM到TensorRT-LLM,一次讲透vLLM、SGLang、TensorRT-LLM、llama.cpp四大LLM推理框架的架构哲学、核心原理、生产级部署实战与选型决策树。
LLM
vLLM
TensorRT-LLM
llama.cpp
SGLang
推理优化
GPU
METATRON 深度解析:当 AI 渗透测试在本地跑出「免费版 GPT-4 安全助手」
编程
METATRON 深度解析:当 AI 渗透测试在本地跑出「免费版 GPT-4 安全助手」
2026-04-09 07:55:23 +0800 CST
view 836
深度解析 METATRON:如何在本地零成本跑起一个完整的 AI 渗透测试助手,基于 Qwen 微调模型 + Ollama + MariaDB,无需 API Key,数据完全不出本地。
AI渗透测试
Ollama
Qwen
本地大模型
MariaDB
Pentest
安全工具
Agent
Ollama 深度实战:当本地大模型部署成为事实标准——从一行命令跑 Llama/Qwen/DeepSeek 到生产级 API 兼容与多语言接入完全指南(2026)
编程
Ollama 深度实战:当本地大模型部署成为事实标准——从一行命令跑 Llama/Qwen/DeepSeek 到生产级 API 兼容与多语言接入完全指南(2026)
2026-06-11 05:47:01 +0800 CST
view 236
本文深入讲解Ollama的原理、实战部署、性能优化,帮助开发者快速掌握本地大模型部署能力
Ollama
本地大模型
AI部署
Go语言
Python
DiffusionGemma 深度实战:当文本扩散重新定义本地AI推理——从'打字机'到'印刷机'的4倍速架构革命
编程
DiffusionGemma 深度实战:当文本扩散重新定义本地AI推理——从'打字机'到'印刷机'的4倍速架构革命
2026-06-12 17:21:39 +0800 CST
view 134
2026年6月Google发布DiffusionGemma,首个生产级文本扩散大模型,本地推理速度提升4倍。本文深入剖析其从自回归到并行生成的架构革命,附完整代码实战。
DiffusionGemma
文本扩散
本地AI
Gemma
大模型推理
扩散模型
Python
Ollama
Ollama v0.14.3 深度实战:从本地部署到多模态 AI——2026 年私有化大模型工程化完全指南
编程
Ollama v0.14.3 深度实战:从本地部署到多模态 AI——2026 年私有化大模型工程化完全指南
2026-05-24 12:04:34 +0800 CST
view 220
Ollama v0.14.3 深度实战指南:从架构解析到生产部署,涵盖 GGUF 格式、API 集成、多模态模型、性能优化等核心内容,2026 年私有化大模型首选方案。
Ollama
大模型
本地部署
GGUF
多模态
从原理到实战:llama.cpp 与 GGUF 量化格式的工程实践全解
编程
从原理到实战:llama.cpp 与 GGUF 量化格式的工程实践全解
2026-04-12 22:56:41 +0800 CST
view 696
2026年深度解析 llama.cpp 架构设计与 GGUF 量化格式,从底层原理到工程实战,涵盖 K-Quant/IQ 量化、Flash Attention、KV Cache 优化、Intel NPU/GPU 部署全流程。
llama.cpp
GGUF
量化
大模型
C++
本地部署
Gemma 4 12B 深度实战:当 Google 把多模态 AI「塞进」你的笔记本——从无编码器架构到本地 Agent 工作流的完全指南(2026)
编程
Gemma 4 12B 深度实战:当 Google 把多模态 AI「塞进」你的笔记本——从无编码器架构到本地 Agent 工作流的完全指南(2026)
2026-06-13 12:46:40 +0800 CST
view 171
深度解析 Google DeepMind Gemma 4 12B 无编码器多模态架构,从架构原理到本地部署,从 Agent 工具链集成到生产级实战,5400+ 字完全指南。
Gemma 4 12B
Google DeepMind
多模态模型
本地推理
Agent
Ollama
无编码器架构
Google AI Edge Gallery 深度实战:让 Mac/Android 离线运行 Gemma 3——从原理到生产级本地 AI 部署完全指南(2026)
编程
Google AI Edge Gallery 深度实战:让 Mac/Android 离线运行 Gemma 3——从原理到生产级本地 AI 部署完全指南(2026)
2026-06-04 21:14:37 +0800 CST
view 190
深入剖析 Google AI Edge Gallery 的技术架构、Gemma 模型家族、端侧部署全流程,并通过完整代码示例,带你从零构建一个生产级本地 AI 应用。
Google AI Edge Gallery
本地AI
Gemma模型
端侧推理
Mac AI
Android AI
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
...
17
下一页