程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
llama.cpp 深度实战:从 GGUF 量化到 CUDA 内核优化——纯 C/C++ 如何在 CPU/GPU 上榨出 LLM 推理的极限性能
编程
llama.cpp 深度实战:从 GGUF 量化到 CUDA 内核优化——纯 C/C++ 如何在 CPU/GPU 上榨出 LLM 推理的极限性能
2026-05-23 17:18:22 +0800 CST
view 585
2026年深度拆解 llama.cpp 的核心架构:GGUF 格式原理、20+量化方法对比、KV Cache 优化、多硬件后端性能实测,与 Ollama/vLLM 完整横评。
llama.cpp
GGUF
量化
CUDA
Metal
LLM推理
C++
本地部署
性能优化
GGML
Gunicorn是一个高性能、易于使用的Python,适用于多种应用部署场景
编程
Gunicorn是一个高性能、易于使用的Python,适用于多种应用部署场景
2024-11-18 13:34:51 +0800 CST
view 1978
Gunicorn是一个高性能、易于使用的PythonWSGIHTTP服务器,适用于多种应用部署场景。它支持多种工作模式,能够高效处理并发请求,并兼容多种PythonWeb框架。本文详细介绍了Gunicorn的安装方法、主要特性、基本和高级功能,以及实际应用场景,帮助开发者全面掌握该库的使用。
Python
Web开发
服务器
并发处理
应用部署
里程碑!AI Agent 现在可以自己注册账号、购买域名、部署上线了
案例
里程碑!AI Agent 现在可以自己注册账号、购买域名、部署上线了
2026-05-04 07:37:15 +0800 CST
view 224
Cloudflare与Stripe合作推出Stripe Projects,让AI Agent可以自动完成账号创建、域名购买和应用部署,无需人工介入,标志着Agent能力边界的重要突破
Cloudflare
Stripe
AI Agent
自动化部署
无服务器
DevOps
实现系统的动态热部署功能,允许用户上传自定义实现的Jar包并在不重启系统的情况下自动加载
编程
实现系统的动态热部署功能,允许用户上传自定义实现的Jar包并在不重启系统的情况下自动加载
2024-11-18 20:57:45 +0800 CST
view 1500
本文讨论了如何实现系统的动态热部署功能,允许用户上传自定义实现的Jar包并在不重启系统的情况下自动加载。通过定义简单的计算器接口及其实现,展示了两种热部署方式:一种是通过反射加载Jar包,另一种是通过Spring上下文管理。还介绍了工具类DeployUtils的实现,提供了读取Jar包、判断SpringBean及生成Bean名称的方法,并提供了Jar包删除时同步删除SpringBean的代码示例。
Java
开发
热部署
Spring
编程
oh-my-claudecode 深度实战:让 Claude Code 从"写代码"到"能交付"——2026 年多智能体编排完全指南
编程
oh-my-claudecode 深度实战:让 Claude Code 从"写代码"到"能交付"——2026 年多智能体编排完全指南
2026-05-26 16:07:56 +0800 CST
view 123
深入剖析 oh-my-claudecode 的四层架构(Hooks、Skills、Agents、State),详解模型路由策略,并通过完整实战案例展示从需求到部署的全生命周期编排。
AI编程
Claude Code
多智能体
Agent编排
自动化部署
科大讯飞开源SkillHub:企业级智能体技能注册中心
案例
科大讯飞开源SkillHub:企业级智能体技能注册中心
2026-05-06 07:34:11 +0800 CST
view 244
科大讯飞开源SkillHub企业级智能体技能注册中心,自托管私有化部署,支持发布/发现/管理技能包,RBAC权限控制,两级审核治理,完整审计日志,Java 21 + React 19 + PostgreSQL 16技术栈
AI Agent
Skill Registry
企业级
讯飞开源
技能管理
Rbac
私有化部署
MCP 2026 契约范式深度解析:OpenAPI 3.1+ 动态契约广播、Python 服务部署提速 300%、WebAssembly 性能优化
编程
MCP 2026 契约范式深度解析:OpenAPI 3.1+ 动态契约广播、Python 服务部署提速 300%、WebAssembly 性能优化
2026-05-14 03:40:17 +0800 CST
view 209
MCP 2026契约范式深度解析:动态契约广播gRPC-Web+SSE、结构化错误语义含恢复建议码、语义版本兼容性断言,以及Python MCP服务部署提速300%基于FastAPI+Rust扩展+WebAssembly。
MCP2026,契约范式,动态契约广播,OpenAPI3.1,Python服务部署,WebAssembly
编程
使用 node-ssh 实现自动化部署
2024-11-18 20:06:21 +0800 CST
view 1439
本文介绍了如何使用node-ssh实现自动化部署,避免依赖Jenkins、GitLabCI/CD和GitHubActions。通过示例代码展示了如何与服务器建立SSH连接,执行命令,上传文件,以及实现完整的自动化部署流程,包括备份和Nginx配置的修改。适合需要快速部署的开发者。
自动化
开发工具
部署
AI-CS:开源AI智能客服系统,AI+人工一体、支持私有化部署
编程
AI-CS:开源AI智能客服系统,AI+人工一体、支持私有化部署
2026-05-14 07:02:13 +0800 CST
view 203
AI-CS是一款MIT协议开源的AI智能客服系统,Go+Next.js全栈架构,内置RAG知识库检索、多模型管理、实时草稿共享、数据报表和SEO官网,支持私有化部署,三步即可跑通。
AI客服
开源项目
Go
Next.js
RAG
私有化部署
前端容器化实战:使用Docker高效部署前端项目的完整指南
编程
前端容器化实战:使用Docker高效部署前端项目的完整指南
2025-09-11 17:13:31 +0800 CST
view 1256
本文详细介绍了使用Docker容器化部署前端项目的完整实践指南。内容包括Docker环境安装、优化Dockerfile编写、多阶段构建、Nginx配置优化、DockerCompose管理、环境变量配置以及CI/CD自动化部署。提供了具体的代码示例和最佳实践,帮助开发者实现高效、一致的前端项目部署,提升部署效率和系统可靠性。
前端开发
容器技术
DevOps
部署优化
Web开发
Hermes Agent 深度实战:Nous Research 的自进化 AI 智能体——三层记忆、GEPA 引擎与生产级部署完全指南(2026)
编程
Hermes Agent 深度实战:Nous Research 的自进化 AI 智能体——三层记忆、GEPA 引擎与生产级部署完全指南(2026)
2026-05-29 03:38:44 +0800 CST
view 75
深度解析 Hermes Agent 的三层记忆架构、GEPA 自进化引擎、技能自生成机制,附带完整 Python 实战代码和生产级 Kubernetes 部署方案。
AI Agent
Python
自进化
三层记忆
GEPA
Nous Research
生产级部署
DeerFlow 2.0 深度实战:字节跳动70K Star的Super Agent Harness——从架构原理到生产级部署完全指南(2026)
编程
DeerFlow 2.0 深度实战:字节跳动70K Star的Super Agent Harness——从架构原理到生产级部署完全指南(2026)
2026-05-30 13:39:31 +0800 CST
view 71
2026年2月28日,字节跳动开源的DeerFlow 2.0登上GitHub Trending全球榜首,70K+ Star。本文从架构原理、核心组件、上下文工程、Docker沙盒安全机制、多智能体协作、MCP工具扩展、生产级部署等维度,全面解析这款让一个人就是一支AI军团的Super Agent框架。
DeerFlow
字节跳动
AI Agent
Super Agent
LangGraph
多智能体
Docker沙盒
上下文工程
生产级部署
Hermes Agent 深度实战:自进化 AI Agent 的架构设计与生产级部署完全指南(2026)
编程
Hermes Agent 深度实战:自进化 AI Agent 的架构设计与生产级部署完全指南(2026)
2026-05-30 16:41:27 +0800 CST
view 106
深入解析 Nous Research 开源的 Hermes Agent:六层核心架构、GEPA 自进化闭环、三层持久记忆系统、200+ 模型支持,以及从 $5 VPS 到 Modal Serverless 的完整生产级部署实战指南。
AI Agent
Hermes Agent
Nous Research
自进化
GEPA
Skill系统
生产部署
ds4 深度解析:Redis 作者的最后一战?—— DwarfStar 4 本地推理引擎的技术革命
编程
ds4 深度解析:Redis 作者的最后一战?—— DwarfStar 4 本地推理引擎的技术革命
2026-05-15 17:47:40 +0800 CST
view 301
深入解析 antirez(Redis 作者)新开源项目 ds4:DwarfStar 4 本地推理引擎,专门为 DeepSeek V4 Flash 打造,支持 Metal/CUDA 后端,2-bit 量化可在 96GB 内存 MacBook 上运行 284B 参数模型。
AI推理
本地部署
DeepSeek
Redis
Apple Silicon
CUDA
Metal
MoE
量化
如何在生产环境中部署FastAPI应用程序
编程
如何在生产环境中部署FastAPI应用程序
2024-11-19 10:13:11 +0800 CST
view 2608
本文介绍了如何在生产环境中部署FastAPI应用程序,包括设置生产服务器、管理环境变量、使用反向代理和SSL/TLS加密等步骤。通过实际演示,读者可以学习如何使用Uvicorn和Gunicorn运行应用程序,配置Nginx作为反向代理,设置SSL/TLS证书,以及实现日志记录、中间件、CORS、速率限制和后台任务处理等功能,确保应用程序的安全性和性能。
Web开发
API
部署
安全性
性能优化
NeuTTS Air:0.5B参数超拟真语音合成,3秒音频克隆你的声音
编程
NeuTTS Air:0.5B参数超拟真语音合成,3秒音频克隆你的声音
2026-04-28 12:43:51 +0800 CST
view 229
NVIDIA开源NeuTTS Air——0.5B参数超拟真语音合成模型,仅需3秒音频即可完成声音克隆,可在手机、笔记本甚至树莓派上本地运行,完全保护隐私,无需联网。
AI
TTS
声音克隆
本地部署
NVIDIA
语音合成
边缘计算
Models.dev:OpenCode团队开源3.6K Star的AI模型数据库
案例
Models.dev:OpenCode团队开源3.6K Star的AI模型数据库
2026-05-07 07:11:58 +0800 CST
view 226
OpenCode团队开源的AI模型数据库,3.6K Star,219+贡献者维护。标准化整合数十家主流AI模型的价格、能力、规格信息,提供JSON API,支持精确成本估算,TOML格式数据
AI模型
模型对比
成本计算
OpenCode开源
TOML
JSON API
模型规格
Google AI Edge Gallery:手机离线跑大模型时代来了,2.2万Star端侧AI神器
案例
Google AI Edge Gallery:手机离线跑大模型时代来了,2.2万Star端侧AI神器
2026-05-09 07:36:45 +0800 CST
view 324
Google开源AI神器AI Edge Gallery斩获2.2万Star,支持iOS和Android手机离线运行Gemma 4等大模型,提供AI Chat、Ask Image、Audio Scribe、Agent Skills四大功能,消费级入口形态让普通用户轻松体验端侧AI
端侧AI
手机大模型
离线推理
Gemma 4
Google开源
iOS
Android
METATRON 深度解析:当 AI 渗透测试在本地跑出「免费版 GPT-4 安全助手」
编程
METATRON 深度解析:当 AI 渗透测试在本地跑出「免费版 GPT-4 安全助手」
2026-04-09 07:55:23 +0800 CST
view 711
深度解析 METATRON:如何在本地零成本跑起一个完整的 AI 渗透测试助手,基于 Qwen 微调模型 + Ollama + MariaDB,无需 API Key,数据完全不出本地。
AI渗透测试
Ollama
Qwen
本地大模型
MariaDB
Pentest
安全工具
Agent
GPT-6 深度解析:当"土豆"成为 AGI 的最后一公里
编程
GPT-6 深度解析:当"土豆"成为 AGI 的最后一公里
2026-04-09 08:39:00 +0800 CST
view 398
OpenAI GPT-6 深度解析:代号Spud,Symphony原生多模态架构、5-6万亿MoE参数、200万Token上下文、双系统推理框架,定位AGI最后一公里。含核心技术解读、架构分析、代码示例。
AI
GPT-6
OpenAI
AGI
大模型
Unsloth 深度实战:从显存爆炸到 70% 压缩——本地大模型微调的工程化革命与生产级实践
编程
Unsloth 深度实战:从显存爆炸到 70% 压缩——本地大模型微调的工程化革命与生产级实践
2026-05-22 16:15:29 +0800 CST
view 251
Unsloth通过底层算子优化让大模型微调显存降低70%、速度提升2-5x,本文从原理到生产实战全方位拆解,含完整代码。
Unsloth
LoRA
QLoRA
大模型微调
本地训练
超详细的Hermes Agent上手指南,养马不求人!GitHub最活跃的开源AI Agent框架
案例
超详细的Hermes Agent上手指南,养马不求人!GitHub最活跃的开源AI Agent框架
2026-05-09 10:29:10 +0800 CST
view 327
超详细的Hermes Agent上手指南。Hermes Agent是GitHub上最活跃的开源AI Agent框架之一,被称为「爱马仕」。支持MCP协议工具调用、多Agent协作、记忆系统(短期+长期),上手简单扩展强,适合快速搭建AI智能体。本文涵盖概念解析、安装部署、基础用法、进阶功能和实战案例。
AI Agent
开源框架
大模型
智能体
GitHub
工作流自动化
自定义工具
MCP
Hermes Agent
多Agent协作
记忆系统
Python
AstronClaw 深度解析:科大讯飞如何用软硬一体架构让AI Agent走进物理世界
编程
AstronClaw 深度解析:科大讯飞如何用软硬一体架构让AI Agent走进物理世界
2026-04-19 07:17:09 +0800 CST
view 413
深度解析科大讯飞AstronClaw软硬一体AI Agent架构,从技术原理到应用场景全面剖析,探讨AI Agent如何突破屏幕限制走进物理世界。
AstronClaw
科大讯飞
AI Agent
软硬一体
智能体
星火大模型
Loomy
GlassClaw
SkillHub
LiteLLM 深度解析:100+ 大模型统一网关的架构设计与生产实战
编程
LiteLLM 深度解析:100+ 大模型统一网关的架构设计与生产实战
2026-04-29 05:42:47 +0800 CST
view 287
深度解析开源AI网关LiteLLM:100+大模型统一接入、虚拟密钥体系、负载均衡与故障降级、MCP/A2A网关、生产级Docker部署实战
LiteLLM
AI网关
大模型
LLM
API网关
Python
Docker
云原生
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
...
6
下一页