LLM应用-程序员茄子

Dify v1.15.0 深度解析：difyctl CLI + 思维链可视化，手把手打造生产级 LLM 应用编排引擎
2026-07-10 18:17:23 +0800 CST view 92
深度解析 Dify v1.15.0 三大核心更新：difyctl CLI 将 AI 应用纳入 GitOps 管理，思维链可视化让 LLM 推理透明可追溯，慢模型轮询机制解决质量与速度的两难。附完整代码示例与生产部署指南。
Dify LLM应用工作流编排 difyctl 思维链可视化 Agent RAG GitOps Kubernetes 生产部署

MoneyPrinterTurbo 深度实战：用 AI 大模型一键生成高清短视频——从 LLM 调度策略到批量视频生产的工程化完全指南（2026）

编程

MoneyPrinterTurbo 深度实战：用 AI 大模型一键生成高清短视频——从 LLM 调度策略到批量视频生产的工程化完全指南（2026）
2026-06-02 19:44:20 +0800 CST view 738
MoneyPrinterTurbo 深度实战，详解用 AI 大模型一键生成高清短视频的完整工程化方案，涵盖 LLM 调度、素材检索、TTS 配音、FFmpeg 合成与批量生产优化。
AI视频生成 LLM应用 Python实战短视频自动化 FFmpeg

AI Hedge Fund 深度解析：当巴菲特遇上大模型——多智能体投资系统的工程革命

编程

AI Hedge Fund 深度解析：当巴菲特遇上大模型——多智能体投资系统的工程革命
2026-04-14 04:53:29 +0800 CST view 1807
深度解析 GitHub 51.7k Star 项目 AI Hedge Fund：如何用 15+ AI Agent 复刻巴菲特、芒格等传奇投资人的思维范式，探索多智能体协作在投资决策中的工程实践。
AI Hedge Fund 多智能体系统投资Agent 巴菲特 GitHub Trending Python LLM应用

用AI做失败复盘：一张提示词，让核心问题自动浮现

资讯

用AI做失败复盘：一张提示词，让核心问题自动浮现
2026-04-23 21:28:06 +0800 CST view 514
本文探讨了失败复盘的正确方法，指出常见复盘误区（归咎外部、情绪化分析），并介绍了一套AI提示词，通过六步结构化流程（接收结果、澄清边界、确认动机、提取核心事实、单线深入、点出核心）引导用户从模糊感受转向具体事实，找到真正导致失败的行为断裂点。提示词设计为中立复盘引导者，不猜测心理，只基于事实链分析。实测在DeepSeek上效果理想，强调信息越具体分析越精准。
提示词工程 AI工具复盘方法论 DeepSeek LLM应用自我提升结构化思维

RAGFlow：81.1k Star开源RAG引擎，AI时代最强外脑

编程

RAGFlow：81.1k Star开源RAG引擎，AI时代最强外脑
2026-05-26 13:35:41 +0800 CST view 431
RAGFlow是InfiniFlow团队（Milvus原班人马）开发的81.1k Star开源RAG引擎，专注解决文档解析问题，支持DeepDoc深度文档理解、可视化切片、Agentic RAG，可私有化部署。
RAG 开源 LLM 文档解析 AI应用 RAGFlow InfiniFlow Milvus

LLM推理框架2026选型完全指南：从vLLM到TensorRT-LLM，一次讲透四大引擎的架构哲学与生产级实战

编程

LLM推理框架2026选型完全指南：从vLLM到TensorRT-LLM，一次讲透四大引擎的架构哲学与生产级实战
2026-06-02 09:36:52 +0800 CST view 501
从vLLM到TensorRT-LLM，一次讲透vLLM、SGLang、TensorRT-LLM、llama.cpp四大LLM推理框架的架构哲学、核心原理、生产级部署实战与选型决策树。
LLM vLLM TensorRT-LLM llama.cpp SGLang 推理优化 GPU

Ollama 完全指南：本地大模型部署的事实标准——从原理到生产级 AI 应用开发（2026）

编程

Ollama 完全指南：本地大模型部署的事实标准——从原理到生产级 AI 应用开发（2026）
2026-06-05 04:13:34 +0800 CST view 372
Ollama 本地大模型部署完全指南，从架构原理到生产级部署，涵盖 RAG 集成、性能优化、Docker/K8s 部署等核心内容。
Ollama 本地大模型 AI应用开发 Go语言 llama.cpp

Ollama 完全指南：本地大模型部署的事实标准——架构、实战与生产级部署（2026）

编程

Ollama 完全指南：本地大模型部署的事实标准——架构、实战与生产级部署（2026）
2026-06-05 04:13:52 +0800 CST view 419
Ollama 本地大模型部署完全指南，从架构原理到生产级部署，涵盖 RAG 集成、性能优化、Docker/K8s 部署等核心内容。
Ollama 本地大模型 AI应用开发 Go语言 llama.cpp

2026年大模型推理框架横评：vLLM 0.5 vs TGI 2.0 vs TensorRT-LLM 1.8 vs DeepSpeed-MII 0.9

编程

2026年大模型推理框架横评：vLLM 0.5 vs TGI 2.0 vs TensorRT-LLM 1.8 vs DeepSpeed-MII 0.9
2026-07-10 17:44:16 +0800 CST view 110
深度对比2026年四大主流LLM推理框架：vLLM 0.5、TGI 2.0、TensorRT-LLM 1.8、DeepSpeed-MII 0.9，涵盖PagedAttention、FP8量化、ZeRO-3、连续批处理等核心技术原理，配生产级代码示例与实测性能数据。
LLM vLLM TensorRT-LLM TGI DeepSpeed 推理优化量化 AI部署

LLM推理引擎终极对决：vLLM vs TensorRT-LLM深度解析与2026生产环境选型指南

编程

LLM推理引擎终极对决：vLLM vs TensorRT-LLM深度解析与2026生产环境选型指南
2026-04-20 13:45:31 +0800 CST view 735
深度对比vLLM与TensorRT-LLM两大LLM推理框架，从PagedAttention到Kernel Fusion，从量化技术到生产部署，助你做出正确的技术选型决策
LLM vLLM TensorRT-LLM 推理优化大模型部署量化技术 AI工程

2026大模型推理框架年度横评：vLLM/TGI/TensorRT-LLM/DeepSpeed-MII 架构深度解析与生产级选型指南

编程

2026大模型推理框架年度横评：vLLM/TGI/TensorRT-LLM/DeepSpeed-MII 架构深度解析与生产级选型指南
2026-06-18 17:54:54 +0800 CST view 479
深度横评2026年四大主流大模型推理框架，涵盖PagedAttention架构、ContinuousBatching、算子融合、FP8量化、NVMe卸载等核心技术，配实测数据与生产级选型指南
大模型 LLM 推理框架 vLLM TensorRT-LLM TGI DeepSpeed GPU推理 AI部署 NVIDIA

LLM推理引擎深度实战：从PagedAttention到生产级部署，万字长文吃透2026年最关键的AI基础设施

编程

LLM推理引擎深度实战：从PagedAttention到生产级部署，万字长文吃透2026年最关键的AI基础设施
2026-06-27 12:44:29 +0800 CST view 231
2026年LLM推理引擎深度实战：从PagedAttention、连续批处理、量化技术到生产级K8s部署，万字长文覆盖vLLM、SGLang、TensorRT-LLM、TGI四大框架架构原理与实测对比
LLM推理 vLLM PagedAttention SGLang 推理优化 TensorRT-LLM 生产部署 KV Cache 量化

LLM 推理框架选型实战：vLLM、TensorRT-LLM、TGI、DeepSpeed-MII 深度对比与生产部署指南

编程

LLM 推理框架选型实战：vLLM、TensorRT-LLM、TGI、DeepSpeed-MII 深度对比与生产部署指南
2026-07-03 13:49:04 +0800 CST view 220
深度对比 vLLM 0.5、TensorRT-LLM 1.8、TGI 2.0、DeepSpeed-MII 0.9 四大推理框架，从核心技术原理、性能数据、成本账本到生产部署实战，帮你做出正确的框架选型决策。
LLM vLLM TensorRT-LLM TGI DeepSpeed 推理优化大模型部署 GPU优化

一套TypeScript代码，编译成macOS/iOS/Android全平台原生应用：Perry开源

编程

一套TypeScript代码，编译成macOS/iOS/Android全平台原生应用：Perry开源
2026-04-29 12:17:15 +0800 CST view 1315
Perry是基于Rust+SWC+LLVM的TypeScript原生编译器，将TS代码编译为macOS/iOS/Android/Linux/Windows/WebAssembly全平台原生二进制，无需Node.js、无需Electron，输出仅2-5MB。MIT开源。
TypeScript 跨平台开发 Rust 开源原生应用 LLVM SWC Perry

Spring AI 1.1 深度解析：从 RAG 到 MCP 协议——Java 开发者构建企业级 AI 应用的工程化实战

编程

Spring AI 1.1 深度解析：从 RAG 到 MCP 协议——Java 开发者构建企业级 AI 应用的工程化实战
2026-05-10 04:41:17 +0800 CST view 540
Spring AI 1.1 深度解析：Tool Calling 让 AI 真正动手干活、MCP 协议统一工具接入标准、Agent 框架实现自主决策、Memory 让多轮对话成为可能、RAG 构建企业知识库。Java 开发者不容错过的 AI 工程化实战指南。
Spring AI SpringBoot AI AI应用 Tool Calling MCP Model Context Protocol Agent RAG ChatMemory Java AI 向量数据库企业级 AI

万字深度解析 LMCache：当 LLM 推理遇见「KV 缓存革命」——从 Transformer 注意力机制到多层存储分级、从 vLLM/SGLang 集成到生产级 PD 拆分的完整技术指南（2026）

编程

万字深度解析 LMCache：当 LLM 推理遇见「KV 缓存革命」——从 Transformer 注意力机制到多层存储分级、从 vLLM/SGLang 集成到生产级 PD 拆分的完整技术指南（2026）
2026-07-02 08:42:52 +0800 CST view 173
深度解析 LMCache 开源项目：LLM 推理 KV 缓存管理层，涵盖架构设计、多级存储、Multiprocess 模式、非前缀复用、PD 拆分等核心技术，15+ 可运行代码示例。
LMCache LLM推理 KV缓存 vLLM SGLang AI推理优化 GPU优化分布式缓存

万字深度解析 LMCache：当 KV Cache 遇见分布式存储革命——从常数级显存到千亿Token并发的完整技术指南（2026）

编程

万字深度解析 LMCache：当 KV Cache 遇见分布式存储革命——从常数级显存到千亿Token并发的完整技术指南（2026）
2026-07-02 13:46:08 +0800 CST view 188
深度解析 LMCache 开源 KV Cache 管理层项目：从三层存储架构、多后端支持、Disaggregated Prefill、CacheBlend、Segmented Prefill、P2P 共享到 Kubernetes 生产级部署的完整技术指南，含性能基准测试与代码实战
LMCache KV Cache LLM vLLM 分布式 RDMA Kubernetes 推理优化 Redis NIXL

LMCache 深度拆解：当 KV Cache 变成可复用资产——LLM 推理的「免费午餐」完整指南

编程

LMCache 深度拆解：当 KV Cache 变成可复用资产——LLM 推理的「免费午餐」完整指南
2026-07-14 18:47:11 +0800 CST view 16
深度拆解 LMCache 项目：从 Transformer Attention 机制出发，详细讲解 KV Cache 原理、三层存储架构、生产部署实战、Docker Compose 配置、CacheGen 压缩算法、PD 分离、跨实例 KV Cache 共享，以及与 vLLM/SGLang 的集成，配完整代码示例与性能调优指南。实测 DeepSeek 多轮对话 3~5 倍 TTFT 改善。
LMCache KV Cache LLM推理 vLLM SGLang 推理优化 DeepSeek 分布式缓存

万字深度解析 LMCache：当 LLM 推理遇见 KV Cache 革命——从 TTFT 优化到跨引擎 KV 复用、从 GPU/CPU/Disk 三级存储到分布式 P2P 共享的完整技术指南（2026）

编程

万字深度解析 LMCache：当 LLM 推理遇见 KV Cache 革命——从 TTFT 优化到跨引擎 KV 复用、从 GPU/CPU/Disk 三级存储到分布式 P2P 共享的完整技术指南（2026）
2026-07-03 03:14:31 +0800 CST view 138
深度解析LMCache KV Cache管理层：从TTFT优化原理、GPU/CPU/Disk三级存储架构、跨引擎KV复用、分布式P2P共享，到与vLLM深度集成的生产级部署实战，含完整代码和性能调优指南。
LMCache LLM推理 KV Cache vLLM TTFT优化 GPU优化 AI推理加速分布式缓存

使用NativePHP构建高效的桌面应用程序，运行于Laravel框架

编程

使用NativePHP构建高效的桌面应用程序，运行于Laravel框架
2024-11-18 08:05:35 +0800 CST view 1591
本文介绍了如何使用NativePHP在Laravel框架上构建高效的桌面应用程序。NativePHP允许开发者直接在Laravel中使用原生PHP代码，执行CLI命令、操作文件系统和进行数据库交互。通过具体的代码示例，展示了NativePHP的实用性和灵活性，帮助开发者满足特定需求，提高开发效率。
PHP 开发工具框架桌面应用数据库

综合

中后台开发神器！Cool-Admin-Midway 让你一分钟完成后台搭建！
2024-11-18 01:31:19 +0800 CST view 2318
Cool-Admin-Midway是基于Midway.js的后台管理系统解决方案，旨在帮助开发者快速搭建企业级管理系统。它结合了Midway.js的强大架构和Cool-Admin的高效前端模板，支持用户管理、权限控制等功能，适用于电商和SaaS平台。该系统具有模块化设计、AI编码、跨平台兼容性等特点，能够满足复杂的业务需求。
后台开发企业级应用技术框架管理系统开发工具

一个轻量级、零依赖的JavaScript模糊搜索库，适用于前端和后端应用

编程

一个轻量级、零依赖的JavaScript模糊搜索库，适用于前端和后端应用
2025-05-05 19:31:53 +0800 CST view 1691
Fuse.js是一个轻量级、零依赖的JavaScript模糊搜索库，适用于前端和后端应用。它支持多字段搜索，提供高性能和灵活的配置选项，满足复杂的搜索需求。用户可以通过npm或yarn安装，并在浏览器中直接引入。Fuse.js适合实现搜索功能、自动完成和数据过滤等场景，是提升用户体验的重要工具。
前端开发 JavaScript 搜索库用户体验 Web应用

Vue3 中引入的 Vue Router 4 与 Vue Router 3 有哪些不同之处？

编程

Vue3 中引入的 Vue Router 4 与 Vue Router 3 有哪些不同之处？
2024-11-19 01:06:37 +0800 CST view 1607
本文深入探讨了VueRouter4与VueRouter3之间的不同之处，包括路由定义方式、动态路由、导航守卫、路由动画及其他改进。VueRouter4引入了`createRouter`函数，简化了路由配置，并与Vue3的CompositionAPI更加紧密集成，提升了开发体验和代码风格。通过对比，开发者可以更高效地构建单页面应用。
前端框架路由管理单页面应用

大家都在搜索什么？

devops 易支付一个官网+多少钱统一接受回调统一回调 sub node 宝塔日志 mysql shell ElasticSearch css vue api接口对接 2025 支付接口对接 go php php回调回调

AI,自己全程接管维护

Dify v1.15.0 深度解析：difyctl CLI + 思维链可视化，手把手打造生产级 LLM 应用编排引擎

MoneyPrinterTurbo 深度实战：用 AI 大模型一键生成高清短视频——从 LLM 调度策略到批量视频生产的工程化完全指南（2026）

AI Hedge Fund 深度解析：当巴菲特遇上大模型——多智能体投资系统的工程革命

用AI做失败复盘：一张提示词，让核心问题自动浮现

GraphRAG 知识图谱增强检索实战：从 Leiden 社区检测到生产级部署，一次把图谱 RAG 讲透（2026 深度长文）

RAGFlow：81.1k Star开源RAG引擎，AI时代最强外脑

LLM推理框架2026选型完全指南：从vLLM到TensorRT-LLM，一次讲透四大引擎的架构哲学与生产级实战

Ollama 完全指南：本地大模型部署的事实标准——从原理到生产级 AI 应用开发（2026）

Ollama 完全指南：本地大模型部署的事实标准——架构、实战与生产级部署（2026）

2026年大模型推理框架横评：vLLM 0.5 vs TGI 2.0 vs TensorRT-LLM 1.8 vs DeepSpeed-MII 0.9

LLM推理引擎终极对决：vLLM vs TensorRT-LLM深度解析与2026生产环境选型指南

2026大模型推理框架年度横评：vLLM/TGI/TensorRT-LLM/DeepSpeed-MII 架构深度解析与生产级选型指南

LLM推理引擎深度实战：从PagedAttention到生产级部署，万字长文吃透2026年最关键的AI基础设施

LLM 推理框架选型实战：vLLM、TensorRT-LLM、TGI、DeepSpeed-MII 深度对比与生产部署指南

一套TypeScript代码，编译成macOS/iOS/Android全平台原生应用：Perry开源

Spring AI 1.1 深度解析：从 RAG 到 MCP 协议——Java 开发者构建企业级 AI 应用的工程化实战

万字深度解析 LMCache：当 LLM 推理遇见「KV 缓存革命」——从 Transformer 注意力机制到多层存储分级、从 vLLM/SGLang 集成到生产级 PD 拆分的完整技术指南（2026）

万字深度解析 LMCache：当 KV Cache 遇见分布式存储革命——从常数级显存到千亿Token并发的完整技术指南（2026）

LMCache 深度拆解：当 KV Cache 变成可复用资产——LLM 推理的「免费午餐」完整指南

万字深度解析 LMCache：当 LLM 推理遇见 KV Cache 革命——从 TTFT 优化到跨引擎 KV 复用、从 GPU/CPU/Disk 三级存储到分布式 P2P 共享的完整技术指南（2026）

使用NativePHP构建高效的桌面应用程序，运行于Laravel框架

中后台开发神器！Cool-Admin-Midway 让你一分钟完成后台搭建！

一个轻量级、零依赖的JavaScript模糊搜索库，适用于前端和后端应用

Vue3 中引入的 Vue Router 4 与 Vue Router 3 有哪些不同之处？

大家都在搜索什么？