程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Ollama 本地大模型部署实战:从零到生产级应用的完全指南(2026)
编程
Ollama 本地大模型部署实战:从零到生产级应用的完全指南(2026)
2026-06-10 01:20:57 +0800 CST
view 54
2026年Ollama本地大模型部署完全指南:从架构原理、GGUF量化、ModelFile自定义、多语言集成(Python/JS/Go)、RAG实战到Docker/K8s生产部署,8500字深度长文。
Ollama
本地部署
大模型
LLM
生产级
GGUF
量化
TensorRT-LLM 深度实战:从 Blackwell 架构到 INT4 量化的 LLM 推理性能革命
编程
TensorRT-LLM 深度实战:从 Blackwell 架构到 INT4 量化的 LLM 推理性能革命
2026-05-22 06:19:51 +0800 CST
view 265
深入解析TensorRT-LLM推理框架,从Paged KV Cache、连续批处理到INT4/INT8/FP8量化实战,覆盖Blackwell架构适配、Triton部署与K8s生产方案
TensorRT-LLM
LLM推理
量化
INT4
Blackwell
GPU优化
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
编程
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
2026-04-09 03:15:44 +0800 CST
view 670
2026年TensorRT-LLM v0.19全面解析:Skip Softmax稀疏注意力、Paged KV Cache显存管理、INT8/INT4低比特量化完整实战,Blackwell架构适配指南,70B模型单卡部署方案
TensorRT-LLM
低比特量化
Blackwell
INT8
INT4
推理优化
NVIDIA
TileLang + TileKernels 深度解析:DeepSeek 如何用 Python 写出让 GPU 逼近理论性能上限的 GPU 内核
编程
TileLang + TileKernels 深度解析:DeepSeek 如何用 Python 写出让 GPU 逼近理论性能上限的 GPU 内核
2026-04-28 10:55:20 +0800 CST
view 272
深度剖析 DeepSeek 开源的 TileLang DSL 和 TileKernels GPU 内核库:从 GEMM 到 MoE,从 TVM 编译基础设施到生产级量化内核,揭示用 Python 写接近硬件极限性能 GPU 代码的秘密。
TileLang
GPU内核
DeepSeek
高性能计算
CUDA
GEMM
MoE
量化
TVM
开源项目
MemPalace 深度解析:记忆宫殿架构如何让 AI Agent 告别"金鱼记忆"
编程
MemPalace 深度解析:记忆宫殿架构如何让 AI Agent 告别"金鱼记忆"
2026-06-10 11:48:11 +0800 CST
view 31
深度解析 MemPalace——54k Stars 的开源 AI Agent 记忆系统,用记忆宫殿架构实现 96.6% R@5 召回率,无需 API key 完全本地运行。
AI Agent
MemPalace
记忆系统
MCP
向量检索
LongMemEval
RAG-Anything 深度解析:19K Star 的多模态 RAG 终极解决方案,让 AI 真正读懂图文表公式
编程
RAG-Anything 深度解析:19K Star 的多模态 RAG 终极解决方案,让 AI 真正读懂图文表公式
2026-04-28 21:16:14 +0800 CST
view 350
深度解析 GitHub 19K Star 的 RAG-Anything 多模态 RAG 框架:All-in-One 架构设计、MinerU 文档解析、多模态知识图谱、向量-图谱融合检索,完整覆盖从原理到生产部署的技术细节。
RAG
多模态
知识图谱
LightRAG
MinerU
AI
向量检索
文档处理
PostgreSQL 18 深度解析:I/O 子系统重构与 AI 时代的数据底座进化
编程
PostgreSQL 18 深度解析:I/O 子系统重构与 AI 时代的数据底座进化
2026-05-09 12:14:33 +0800 CST
view 322
PostgreSQL 18 发布:I/O 子系统重构带来 3 倍性能提升,虚拟生成列节省 30% 存储,uuidv7 时间有序 UUID,OAuth 2.0 企业集成,pgvector + DiskANN 亿级向量检索,SQL:2023 标准兼容。
PostgreSQL
数据库
性能优化
向量检索
AI
达梦图数据库 V4.0 深度实战:图原生+向量深度融合,千亿级数据让AI真正"懂业务"
编程
达梦图数据库 V4.0 深度实战:图原生+向量深度融合,千亿级数据让AI真正"懂业务"
2026-05-16 13:15:18 +0800 CST
view 223
2026年4月,达梦数据发布图数据库V4.0,实现图原生与向量数据库的深度融合理念。本文深度解析其架构设计、三大AI增强能力和千亿级性能优化实践。
数据库
图数据库
向量数据库
AI
达梦
达梦GDMBASE V4.0揭秘:千亿级图数据库与向量数据库的"原生融合"架构革命
编程
达梦GDMBASE V4.0揭秘:千亿级图数据库与向量数据库的"原生融合"架构革命
2026-05-16 13:15:41 +0800 CST
view 266
2026年4月,达梦数据发布图数据库V4.0,实现图原生与向量数据库的深度融合理念。本文深度解析其架构设计、三大AI增强能力和千亿级性能优化实践。
数据库
图数据库
向量数据库
AI
达梦
PostgreSQL + pgvector 向量检索深度实战:从嵌入存储到 AI 原生数据库的架构设计与生产级实践
编程
PostgreSQL + pgvector 向量检索深度实战:从嵌入存储到 AI 原生数据库的架构设计与生产级实践
2026-05-22 23:16:27 +0800 CST
view 197
深度实战 pgvector 向量检索扩展:从 HNSW 索引调优到生产级 RAG 系统构建,覆盖混合检索、AIDB 自动化管道、性能优化和分布式部署
PostgreSQL
pgvector
向量检索
RAG
AI数据库
HNSW
pgvector 向量检索与 AI 原生 PostgreSQL 深度实战:HNSW 调优、混合检索与生产级 RAG 全指南
编程
pgvector 向量检索与 AI 原生 PostgreSQL 深度实战:HNSW 调优、混合检索与生产级 RAG 全指南
2026-05-22 23:16:56 +0800 CST
view 159
深度实战 pgvector 向量检索扩展:从 HNSW 索引调优到生产级 RAG 系统构建,覆盖混合检索、AIDB 自动化管道、性能优化和分布式部署
PostgreSQL
pgvector
向量检索
RAG
AI数据库
HNSW
pgvector 深度实战:当 PostgreSQL 遇上向量搜索——从 HNSW 索引到生产级 RAG 管道的完全指南(2026)
编程
pgvector 深度实战:当 PostgreSQL 遇上向量搜索——从 HNSW 索引到生产级 RAG 管道的完全指南(2026)
2026-06-10 21:48:26 +0800 CST
view 20
pgvector 实战指南:从 HNSW 索引原理到生产级 RAG 管道构建,包含性能优化、高可用方案和 23 个避坑指南。
PostgreSQL
pgvector
向量搜索
RAG
HNSW
Spring AI 1.1 深度解析:从 RAG 到 MCP 协议——Java 开发者构建企业级 AI 应用的工程化实战
编程
Spring AI 1.1 深度解析:从 RAG 到 MCP 协议——Java 开发者构建企业级 AI 应用的工程化实战
2026-05-10 04:41:17 +0800 CST
view 290
Spring AI 1.1 深度解析:Tool Calling 让 AI 真正动手干活、MCP 协议统一工具接入标准、Agent 框架实现自主决策、Memory 让多轮对话成为可能、RAG 构建企业知识库。Java 开发者不容错过的 AI 工程化实战指南。
Spring AI
SpringBoot AI
AI应用
Tool Calling
MCP
Model Context Protocol
Agent
RAG
ChatMemory
Java AI
向量数据库
企业级 AI
MySQL 9.7 LTS 深度解析:企业级功能下放社区,从向量检索到 Hypergraph 优化器的数据库新纪元
编程
MySQL 9.7 LTS 深度解析:企业级功能下放社区,从向量检索到 Hypergraph 优化器的数据库新纪元
2026-05-10 15:21:45 +0800 CST
view 401
MySQL 9.7 LTS 深度解析:Oracle 将企业版功能下放社区,VECTOR 向量类型支持 RAG,Hypergraph 优化器解决复杂 JOIN,JSON Duality Views 实现关系与文档一体化,性能翻倍至 500K QPS
MySQL
数据库
向量检索
Hypergraph
AI
RAG
Milvus 向量数据库全链路优化:从零构建千亿级向量检索系统的完整实战
编程
Milvus 向量数据库全链路优化:从零构建千亿级向量检索系统的完整实战
2026-05-16 22:47:08 +0800 CST
view 205
深入解析 Milvus 2.x 分布式向量数据库架构设计与全链路性能优化,从部署规划、数据建模、索引策略到高可用运维,提供千亿级向量检索系统构建的完整实战指南。
Milvus
向量数据库
RAG
性能优化
分布式系统
PostgreSQL 18 深度实战:从 I/O 子系统重构到 AI 原生向量数据库——新一代开源关系型数据库的架构完全指南
编程
PostgreSQL 18 深度实战:从 I/O 子系统重构到 AI 原生向量数据库——新一代开源关系型数据库的架构完全指南
2026-05-23 15:16:30 +0800 CST
view 194
深入剖析 PostgreSQL 18 的核心新特性:I/O 子系统重构带来 3 倍性能提升、Skip Scan 彻底解决索引设计痛点、虚拟生成列优化存储、OAuth 2.0 企业级 SSO 集成、pgvector 向量检索深度融合。从架构设计到生产实战,完整指南。
PostgreSQL
数据库
性能优化
AI原生
向量数据库
Claude-Mem 深度实战:从上下文碎片到持久化记忆——让 AI 编程助手拥有「永不遗忘」的超级大脑(2026 完全指南)
编程
Claude-Mem 深度实战:从上下文碎片到持久化记忆——让 AI 编程助手拥有「永不遗忘」的超级大脑(2026 完全指南)
2026-05-24 01:00:27 +0800 CST
view 131
Claude-Mem 深度实战指南,详解如何让 AI 编程助手拥有跨会话持久记忆,从架构设计到代码实战,从 SQLite 到 Chroma 的双层记忆引擎全解析。
AI
编程助手
记忆持久化
Claude Code
向量数据库
Apache Doris 4.1 深度拆解:当实时数仓长出 AI 大脑——从向量检索到统一数据底座的全链路技术实战
编程
Apache Doris 4.1 深度拆解:当实时数仓长出 AI 大脑——从向量检索到统一数据底座的全链路技术实战
2026-05-02 10:33:28 +0800 CST
view 321
深入拆解Apache Doris 4.1的技术内核:从FE/BE架构到存算分离、从原生向量检索到混合搜索、从RAG实战到生产部署,全方位解析实时数仓如何演化为AI时代统一数据底座
Apache Doris
向量检索
实时数仓
RAG
存算分离
OLAP
AI数据库
Redis 8.6 深度解析:5倍性能飞跃背后的技术革命——从 CAS 原子操作到向量搜索的全链路实战
编程
Redis 8.6 深度解析:5倍性能飞跃背后的技术革命——从 CAS 原子操作到向量搜索的全链路实战
2026-05-02 13:04:06 +0800 CST
view 282
深度解析 Redis 8.6 核心特性:5倍性能提升、CAS/CAD 原子操作、向量搜索、Streams 增强。从原理到实战,含 Node.js/Python/Go/Java 多语言代码示例。
Redis
数据库
性能优化
分布式系统
向量搜索
国产向量数据库新势力:KVectors如何用APPEND_ONLY设计重新定义AI数据存储
编程
国产向量数据库新势力:KVectors如何用APPEND_ONLY设计重新定义AI数据存储
2026-05-11 18:56:58 +0800 CST
view 229
深度解析KVectors的APPEND_ONLY设计哲学、FLAT/HNSW/IVF三层索引演进、以图搜图实战代码,附与Milvus/Qdrant/Weaviate的完整对比
向量数据库
AI
RAG
Scala
索引算法
ClickHouse 2026 深度实战:从列式存储到向量检索——OLAP 之王的全栈工程化完全指南
编程
ClickHouse 2026 深度实战:从列式存储到向量检索——OLAP 之王的全栈工程化完全指南
2026-05-24 10:34:46 +0800 CST
view 267
2026年ClickHouse深度实战完全指南:从列式存储原理到MergeTree引擎家族,从集群架构到最新向量检索能力,从数据摄入到生产级性能调优,覆盖12大核心主题的工程化长文。
ClickHouse
OLAP
数据库
列式存储
向量检索
Redis 8 深度解析:开源缓存的「性能狂飙」与「One Redis」革命
编程
Redis 8 深度解析:开源缓存的「性能狂飙」与「One Redis」革命
2026-05-12 02:25:32 +0800 CST
view 250
深度解析Redis 8的核心突破:One Redis理念将所有模块内置告别碎片化、I/O线程机制重写让吞吐量提升112%(8线程)、30项性能优化让命令延迟最高降低87%、内存优化让Hash表占用-16.7%有序集合-30.5%、新增8种数据结构(Vector Set/JSON/Time Series/概率结构)、Redis Query Engine查询处理能力16倍提升、Redis 8.6新增热键检测HOTKEYS与LRM逐出策略
Redis8,缓存,性能优化,OneRedis,数据结构,内存优化,I/O线程,全文搜索,向量搜索,热键检测
Claude Context 深度实战:让 AI 读懂你整个代码库——语义代码搜索引擎从原理到生产级部署完全指南(2026)
编程
Claude Context 深度实战:让 AI 读懂你整个代码库——语义代码搜索引擎从原理到生产级部署完全指南(2026)
2026-06-04 09:26:09 +0800 CST
view 133
Claude Context 是 Zilliz 开源的 MCP 插件,通过 AST 智能代码分块和混合检索将整个代码库转化为 AI 编程助手的语义知识库,实测 Token 消耗降低约 40%。
Claude Context
语义搜索
MCP协议
向量数据库
AI编程
Claude Code 持久记忆实战:从三层压缩机制到 Claude-Mem 的跨会话记忆实现
编程
Claude Code 持久记忆实战:从三层压缩机制到 Claude-Mem 的跨会话记忆实现
2026-04-22 09:32:54 +0800 CST
view 424
深入解析 Claude Code 三层上下文压缩机制的局限,以及开源项目 Claude-Mem 如何通过 SQLite+向量检索双轨架构实现跨会话持久记忆,并探讨记忆插件背后的商业博弈与技术启示。
Claude Code
CIaude-Mem
上下文压缩
AI编程
持久记忆
LLM
向量检索
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
5
下一页