程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
template-vue3-gin-fullstack:Vue3+Go Gin前后端分离全栈项目模板,开箱即用
案例
template-vue3-gin-fullstack:Vue3+Go Gin前后端分离全栈项目模板,开箱即用
2026-05-09 10:27:01 +0800 CST
view 141
template-vue3-gin-fullstack:一款基于Vue3+Go Gin的前后端分离全栈项目模板。技术栈涵盖Vue3.4+TypeScript5+Vite5+Pinia+TailwindCSS前端,以及Go1.22+Gin1.9+GORM+PostgreSQL+Redis+JWT+Zap后端。目录分层清晰(Handler/Service/Repository),JWT认证、Swagger文档、GitHub Actions CI/CD全部配好,clone即可开写业务代码。
全栈模板
Vue3
Go Gin
前后端分离
TypeScript
项目架构
CI/CD
GitHub Actions
PostgreSQL
Redis
JWT
Unsloth 深度实战:从显存爆炸到 70% 压缩——本地大模型微调的工程化革命与生产级实践
编程
Unsloth 深度实战:从显存爆炸到 70% 压缩——本地大模型微调的工程化革命与生产级实践
2026-05-22 16:15:29 +0800 CST
view 159
Unsloth通过底层算子优化让大模型微调显存降低70%、速度提升2-5x,本文从原理到生产实战全方位拆解,含完整代码。
Unsloth
LoRA
QLoRA
大模型微调
本地训练
Milvus 向量数据库深度实战:从零构建生产级 RAG 系统——AI 时代语义检索的架构设计与性能优化
编程
Milvus 向量数据库深度实战:从零构建生产级 RAG 系统——AI 时代语义检索的架构设计与性能优化
2026-05-22 18:14:42 +0800 CST
view 81
深入解析 Milvus 向量数据库的核心原理与架构设计,从向量嵌入、ANN 算法到 RAG 系统实战,涵盖生产环境性能优化技巧,助你构建企业级 AI 应用。
向量数据库
Milvus
RAG
AI
语义检索
向量检索
Embedding
HNSW
ANN
OpenScreen 深度解析:当开源撕掉屏幕录制的高价标签,开发者终于不用再被 Screen Studio 收割
编程
OpenScreen 深度解析:当开源撕掉屏幕录制的高价标签,开发者终于不用再被 Screen Studio 收割
2026-04-10 02:23:58 +0800 CST
view 525
深入解析OpenScreen:26K Stars的GitHub开源录屏工具,用Electron+FFmpeg技术栈复现Screen Studio全部核心功能,包括自动缩放、运动模糊、背景虚化等。跨平台支持macOS/Windows/Linux,完全免费开源。
OpenScreen
Screen Studio
Electron
FFmpeg
开源录屏
桌面应用
TypeScript
HunyuanVideo 1.5 深度解析:腾讯 8.3B 参数视频生成模型,消费级显卡的革命性突破
编程
HunyuanVideo 1.5 深度解析:腾讯 8.3B 参数视频生成模型,消费级显卡的革命性突破
2026-05-09 18:51:15 +0800 CST
view 163
腾讯混元开源 HunyuanVideo 1.5 视频生成模型,8.3B 参数 Diffusion Transformer 架构,14G 显存消费级显卡可运行。SSTA 稀疏注意力机制实现推理速度 1.87 倍提升,3D 因果 VAE 实现空间 16 倍、时间 4 倍压缩。
AI视频生成
腾讯混元
HunyuanVideo
Diffusion Transformer
SSTA
开源模型
消费级显卡
PostgreSQL + pgvector 向量检索深度实战:从嵌入存储到 AI 原生数据库的架构设计与生产级实践
编程
PostgreSQL + pgvector 向量检索深度实战:从嵌入存储到 AI 原生数据库的架构设计与生产级实践
2026-05-22 23:16:27 +0800 CST
view 102
深度实战 pgvector 向量检索扩展:从 HNSW 索引调优到生产级 RAG 系统构建,覆盖混合检索、AIDB 自动化管道、性能优化和分布式部署
PostgreSQL
pgvector
向量检索
RAG
AI数据库
HNSW
pgvector 向量检索与 AI 原生 PostgreSQL 深度实战:HNSW 调优、混合检索与生产级 RAG 全指南
编程
pgvector 向量检索与 AI 原生 PostgreSQL 深度实战:HNSW 调优、混合检索与生产级 RAG 全指南
2026-05-22 23:16:56 +0800 CST
view 83
深度实战 pgvector 向量检索扩展:从 HNSW 索引调优到生产级 RAG 系统构建,覆盖混合检索、AIDB 自动化管道、性能优化和分布式部署
PostgreSQL
pgvector
向量检索
RAG
AI数据库
HNSW
instinct 深度解析:当 AI Agent 第一次学会「从经验中自己长大」
编程
instinct 深度解析:当 AI Agent 第一次学会「从经验中自己长大」
2026-04-10 05:23:42 +0800 CST
view 298
instinct 是一个基于置信度的 AI Agent 自学习记忆系统,通过「观察→重复→成熟→建议」机制,让 Claude Code、Cursor 等 MCP Agent 具备跨会话自学习能力,从被动执行规则变成主动形成习惯。
AI Agent
记忆系统
instinct
置信度学习
MCP
Claude Code
Cursor
Insanely Fast Whisper 深度解析:比原版快 10 倍的语音转文字引擎——从原理到生产级部署的完整实战
编程
Insanely Fast Whisper 深度解析:比原版快 10 倍的语音转文字引擎——从原理到生产级部署的完整实战
2026-04-29 16:24:38 +0800 CST
view 187
深入解析Insanely Fast Whisper的优化原理、代码实战与生产部署,比原版Whisper快10倍的语音转文字方案
AI
语音识别
Whisper
Insanely Fast Whisper
Gemma 4 架构解密:MoE 路由 × GQA 注意力 × Thinking Mode——31B 如何击败 20 倍参数对手
编程
Gemma 4 架构解密:MoE 路由 × GQA 注意力 × Thinking Mode——31B 如何击败 20 倍参数对手
2026-04-19 17:47:49 +0800 CST
view 300
深入解析 Google Gemma 4 的核心技术架构:MoE 稀疏专家路由、GQA 分组查询注意力、PLE 逐层嵌入、Thinking Mode 推理机制,详解 31B 模型如何以小博大击败 20 倍参数对手,附全场景部署实战代码。
Gemma
Google
AI
开源大模型
MoE
GQA
Transformer
深度学习
模型架构
LiteRT-LM:Google端侧大模型推理引擎的革命性架构——从TensorFlow Lite的困境到LLM原生推理的全链路解析
编程
LiteRT-LM:Google端侧大模型推理引擎的革命性架构——从TensorFlow Lite的困境到LLM原生推理的全链路解析
2026-04-19 22:17:39 +0800 CST
view 445
深入解析Google LiteRT-LM端侧LLM推理引擎的核心架构:分层内存池、KV Cache量化、算子融合、WebGPU运行时。与TensorFlow Lite、llama.cpp、MLX横向对比,提供生产级部署实战指南。
Google
端侧AI
LiteRT-LM
WebGPU
量化
KV Cache
TensorFlow Lite
LLM推理
MCP 2026 深度解析:AI推理性能瓶颈诊断的12个隐性耗时陷阱——从TensorRT-LLM到vLLM再到Triton的全引擎实战
编程
MCP 2026 深度解析:AI推理性能瓶颈诊断的12个隐性耗时陷阱——从TensorRT-LLM到vLLM再到Triton的全引擎实战
2026-04-30 14:21:13 +0800 CST
view 208
深度解析MCP 2026基准测试框架,拆解TensorRT-LLM、vLLM、Triton三大推理引擎的12个隐性耗时陷阱,提供可落地的诊断方法与修复路径。
AI推理
性能优化
TensorRT-LLM
vLLM
Triton
MCP2026
GPU优化
SANA-WM 深度解析:2.6B 参数开源世界模型如何颠覆视频生成——从扩散Transformer到1分钟720p实时渲染的完整技术架构
编程
SANA-WM 深度解析:2.6B 参数开源世界模型如何颠覆视频生成——从扩散Transformer到1分钟720p实时渲染的完整技术架构
2026-05-16 21:15:15 +0800 CST
view 577
SANA-WM是NVIDIA Lab开源的2.6B参数世界模型视频生成系统,支持1分钟720p视频生成。本文从扩散Transformer底层数学到Flow Matching推理优化,完整解析其Dual-Pathway架构、3D VAE时空压缩、因果注意力掩码等核心技术,并提供完整PyTorch代码示例。
AI视频生成
世界模型
扩散模型
Transformer
Flow Matching
GuppyLM:5分钟从零训练一个LLM,870万参数小鱼模型的完整教学
编程
GuppyLM:5分钟从零训练一个LLM,870万参数小鱼模型的完整教学
2026-05-01 04:35:06 +0800 CST
view 178
GuppyLM是开源教育项目,870万参数小鱼角色扮演模型,5分钟Colab训练,覆盖数据生成到ONNX部署全流程,适合LLM初学者。
LLM
深度学习
开源
教学
Transformer
OpenSpec:AI编程助手的规范驱动开发框架,比Spec Kit更轻量
编程
OpenSpec:AI编程助手的规范驱动开发框架,比Spec Kit更轻量
2026-05-23 15:18:15 +0800 CST
view 87
OpenSpec是规范驱动开发(SDD)框架,为AI编程助手提供轻量级spec层,流动式迭代、支持20+AI工具、比Spec Kit更轻量、比Kiro更开放,MIT开源。
AI编程
OpenSpec
规范驱动
SDD
Claude Code
Codex
slash命令
LLM推理引擎终极对决:vLLM vs TensorRT-LLM深度解析与2026生产环境选型指南
编程
LLM推理引擎终极对决:vLLM vs TensorRT-LLM深度解析与2026生产环境选型指南
2026-04-20 13:45:31 +0800 CST
view 343
深度对比vLLM与TensorRT-LLM两大LLM推理框架,从PagedAttention到Kernel Fusion,从量化技术到生产部署,助你做出正确的技术选型决策
LLM
vLLM
TensorRT-LLM
推理优化
大模型部署
量化技术
AI工程
Unsloth 深度实战:从 Triton 内核优化到 70% 显存压缩——2026 年 LLM 本地微调的工业级完全指南
编程
Unsloth 深度实战:从 Triton 内核优化到 70% 显存压缩——2026 年 LLM 本地微调的工业级完全指南
2026-05-23 20:00:37 +0800 CST
view 59
深度剖析 Unsloth 如何通过手写 Triton 内核、智能显存管理和 LoRA/QLoRA 优化,实现训练速度 2-5 倍提升、显存占用降低 70% 的技术奇迹。
LLM
微调
Unsloth
LoRA
深度学习
Transformers.js v4 深度解析:WebGPU 原生化让 AI 推理在 Node/Bun/Deno 中真正起飞
编程
Transformers.js v4 深度解析:WebGPU 原生化让 AI 推理在 Node/Bun/Deno 中真正起飞
2026-04-12 04:55:32 +0800 CST
view 508
深度解析 Transformers.js v4 的 WebGPU 原生化架构:如何用 C++ 重写 WebGPU Runtime、与 ONNX Runtime 深度集成、在 Node/Bun/Deno 中实现原生 GPU AI 推理。包含代码实战、性能对比与生产部署指南。
JavaScript
AI
WebGPU
Transformers
HuggingFace
Node.js
Bun
Deno
ONNX
DeepGEMM 深度解析:DeepSeek 开源的 FP8 GEMM 内核如何重塑 AI 推理性能边界
编程
DeepGEMM 深度解析:DeepSeek 开源的 FP8 GEMM 内核如何重塑 AI 推理性能边界
2026-04-21 05:16:09 +0800 CST
view 414
深入剖析 DeepSeek 开源的 DeepGEMM 库:从 FP8 精度革命到 1550 TFLOPS 性能突破,揭秘现代 AI 推理基础设施的底层优化技术
DeepGEMM
FP8
DeepSeek
CUDA
AI推理
GPU优化
GEMM
TensorCore
React 19 useActionState 深度解析:从三Hook协作到循环队列调度的内核级剖析
编程
React 19 useActionState 深度解析:从三Hook协作到循环队列调度的内核级剖析
2026-05-17 12:44:17 +0800 CST
view 136
React 19 useActionState 深度解析,从三Hook协作、循环队列调度、Transition上下文恢复到Thenable状态追踪,源码级剖析内核实现机制。
React 19
useActionState
React Hooks
前端框架
源码分析
Ruflo深度解析:从单兵作战到AI蜂群指挥系统——40+K Stars的多智能体编排引擎全维度技术剖析
编程
Ruflo深度解析:从单兵作战到AI蜂群指挥系统——40+K Stars的多智能体编排引擎全维度技术剖析
2026-05-11 18:28:13 +0800 CST
view 243
Ruflo(48K+ Stars,v3.6.30)是面向Claude Code的多智能体编排平台,用100+专业化Agent、分布式共识算法和自学习记忆系统,让AI从单兵作战升级为蜂群协作。
Ruflo,Claude Code,多智能体编排,AI编程,Swarm协调,分布式共识,Agent,AI Agent,SONA,HNSW,Rust,WASM
nginx 1.29.8 深度解析:从 max_headers 到 OpenSSL 4.0 兼容,一次性吃透本次版本全部升级点
编程
nginx 1.29.8 深度解析:从 max_headers 到 OpenSSL 4.0 兼容,一次性吃透本次版本全部升级点
2026-04-12 12:56:27 +0800 CST
view 878
2026年4月7日nginx发布1.29.8版本,新增max_headers指令防御Slowloris攻击,全面兼容OpenSSL 4.0,修复Early Hints多响应处理异常和字符集解析漏洞。
nginx
nginx1.29
OpenSSL
Web安全
反向代理
服务器运维
性能优化
nginx 1.29.8 深度解析:max_headers安全加固、OpenSSL 4.0兼容、协议层Bug修复全攻略
编程
nginx 1.29.8 深度解析:max_headers安全加固、OpenSSL 4.0兼容、协议层Bug修复全攻略
2026-04-12 12:56:42 +0800 CST
view 387
2026年4月7日nginx发布1.29.8版本,新增max_headers指令防御Slowloris攻击,全面兼容OpenSSL 4.0,修复Early Hints多响应处理异常和字符集解析漏洞。
nginx
nginx1.29
OpenSSL
Web安全
反向代理
服务器运维
性能优化
2.8秒超越4小时调优:TabPFN如何用Transformer重写表格数据机器学习
编程
2.8秒超越4小时调优:TabPFN如何用Transformer重写表格数据机器学习
2026-05-12 00:20:07 +0800 CST
view 197
深度解析TabPFN如何用Transformer架构重写表格数据机器学习范式:从合成数据预训练、先验数据拟合原理、2.8秒vs4小时性能对比,到TabPFN-2.5的10万行处理能力与SAP收购战略意义,附完整代码示例
TabPFN,表格数据,Transformer,AutoML,机器学习,XGBoost,PriorLabs,深度学习,基础模型,Python
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
5
...
9
下一页