程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
ds4 深度实战:当 Redis 之父用纯 C 重写本地推理引擎——从 KV 缓存磁盘持久化到 Metal 极致优化的完全指南
编程
ds4 深度实战:当 Redis 之父用纯 C 重写本地推理引擎——从 KV 缓存磁盘持久化到 Metal 极致优化的完全指南
2026-06-11 07:51:35 +0800 CST
view 57
Redis之父antirez新作ds4深度解析:非对称2-bit量化、KV缓存磁盘持久化、Metal极致优化,284B模型在MacBook上跑出26 tok/s的完全指南
ds4
DeepSeek
本地推理
Metal
KV缓存
量化
antirez
Redis
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
编程
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
2026-05-11 10:53:54 +0800 CST
view 317
DeepSeek-V4-Pro 以 1.6T 总参数、49B 激活参数的 MoE 架构,原生支持 100 万 token 上下文,同时将推理算力降至 V3.2 的 27%、KV Cache 降至 10%。本文深度解析 CSA/HCA 混合注意力机制、mHC 流形约束超连接、KV Cache 极致优化、Muon 优化器等核心技术创新,以及如何在 Ollama、vLLM、官方 API 三种方式下部署运行。
DeepSeek-V4,MoE架构,CSA注意力,HCA注意力,KV Cache,1M上下文,长文本推理,开源大模型
DeepSeek-TUI 深度解析:Rust 打造的终端 AI 编程 Agent——从 1M 上下文到 RLM 多智能体并发的完整技术架构
编程
DeepSeek-TUI 深度解析:Rust 打造的终端 AI 编程 Agent——从 1M 上下文到 RLM 多智能体并发的完整技术架构
2026-05-17 07:14:51 +0800 CST
view 292
深度拆解 DeepSeek-TUI:99.3% Rust 编写的终端 AI 编程 Agent,1M 上下文、RLM 多智能体并发、前缀缓存优化、OS 级沙箱的完整技术架构与实战指南
DeepSeek
AI编程
Rust
终端Agent
开源项目
ds4 深度解析:当 Redis 之父用 C 语言手写 AI 推理引擎——从「窄而深」哲学到把 284B 模型塞进一台 MacBook 的技术全拆解
编程
ds4 深度解析:当 Redis 之父用 C 语言手写 AI 推理引擎——从「窄而深」哲学到把 284B 模型塞进一台 MacBook 的技术全拆解
2026-06-12 18:19:08 +0800 CST
view 33
深度解析 Redis 之父 antirez 最新开源项目 ds4(DwarfStar):一个纯 C 语言手写的 DeepSeek V4 Flash 本地推理引擎。从「窄而深」的工程哲学、非对称 2-bit 量化、磁盘 KV 缓存、Metal/CUDA 内核优化到实际部署,完整拆解这个 13K+ Star 项目的技术内幕。
AI推理引擎
DeepSeek
本地推理
系统编程
开源项目
C语言
英伟达免费开放H100算力:DeepSeek、Kimi、GLM等主流大模型API免费用
编程
英伟达免费开放H100算力:DeepSeek、Kimi、GLM等主流大模型API免费用
2026-04-21 13:09:34 +0800 CST
view 1481
英伟达Build平台免费开放H100算力和主流大模型API,支持DeepSeek、Kimi、GLM等,3步拿到Key,代码对接OpenAI格式即可使用。
NVIDIA
大模型
免费API
DeepSeek
Kimi
大模型部署太慢?这个超级引擎帮你搞定!SGLang速通指南
编程
大模型部署太慢?这个超级引擎帮你搞定!SGLang速通指南
2026-04-22 09:27:57 +0800 CST
view 384
DeepSeek官方推荐!SGLang高性能大模型推理框架速通指南,RadixAttention前缀缓存、零开销调度、OpenAI API兼容,性能碾压vLLM。
SGLang
大模型推理
DeepSeek
开源
vLLM
DeepSeek-TUI 深度解析:用 Rust 重塑终端 AI 编程体验——从双二进制架构到 1M 上下文的工程实践
编程
DeepSeek-TUI 深度解析:用 Rust 重塑终端 AI 编程体验——从双二进制架构到 1M 上下文的工程实践
2026-05-18 10:28:09 +0800 CST
view 246
深度解析 DeepSeek-TUI 的架构设计、核心特性与实战应用,一款用 Rust 编写的终端原生 AI 编程代理,支持 1M 上下文、子代理并行执行和 MCP 协议扩展。
AI
编程
Rust
终端
DeepSeek
DeepSeek-TUI 技术解密:Rust 编写的终端 AI 编程助手——双二进制架构与百万 token 上下文实战
编程
DeepSeek-TUI 技术解密:Rust 编写的终端 AI 编程助手——双二进制架构与百万 token 上下文实战
2026-05-18 10:29:38 +0800 CST
view 206
深度解析 DeepSeek-TUI 的架构设计、核心特性与实战应用,一款用 Rust 编写的终端原生 AI 编程代理,支持 1M 上下文、子代理并行执行和 MCP 协议扩展。
AI
编程
Rust
终端
DeepSeek
DeepSeek DeepGEMM 2026年4月重磅更新:Mega MoE融合算子、FP4精度与极致性能优化
编程
DeepSeek DeepGEMM 2026年4月重磅更新:Mega MoE融合算子、FP4精度与极致性能优化
2026-04-23 08:41:45 +0800 CST
view 299
深度解析DeepSeek DeepGEMM 2026年4月重大更新:Mega MoE融合算子(dispatch+Linear+SwiGLU+Combine五合一,NVLink通信与Tensor Core计算重叠)、FP8xFP4 GEMM、FP4 Indexer、PDL调度优化与JIT加速,附完整代码实战。
DeepGEMM
DeepSeek
GPU优化
CUDA
FP8
FP4
MoE
AI Infra
高性能计算
NVIDIA
DeepSeek-TUI 深度解析:Rust 打造的终端原生编程 Agent——从双二进制架构到 RLM 并行子代理的完整技术内幕
编程
DeepSeek-TUI 深度解析:Rust 打造的终端原生编程 Agent——从双二进制架构到 RLM 并行子代理的完整技术内幕
2026-05-18 20:50:31 +0800 CST
view 236
深度解析 DeepSeek-TUI:Rust 打造的终端原生编程 Agent,从双二进制架构到 RLM 并行子代理的完整技术内幕。
DeepSeek
Rust
AI编程
Agent
终端
开源
用AI做失败复盘:一张提示词,让核心问题自动浮现
资讯
用AI做失败复盘:一张提示词,让核心问题自动浮现
2026-04-23 21:28:06 +0800 CST
view 309
本文探讨了失败复盘的正确方法,指出常见复盘误区(归咎外部、情绪化分析),并介绍了一套AI提示词,通过六步结构化流程(接收结果、澄清边界、确认动机、提取核心事实、单线深入、点出核心)引导用户从模糊感受转向具体事实,找到真正导致失败的行为断裂点。提示词设计为中立复盘引导者,不猜测心理,只基于事实链分析。实测在DeepSeek上效果理想,强调信息越具体分析越精准。
提示词工程
AI工具
复盘方法论
DeepSeek
LLM应用
自我提升
结构化思维
DeepSeek-V4预览版深度解析:MoE架构+百万上下文+1.6T参数,开源旗舰模型全面升级
编程
DeepSeek-V4预览版深度解析:MoE架构+百万上下文+1.6T参数,开源旗舰模型全面升级
2026-04-24 17:19:28 +0800 CST
view 408
2026年4月24日DeepSeek发布V4预览版,总参1.6T/284B,激活49B/13B,100万Token上下文,DSA稀疏注意力,兼容OpenAI+Anthropic双协议,昇腾与寒武纪Day 0适配,深度解析其架构与API用法。
DeepSeek
V4
MoE
大模型
开源
DwarfStar 深度解析:antirez 的 DeepSeek V4 Flash 本地推理引擎——Metal 与 CUDA 双轨优化革命(2026 完全指南)
编程
DwarfStar 深度解析:antirez 的 DeepSeek V4 Flash 本地推理引擎——Metal 与 CUDA 双轨优化革命(2026 完全指南)
2026-05-28 19:13:18 +0800 CST
view 198
DwarfStar(ds4)是Redis创始人antirez开发的DeepSeek V4 Flash专用推理引擎,支持Metal与CUDA双轨优化、磁盘KV Cache、imatrix量化和原生Agent集成。本文深入解析其架构设计与性能表现。
DeepSeek
ds4
Metal
CUDA
本地推理
MoE
量化
GGUF
Agent
Python
C
DeepSeek-R1边缘推理实战:从云端独占到本地智能的范式转移
编程
DeepSeek-R1边缘推理实战:从云端独占到本地智能的范式转移
2026-05-19 12:42:27 +0800 CST
view 227
2026年,边缘AI不再只是云端模型的精简版。本文深入剖析DeepSeek-R1 CPU版的技术原理,从模型蒸馏、量化技术的底层原理到生产环境的完整部署方案,提供可直接落地的代码和可量化的性能数据。
DeepSeek
R1
边缘计算
AI推理
模型蒸馏
量化
llama.cpp
Ollama
端侧AI
DeepSeek-V4 深度解析:百万Token上下文与MoE架构的技术革命
编程
DeepSeek-V4 深度解析:百万Token上下文与MoE架构的技术革命
2026-04-26 08:10:21 +0800 CST
view 438
深度解析DeepSeek-V4的技术突破:百万Token原生上下文、万亿级MoE架构、国产芯片适配。从技术原理到工程实践,全面剖析这场开源AI的革命。
DeepSeek
大模型
MoE
百万上下文
开源AI
DeepSeek-TUI 深度实战:用 Rust 打造的终端 AI 编程革命——从零构建 DeepSeek V4 驱动的智能开发环境
编程
DeepSeek-TUI 深度实战:用 Rust 打造的终端 AI 编程革命——从零构建 DeepSeek V4 驱动的智能开发环境
2026-05-22 04:22:02 +0800 CST
view 190
深入剖析 DeepSeek-TUI 的技术架构、Rust 实现细节、核心算法,并通过完整可运行的代码示例,教你构建终端 AI 编程助手。
DeepSeek
Rust
终端AI
编程助手
TUI
DeepSeek V4 深度解析:百万token上下文的技术革命,让开源模型站上全球之巅
编程
DeepSeek V4 深度解析:百万token上下文的技术革命,让开源模型站上全球之巅
2026-04-28 08:19:25 +0800 CST
view 400
深度解析 DeepSeek V4:混合注意力机制、MoE 架构、100万token 上下文、Agent 能力,从技术原理到部署实战,全面剖析开源模型新天花板
DeepSeek
AI大模型
开源
长上下文
MoE
混合注意力
Agent
TileLang + TileKernels 深度解析:DeepSeek 如何用 Python 写出让 GPU 逼近理论性能上限的 GPU 内核
编程
TileLang + TileKernels 深度解析:DeepSeek 如何用 Python 写出让 GPU 逼近理论性能上限的 GPU 内核
2026-04-28 10:55:20 +0800 CST
view 291
深度剖析 DeepSeek 开源的 TileLang DSL 和 TileKernels GPU 内核库:从 GEMM 到 MoE,从 TVM 编译基础设施到生产级量化内核,揭示用 Python 写接近硬件极限性能 GPU 代码的秘密。
TileLang
GPU内核
DeepSeek
高性能计算
CUDA
GEMM
MoE
量化
TVM
开源项目
Chrome DevTools MCP 深度实战:让 AI Agent 直接接管浏览器调试——从 MCP 协议原理到生产级集成的完全指南(2026)
编程
Chrome DevTools MCP 深度实战:让 AI Agent 直接接管浏览器调试——从 MCP 协议原理到生产级集成的完全指南(2026)
2026-06-01 22:52:21 +0800 CST
view 251
2026年Chrome DevTools MCP完全指南:Google官方让AI Agent直接接管浏览器调试能力,从MCP协议原理、架构拆解、22个工具矩阵到3个生产级实战案例,深度解析前端调试的范式革命。
Chrome DevTools
MCP协议
AI编程
前端调试
浏览器自动化
MCP Server
AI Agent
Chrome
Chrome DevTools MCP 技术内幕:从 CDP 协议底层到 MCP 语义化抽象的完整架构解析
编程
Chrome DevTools MCP 技术内幕:从 CDP 协议底层到 MCP 语义化抽象的完整架构解析
2026-05-16 15:15:33 +0800 CST
view 280
深入剖析38K Star的Google官方Chrome DevTools MCP Server,揭示CDP协议底层架构与MCP语义抽象的完整技术链路,附5大实战场景。
Chrome DevTools MCP
MCP协议
AI编程助手
CDP协议
Browser自动化
Devin 深度解析:260 亿美元估值背后,AI 编程智能体的技术架构、工程实践与未来走向(2026)
编程
Devin 深度解析:260 亿美元估值背后,AI 编程智能体的技术架构、工程实践与未来走向(2026)
2026-06-05 08:14:53 +0800 CST
view 209
深度解析 Cognition AI 的 Devin:260 亿美元估值背后的技术架构、代码能力实测(对比 Cursor/Copilot/Devin 2.0)、工程落地实践,以及 AI 编程赛道的 2026 年竞争格局与未来走向。
AI编程
Devin
AI Agent
Cognition
Coding Agent
9Router 深度解析:开源路由器如何让 AI 编程成本归零,RTK 压缩省 40% Token
编程
9Router 深度解析:开源路由器如何让 AI 编程成本归零,RTK 压缩省 40% Token
2026-05-12 02:44:46 +0800 CST
view 546
深度解析9Router:RTK Token Saver压缩工具输出省20-40% token、Caveman Mode省65%输出token、三层自动降级Subscription→Cheap→Free、40+供应商100+模型、格式转换9种API格式、多账户轮询+OAuth自动刷新
9Router,AI路由器,RTK,Token压缩,ClaudeCode,Cursor,多模型路由,自动降级,KiroAI,免费AI编程,CavemanMode,OpenAI兼容
微软 Build 2026 全景拆解:从MAI-Thinking-1零蒸馏推理到MXC安全沙箱,Agent优先时代的七款自研模型+量子芯片深度技术指南(2026)
编程
微软 Build 2026 全景拆解:从MAI-Thinking-1零蒸馏推理到MXC安全沙箱,Agent优先时代的七款自研模型+量子芯片深度技术指南(2026)
2026-06-10 07:15:42 +0800 CST
view 68
微软Build 2026开发者大会全景技术拆解:MAI-Thinking-1稀疏MoE架构、MAI-Code-1-Flash代码生成、Scout多智能体、MXC内核级安全沙箱、Project Solara Agent Shell、Majorana 2量子芯片,从模型层到硬件层的完整分析
微软
Build 2026
MAI模型
GitHub Copilot
Agent
MXC
Project Solara
量子计算
Rust 1.96 + .NET 11 双重地震:WebAssembly 生态正在经历一场“去补丁化”革命
编程
Rust 1.96 + .NET 11 双重地震:WebAssembly 生态正在经历一场“去补丁化”革命
2026-04-11 09:55:58 +0800 CST
view 776
2026年4月,Rust官方移除--allow-undefined补丁、.NET 11 Preview1集成CoreCLR on WASM,两大生态同步推进。本文深入解析WebAssembly去补丁化革命的核心原理与实战。
Rust
WebAssembly
.NET
WASM
CoreCLR
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
3
4
5
6
7
...
34
下一页