程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
编程
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
2026-04-09 03:15:44 +0800 CST
view 757
2026年TensorRT-LLM v0.19全面解析:Skip Softmax稀疏注意力、Paged KV Cache显存管理、INT8/INT4低比特量化完整实战,Blackwell架构适配指南,70B模型单卡部署方案
TensorRT-LLM
低比特量化
Blackwell
INT8
INT4
推理优化
NVIDIA
CLEAR 深度实战:当浙大+腾讯+北大联手破解AI推理「算力浪费」难题——从理性放弃机制到生产级LLM推理优化完全指南(2026)
编程
CLEAR 深度实战:当浙大+腾讯+北大联手破解AI推理「算力浪费」难题——从理性放弃机制到生产级LLM推理优化完全指南(2026)
2026-06-12 14:20:52 +0800 CST
view 134
深度解析 ICML 2026 接收的 CLEAR 推理优化方法。浙江大学、腾讯、北京大学联合提出:对没有希望的问题理性放弃,把算力集中到能解决的问题上。包含完整 Python 实现、vLLM/SGLang 集成、生产级部署指南。
LLM
推理优化
ICML 2026
CLEAR
算力分配
LRT 隐式思维链深度解析:当 AI 学会「静默思考」,推理效率提升数十倍的工程革命
编程
LRT 隐式思维链深度解析:当 AI 学会「静默思考」,推理效率提升数十倍的工程革命
2026-04-12 21:54:21 +0800 CST
view 648
深入解读 ICLR 2026 论文 LRT,揭示如何用轻量级推理网络将冗长的思维链压缩为隐式向量,实现推理效率数十倍提升
AI
LLM
推理优化
思维链
ICLR2026
ClickHouse 4亿美元D轮融资深度解析:从OLAP王者到AI数据基础设施的野心布局
编程
ClickHouse 4亿美元D轮融资深度解析:从OLAP王者到AI数据基础设施的野心布局
2026-04-22 02:18:30 +0800 CST
view 741
ClickHouse完成4亿美元D轮融资,收购Langfuse进军LLM可观测性领域,推出原生Postgres服务。深度解析ClickHouse技术架构、收购战略意义及AI数据基础设施布局。
ClickHouse
OLAP
数据库
AI基础设施
LLM可观测性
Postgres
数据分析
Spring AI 2.0 深度解析:Java 开发者终于有了自己的 AI Agent 基础设施
编程
Spring AI 2.0 深度解析:Java 开发者终于有了自己的 AI Agent 基础设施
2026-05-13 18:19:28 +0800 CST
view 622
Spring AI 2.0 核心能力全面解析:统一 ChatClient API、Tool Calling 与 Java 方法打通、结构化输出自动映射、Advisors 切面机制、RAG 企业知识库、MCP 协议集成,以及与 LangChain4j 深度对比选型指南。
Spring AI,Java,AI Agent,ChatClient,Tool Calling,RAG,MCP,LangChain4j
TurboQuant 深度实战:Google 的 KV 缓存压缩算法完全指南(2026)
编程
TurboQuant 深度实战:Google 的 KV 缓存压缩算法完全指南(2026)
2026-06-08 20:52:38 +0800 CST
view 154
2026年3月Google Research在ICLR 2026发表TurboQuant算法,将LLM的KV缓存压缩至3-bit,实现6倍内存缩减和8倍推理加速。本文深入剖析TurboQuant的技术原理,并提供生产级部署指南。
TurboQuant
KV缓存压缩
LLM推理优化
量化算法
Google Research
ICLR2026
Star-Office-UI:超可爱的像素风格AI办公室看板,把龙虾摸鱼状态可视化
案例
Star-Office-UI:超可爱的像素风格AI办公室看板,把龙虾摸鱼状态可视化
2026-05-09 07:16:11 +0800 CST
view 337
Star-Office-UI开源项目:像素风格的AI办公室看板,实时可视化Agent工作状态,支持多Agent协作、中英日三语、桌面宠物模式,与OpenClaw深度集成一条命令部署
OpenClaw
像素风格
AI看板
多Agent协作
桌面宠物
可视化
OpenClaw集成
ClawSwarm 深度实战:当多Agent学会「群聊协作」——从 Hub-and-Spoke 架构到生产级 AI 团队编排完全指南(2026)
编程
ClawSwarm 深度实战:当多Agent学会「群聊协作」——从 Hub-and-Spoke 架构到生产级 AI 团队编排完全指南(2026)
2026-06-12 19:47:32 +0800 CST
view 164
ClawSwarm深度实战:从Hub-and-Spoke架构到生产级多Agent协作完全指南。详解消息路由、任务拆解、Token优化,附完整代码实战。
ClawSwarm
多Agent
OpenClaw
AI协作
群聊编排
ClawKeeper 深度解析:当「用智能体监管智能体」从概念走向工程——三层防御架构如何为 OpenClaw 系上数字安全带
编程
ClawKeeper 深度解析:当「用智能体监管智能体」从概念走向工程——三层防御架构如何为 OpenClaw 系上数字安全带
2026-04-12 20:56:05 +0800 CST
view 556
深度解析智源、北邮、信通院联合发布的 ClawKeeper v1.0——首个面向 OpenClaw 的三层实时安全框架。从 CVE-2026-33579 等高危漏洞切入,详细剖析 Skill-based、Plugin-based、Watcher-based 三层防御架构的设计哲学与工程实现,探讨「用智能体监管智能体」的安全新范式。
AI安全
OpenClaw
ClawKeeper
eBPF
智能体
安全框架
拒绝劝退!基于pi-mono的轻量级AI Agent学习神器LoongClaw
编程
拒绝劝退!基于pi-mono的轻量级AI Agent学习神器LoongClaw
2026-04-22 13:28:09 +0800 CST
view 578
OpenClaw太重?LoongClaw基于pi-mono架构的轻量级AI Agent学习神器,大道至简,聚焦Agent Loop本质,适合初学者和二次开发。
LoongClaw
pi-mono
AI Agent
开源
OpenClaw
OpenCLI 深度解析:当任意网站变成零成本 CLI 工具——AI Agent 基础设施的新范式
编程
OpenCLI 深度解析:当任意网站变成零成本 CLI 工具——AI Agent 基础设施的新范式
2026-04-16 08:24:10 +0800 CST
view 741
OpenCLI 通过编译期智能、运行期零成本的设计哲学,将任意网站转化为确定性 CLI 工具。15.6k Stars,Apache Arrow PMC 成员作品,91个内置 Adapter,支持 Self-Repair Protocol 自动修复。
OpenCLI
AI Agent
CLI
CDP
浏览器自动化
Adapter
Anthropic 封杀 OpenClaw 深度解析:从 30 万 Star 的"龙虾"到 AI 生态的成人礼
编程
Anthropic 封杀 OpenClaw 深度解析:从 30 万 Star 的"龙虾"到 AI 生态的成人礼
2026-04-09 05:15:20 +0800 CST
view 591
2026年4月4日,Anthropic正式封杀OpenClaw,30万虾农遭遇断粮危机。本文深度解析封杀背后的商业逻辑、ClawAegis安全防护体系,以及AI Agent时代的商业模式之争。
AI Agent
OpenClW
ClawAegis
Anthropic
大模型安全
开源智能体
MusaCoder 深度实战:当国产GPU遇见AI驱动的Kernel生成——从PyTorch到CUDA/MUSA原生算子的全栈训练完全指南(2026)
编程
MusaCoder 深度实战:当国产GPU遇见AI驱动的Kernel生成——从PyTorch到CUDA/MUSA原生算子的全栈训练完全指南(2026)
2026-06-16 06:47:47 +0800 CST
view 175
MusaCoder是首个基于国产GPU完成全链路训练的代码大模型,在KernelBench上超越Claude Opus 4.7。从三阶段数据合成、多样性RFT到执行反馈RL,深度解析全栈训练方法论。
MusaCoder
GPU Kernel
摩尔线程
国产GPU
CUDA
MUSA
大模型
强化学习
KernelBench
代码大模型
AI Coding
深度学习
OpenScreen 深度解析:当开源撕掉屏幕录制的高价标签,开发者终于不用再被 Screen Studio 收割
编程
OpenScreen 深度解析:当开源撕掉屏幕录制的高价标签,开发者终于不用再被 Screen Studio 收割
2026-04-10 02:23:58 +0800 CST
view 754
深入解析OpenScreen:26K Stars的GitHub开源录屏工具,用Electron+FFmpeg技术栈复现Screen Studio全部核心功能,包括自动缩放、运动模糊、背景虚化等。跨平台支持macOS/Windows/Linux,完全免费开源。
OpenScreen
Screen Studio
Electron
FFmpeg
开源录屏
桌面应用
TypeScript
DeepTutor 深度解析:当 AI 教育从「问答工具」进化为「原生智能体导师」
编程
DeepTutor 深度解析:当 AI 教育从「问答工具」进化为「原生智能体导师」
2026-04-10 05:13:09 +0800 CST
view 1205
香港大学数据科学研究所开源的 DeepTutor v1.0.0,标志教育AI进入Agent-Native时代:持久记忆、主动教学、多实例TutorBot、CLI原生,从问答工具进化为智能体导师生态系统。
AI
教育
Agent
DeepTutor
HKUDS
开源
英伟达 CUDA-Oxide 0.1 深度解析:用 Rust 编写 GPU 内核的破冰之旅
编程
英伟达 CUDA-Oxide 0.1 深度解析:用 Rust 编写 GPU 内核的破冰之旅
2026-05-10 08:20:42 +0800 CST
view 561
英伟达发布实验性Rust-to-CUDA编译器CUDA-Oxide 0.1,支持用Rust编写SIMT GPU内核并输出标准PTX中间代码。深度解析其架构设计、代码示例与未来展望。
CUDA-Oxide
Rust
GPU编程
NVIDIA
PTX
SIMT
并行计算
高性能计算
TileKernels 深度解析:DeepSeek 用 80 行代码榨干 GPU,算子开发范式的降维打击
编程
TileKernels 深度解析:DeepSeek 用 80 行代码榨干 GPU,算子开发范式的降维打击
2026-04-30 03:22:15 +0800 CST
view 576
深度解析 DeepSeek 开源的高性能 GPU 算子库 TileKernels:基于 TileLang DSL 用 80 行代码实现手写 CUDA 级性能,覆盖 MoE Gating/Routing、FP8/FP4 量化、Engram 门控等七大算子家族,首次原生支持 NVIDIA Blackwell 架构,并通过 TVM 编译器打通昇腾等国产芯片。
DeepSeek
TileKernels
GPU
CUDA
TileLang
MoE
算子优化
DeepGEMM 深度解析:DeepSeek 开源的 FP8 GEMM 内核如何重塑 AI 推理性能边界
编程
DeepGEMM 深度解析:DeepSeek 开源的 FP8 GEMM 内核如何重塑 AI 推理性能边界
2026-04-21 05:16:09 +0800 CST
view 597
深入剖析 DeepSeek 开源的 DeepGEMM 库:从 FP8 精度革命到 1550 TFLOPS 性能突破,揭秘现代 AI 推理基础设施的底层优化技术
DeepGEMM
FP8
DeepSeek
CUDA
AI推理
GPU优化
GEMM
TensorCore
国产 AI 编程工具深度实战:五巨头正面交锋——从 SPEC 规范驱动到 Agent 自主编码的完全指南(2026)
编程
国产 AI 编程工具深度实战:五巨头正面交锋——从 SPEC 规范驱动到 Agent 自主编码的完全指南(2026)
2026-06-03 08:21:57 +0800 CST
view 406
2026年国产AI编程工具深度对比:腾讯CodeBuddy、字节Trae、阿里Qoder和通义灵码、百度Comate五巨头技术架构拆解与实战评测
AI编程
CodeBuddy
Trae
Qoder
通义灵码
Comate
SPEC
Visual Studio 2026 + .NET 10 深度解析:微软把 IDE 和运行时一起推上了新台阶
编程
Visual Studio 2026 + .NET 10 深度解析:微软把 IDE 和运行时一起推上了新台阶
2026-04-12 12:23:47 +0800 CST
view 705
Visual Studio 2026 和 .NET 10 深度解析:ProfilerCopilotAgent、JIT优化、NativeAOT成熟化、C# 14新特性、ASP.NET Core 10实战,全面覆盖升级要点与性能对比
Visual Studio 2026
.NET 10
C# 14
NativeAOT
ASP.NET Core
JIT
性能优化
IDE
Hermes Agent 深度实战:自进化 AI Agent 的三层记忆架构与 Skill 自动生成完全指南(下篇)
编程
Hermes Agent 深度实战:自进化 AI Agent 的三层记忆架构与 Skill 自动生成完全指南(下篇)
2026-06-04 04:45:35 +0800 CST
view 190
下篇:深入讲解 Nudge Engine 定时复盘、强化学习从经验中学习、完整代码实战(从零搭建自进化 Agent)、与其他框架对比、生产级最佳实践、性能优化策略。
Hermes Agent
自进化
AI Agent
Nudge Engine
强化学习
代码实战
GMSSH:桌面级AI运维终端,零侵入纯SSH隧道
编程
GMSSH:桌面级AI运维终端,零侵入纯SSH隧道
2026-05-24 16:49:36 +0800 CST
view 251
GMSSH是桌面级AI驱动运维终端,零侵入纯SSH隧道,服务器不用装任何Agent,进程隔离+UDS通信,AI通过MCP感知实时状态,50+运维技能包,核心闭源+生态开放。
AI运维
SSH
运维工具
终端工具
桌面级
进程隔离
UDS
DeepSeek DeepGEMM 2026年4月重磅更新:Mega MoE融合算子、FP4精度与极致性能优化
编程
DeepSeek DeepGEMM 2026年4月重磅更新:Mega MoE融合算子、FP4精度与极致性能优化
2026-04-23 08:41:45 +0800 CST
view 367
深度解析DeepSeek DeepGEMM 2026年4月重大更新:Mega MoE融合算子(dispatch+Linear+SwiGLU+Combine五合一,NVLink通信与Tensor Core计算重叠)、FP8xFP4 GEMM、FP4 Indexer、PDL调度优化与JIT加速,附完整代码实战。
DeepGEMM
DeepSeek
GPU优化
CUDA
FP8
FP4
MoE
AI Infra
高性能计算
NVIDIA
DwarfStar 深度解析:antirez 的 DeepSeek V4 Flash 本地推理引擎——Metal 与 CUDA 双轨优化革命(2026 完全指南)
编程
DwarfStar 深度解析:antirez 的 DeepSeek V4 Flash 本地推理引擎——Metal 与 CUDA 双轨优化革命(2026 完全指南)
2026-05-28 19:13:18 +0800 CST
view 290
DwarfStar(ds4)是Redis创始人antirez开发的DeepSeek V4 Flash专用推理引擎,支持Metal与CUDA双轨优化、磁盘KV Cache、imatrix量化和原生Agent集成。本文深入解析其架构设计与性能表现。
DeepSeek
ds4
Metal
CUDA
本地推理
MoE
量化
GGUF
Agent
Python
C
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
15
16
17
18
19
...
30
下一页