程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
LiteRT-LM:Google端侧大模型推理引擎的革命性架构——从TensorFlow Lite的困境到LLM原生推理的全链路解析
编程
LiteRT-LM:Google端侧大模型推理引擎的革命性架构——从TensorFlow Lite的困境到LLM原生推理的全链路解析
2026-04-19 22:17:39 +0800 CST
view 8
深入解析Google LiteRT-LM端侧LLM推理引擎的核心架构:分层内存池、KV Cache量化、算子融合、WebGPU运行时。与TensorFlow Lite、llama.cpp、MLX横向对比,提供生产级部署实战指南。
Google
端侧AI
LiteRT-LM
WebGPU
量化
KV Cache
TensorFlow Lite
LLM推理
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
编程
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
2026-04-09 03:15:44 +0800 CST
view 201
2026年TensorRT-LLM v0.19全面解析:Skip Softmax稀疏注意力、Paged KV Cache显存管理、INT8/INT4低比特量化完整实战,Blackwell架构适配指南,70B模型单卡部署方案
TensorRT-LLM
低比特量化
Blackwell
INT8
INT4
推理优化
NVIDIA
TEN Framework 深度解析:当实时多模态语音 AI 遇上真正的"即插即用"
编程
TEN Framework 深度解析:当实时多模态语音 AI 遇上真正的"即插即用"
2026-04-08 19:04:47 +0800 CST
view 118
TEN Framework 是一个开源的实时多模态对话 AI 框架,让开发者能够像搭积木一样快速构建低延迟、高质量的实时语音/视频 AI Agent。本文深度解析其核心架构、实战应用与性能优化策略。
TEN Framework
语音AI
实时多模态
WebRTC
AI Agent
Docker 中运行并使用 WebRTC 的自托管虚拟浏览器
综合
Docker 中运行并使用 WebRTC 的自托管虚拟浏览器
2024-11-19 03:03:55 +0800 CST
view 1623
Neko虚拟浏览器是一款自托管的虚拟浏览器,允许用户在安全的虚拟环境中访问互联网。它支持多用户同时访问,适合开发人员和寻求隐私保护的用户。Neko提供了便捷的浏览体验,用户可以在多个设备上共享浏览器访问权限,适用于协作项目和资源共享。
虚拟浏览器
安全技术
WebRTC
Docker
隐私保护
Pion是WebRTCAPI的纯Golang实现,提升了WebRTC应用开发效率
编程
Pion是WebRTCAPI的纯Golang实现,提升了WebRTC应用开发效率
2024-11-19 08:26:56 +0800 CST
view 2051
Pion是WebRTCAPI的纯Golang实现,提升了WebRTC应用开发效率。它提供简单易用的API,支持多种创意项目,如视频同步观看、嵌入式设备摄像头传输、数据安全传输等。Pion实现了完整的PeerConnectionAPI,支持多种媒体格式和加密算法,适用于多个操作系统和架构。示例代码展示了如何使用Pion发送视频文件到浏览器。
WebRTC
Golang
视频处理
网络通信
实时应用
FlashPrefill 深度解析:当瞬时注意力遇上 GPU 原语——从 O(N²) 困境到 27 倍速的工程革命
编程
FlashPrefill 深度解析:当瞬时注意力遇上 GPU 原语——从 O(N²) 困境到 27 倍速的工程革命
2026-04-15 17:20:25 +0800 CST
view 96
深度解析中科院与腾讯微信联合研发的 FlashPrefill 如何通过即时注意力模式发现和动态阈值筛选,将 25.6 万字符长文本处理速度提升 27.78 倍,同时保持近乎完美的精度。
LLM推理优化
FlashAttention
GPU计算
长文本处理
注意力机制
Transformer
深度学习
llm-d进入CNCF:Kubernetes正式迈入AI原生时代
编程
llm-d进入CNCF:Kubernetes正式迈入AI原生时代
2026-04-08 12:29:41 +0800 CST
view 116
IBM、红帽、谷歌联合向CNCF捐赠llm-d项目,标志着Kubernetes正式迈入AI原生时代。本文深度解析llm-d架构设计、性能数据及实践建议。
Kubernetes
云原生
AI
大模型
llm-d
CNCF
Kubernetes v1.36 深度解析:当 Ingress NGINX 退役遇上 Istio 环境模式——云原生网络架构的范式革命
编程
Kubernetes v1.36 深度解析:当 Ingress NGINX 退役遇上 Istio 环境模式——云原生网络架构的范式革命
2026-04-16 04:40:40 +0800 CST
view 63
深入解析 Kubernetes v1.36 重大变革:Ingress NGINX 退役、Gateway API 崛起、Istio 环境模式多集群支持、AI 推理网关等云原生网络架构的范式革命
Kubernetes
Istio
云原生
Gateway API
服务网格
Ambient Mode
AI推理
多集群
Kubernetes v1.36 与 Istio 环境模式深度解析:云原生网络架构的范式革命——从 Ingress NGINX 退役到 AI 推理网关
编程
Kubernetes v1.36 与 Istio 环境模式深度解析:云原生网络架构的范式革命——从 Ingress NGINX 退役到 AI 推理网关
2026-04-16 04:41:31 +0800 CST
view 77
深入解析 Kubernetes v1.36 重大变革:Ingress NGINX 退役、Gateway API 崛起、Istio 环境模式多集群支持、AI 推理网关等云原生网络架构的范式革命
Kubernetes
Istio
云原生
Gateway API
服务网格
Ambient Mode
AI推理
多集群
SGLang vs vLLM:2026年大模型推理框架深度对比与选型指南
编程
SGLang vs vLLM:2026年大模型推理框架深度对比与选型指南
2026-04-08 15:51:53 +0800 CST
view 336
深度对比SGLang与vLLM两大LLM推理框架,从架构设计、核心原理、性能实测、适用场景多维度解析,附2026年选型建议
LLM
SGLang
vLLM
推理优化
大模型
智谱 GLM-5.1 深度解析:当开源模型突破「8小时自治」临界点
编程
智谱 GLM-5.1 深度解析:当开源模型突破「8小时自治」临界点
2026-04-09 00:53:51 +0800 CST
view 401
2026年4月8日智谱发布GLM-5.1,744B参数MIT开源,SWE-bench Pro 58.4分超越Claude Opus 4.6,全球首个支持8小时长程自治的开源模型。
GLM-5.1
智谱AI
开源大模型
MoE
SWE-bench
长程自治
LLM
Hermes Agent 深度解析:自进化智能体的工程架构与 Skill 生成机制
编程
Hermes Agent 深度解析:自进化智能体的工程架构与 Skill 生成机制
2026-04-12 05:23:08 +0800 CST
view 358
深入解析 Hermes Agent 的自进化智能体架构:从 Skill 自动生成引擎、三层记忆系统、Tool Router 到 Platform Bridge,源码级别剖析 + 代码示例,对比 OpenClaw
AI Agent
Hermes Agent
Nous Research
自进化
智能体
Skill生成
Memory Hub
Tool Router
PostgreSQL 18深度解析:从WAL延迟检测到Kubernetes原位大版本升级——一次数据库工程能力的大跨越
编程
PostgreSQL 18深度解析:从WAL延迟检测到Kubernetes原位大版本升级——一次数据库工程能力的大跨越
2026-04-12 19:55:15 +0800 CST
view 190
深度解析PostgreSQL 18四大核心新特性:WAL延迟自动检测、LDAP企业级认证、Kubernetes原地大版本升级(GA)、PVC快照备份。包含完整K8s YAML配置、性能优化实战与运维架构演进路线图。
PostgreSQL
Kubernetes
数据库
Percona
WAL
K8s
PostgreSQL18
高可用
CVE-2026-34040深度解析:一个HTTP协议分层漏洞如何让Docker安全防护体系全线崩溃
编程
CVE-2026-34040深度解析:一个HTTP协议分层漏洞如何让Docker安全防护体系全线崩溃
2026-04-13 02:25:41 +0800 CST
view 177
深入分析Docker Engine CVE-2026-34040高危漏洞,揭示HTTP协议分层缺陷如何绕过AuthZ授权体系,详解AI Agent自动化攻击场景与多层防御策略。
Docker
容器安全
CVE
漏洞分析
Kubernetes
Claude Memory Compiler 深度解析:当 AI 编程助手第一次拥有「编译器思维」的记忆系统
编程
Claude Memory Compiler 深度解析:当 AI 编程助手第一次拥有「编译器思维」的记忆系统
2026-04-10 03:35:31 +0800 CST
view 113
claude-memory-compiler 把 AI 对话当作源代码,用 LLM 编译成结构化知识库,让 Claude Code 拥有跨会话记忆能力
Claude Code
AI Agent
Knowledge Management
LLM
Memory System
从购物清单到 AI 编程助手:深度解析 Bubble Tea 架构如何驱动 14 万星开源项目 OpenCode
编程
从购物清单到 AI 编程助手:深度解析 Bubble Tea 架构如何驱动 14 万星开源项目 OpenCode
2026-04-17 21:18:16 +0800 CST
view 39
深度解析 Bubble Tea(基于 Elm 架构的 Go 语言 TUI 框架)如何驱动 GitHub 14.4万星的开源 AI 编程助手 OpenCode,涵盖三层 Agent 架构、Provider-Agnostic 设计、客户端/服务器架构等核心技术。
Bubble Tea
OpenCode
TUI
Go
AI编程助手
Elm架构
caveman 深度解析:当 Claude Code 用「穴居人语言」砍掉 75% Token 消耗,AI 编程正式进入「极简主义」时代
编程
caveman 深度解析:当 Claude Code 用「穴居人语言」砍掉 75% Token 消耗,AI 编程正式进入「极简主义」时代
2026-04-10 00:14:55 +0800 CST
view 133
深度解析 caveman 开源项目:一个让 Claude Code 用「穴居人语言」说话的 skill,砍掉 75% Token 消耗同时保持 100% 技术准确率。
Claude Code
Token优化
AI编程
Prompt Engineering
LLM效率
开源工具
程序员工具
代码审查
Browser-Use 深度解析:当AI学会看网页——79k Stars背后的浏览器自动化革命
编程
Browser-Use 深度解析:当AI学会看网页——79k Stars背后的浏览器自动化革命
2026-04-14 06:26:31 +0800 CST
view 223
Browser-Use是GitHub 79k+ Stars的AI浏览器自动化框架,通过LLM驱动实现自然语言控制浏览器。本文深度解析其架构设计、双模态页面理解、多模型集成机制,并附完整代码实战示例。
Browser-Use
浏览器自动化
AI Agent
Playwright
LLM驱动
60行配置文件斩获5万星:Karpathy如何用四条原则终结AI编程的混乱时代
编程
60行配置文件斩获5万星:Karpathy如何用四条原则终结AI编程的混乱时代
2026-04-18 14:44:57 +0800 CST
view 39
andrej-karpathy-skills项目60行CLAUDE.md文件斩获54k星标,四条原则Think Before Coding、Simplicity First、Surgical Changes、Goal-Driven Execution如何终结AI编程的混乱时代
AI编程
Claude Code
Prompt Engineering
LLM
软件工程
综合
Tkinter 焕新利器:ttkbootstrap —— 打造美观现代的 Bootstrap 主题
2024-11-19 04:25:20 +0800 CST
view 2740
ttkbootstrap是Tkinter的主题扩展,提供现代化的Bootstrap风格主题,具有高度可定制性和丰富的组件。支持按需加载,优化内存使用,兼容多个平台。用户可以通过简单的CSS修改或使用ttkcreator工具进行定制。ttkbootstrap适用于各种应用程序,如数据可视化工具、管理系统和教育软件,提升用户体验和界面美观性。
Tkinter
主题
用户界面
开发工具
跨平台
综合
PicaComic是一个基于Flutter开发的开源跨平台漫画程序
2024-11-19 06:49:01 +0800 CST
view 5041
PicaComic是一个基于Flutter开发的开源跨平台漫画程序,支持多个操作系统,迅速在GitHub上获得2k星标。它允许用户访问多个漫画源,并支持本地存储和自定义漫画源,提供多样化的选择和良好的用户体验。用户只需下载源码并安装Flutter即可轻松构建应用,是漫画爱好者和开发者的理想选择。
漫画
开源软件
跨平台应用
Flutter
Kubernetes 1.36 深度解析:当云原生遇上 AI 时代,60 项增强背后的架构革命
编程
Kubernetes 1.36 深度解析:当云原生遇上 AI 时代,60 项增强背后的架构革命
2026-04-19 09:45:19 +0800 CST
view 21
Kubernetes 1.36 深度解析:60项功能增强,18个Alpha、29个Beta、13个Stable。从Pod资源原地更新到JobSet AI训练编排,全面解读云原生进入AI时代的架构革命。
Kubernetes
云原生
AI基础设施
容器编排
K8s 1.36
Hermes Agent 深度解析:当 AI 学会「自我进化」——从四层记忆架构到技能自生成的工程全解
编程
Hermes Agent 深度解析:当 AI 学会「自我进化」——从四层记忆架构到技能自生成的工程全解
2026-04-13 02:56:20 +0800 CST
view 328
深度解析Hermes Agent的工程实现:四层记忆架构(SQLite+FTS5)、技能自生成闭环、与OpenClaw的本质对比,以及这条「自我进化」路线对AI工具链未来的意义。
AI Agent
Hermes Agent
自我进化
记忆架构
Nous Research
技能系统
SQLite
机器学习
SKILL0深度解析:当技能不再是外挂——浙大与美团如何用技能内化重新定义小模型智能体
编程
SKILL0深度解析:当技能不再是外挂——浙大与美团如何用技能内化重新定义小模型智能体
2026-04-13 18:57:15 +0800 CST
view 116
浙江大学联合美团和清华大学发布SKILL0论文,提出技能内化范式,让3B小模型通过上下文强化学习将AI技能内化到模型参数中,推理时零Token开销,在ALFWorld等基准上超越GPT-4o和Gemini。
SKILL0
技能内化
Skill Internalization
AI Agent
强化学习
浙大
美团
小模型
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
...
6
下一页