程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
GuppyLM:5分钟从零训练一个LLM,870万参数小鱼模型的完整教学
编程
GuppyLM:5分钟从零训练一个LLM,870万参数小鱼模型的完整教学
2026-05-01 04:35:06 +0800 CST
view 63
GuppyLM是开源教育项目,870万参数小鱼角色扮演模型,5分钟Colab训练,覆盖数据生成到ONNX部署全流程,适合LLM初学者。
LLM
深度学习
开源
教学
Transformer
Transformers.js v4 深度解析:WebGPU 原生化让 AI 推理在 Node/Bun/Deno 中真正起飞
编程
Transformers.js v4 深度解析:WebGPU 原生化让 AI 推理在 Node/Bun/Deno 中真正起飞
2026-04-12 04:55:32 +0800 CST
view 345
深度解析 Transformers.js v4 的 WebGPU 原生化架构:如何用 C++ 重写 WebGPU Runtime、与 ONNX Runtime 深度集成、在 Node/Bun/Deno 中实现原生 GPU AI 推理。包含代码实战、性能对比与生产部署指南。
JavaScript
AI
WebGPU
Transformers
HuggingFace
Node.js
Bun
Deno
ONNX
编程
Bun v1.3.12 深度解析:内置浏览器自动化、原生 Cron 调度与 JavaScriptCore 大升级——一个前端工程师眼中的「全家桶」革命
2026-05-02 18:35:10 +0800 CST
view 82
深入解析 Bun v1.3.12 的重磅更新:内置浏览器自动化 Bun.WebView、进程内 Cron 调度器、终端 Markdown 渲染、JavaScriptCore 大升级,以及 URLPattern 2.3 倍性能提升等优化。
Bun
JavaScript
Runtime
Browser Automation
Cron
10天破3800星!Claude Code Skill一句话生成7种风格技术图表
编程
10天破3800星!Claude Code Skill一句话生成7种风格技术图表
2026-04-21 11:04:25 +0800 CST
view 150
fireworks-tech-graph:10天3800星的Claude Code Skill,用自然语言生成7种风格的技术图表,支持RAG、Mem0、多Agent等架构图,Mermaid画不出来的它能补位
Claude Code
Skill
AI画图
图表生成
Claude Code Skills
技术图
架构图
Mermaid
开源
GitHub
Gemma 4 MoE 架构技术深度解析:Dense MLP + Routed MoE 双路径设计如何重塑开源大模型
编程
Gemma 4 MoE 架构技术深度解析:Dense MLP + Routed MoE 双路径设计如何重塑开源大模型
2026-04-21 14:22:20 +0800 CST
view 185
深度解析 Google Gemma 4 的 Dual-Path 混合架构设计:Dense MLP 保障通用基座能力,Routed MoE 释放专业化推理效率。一文吃透技术原理、部署实战与选型对比。
Gemma 4
MoE架构
Dense MLP
Routed MoE
Google DeepMind
开源大模型
Transformer
模型部署
混合专家
FlashPrefill 深度解析:当瞬时注意力遇上 GPU 原语——从 O(N²) 困境到 27 倍速的工程革命
编程
FlashPrefill 深度解析:当瞬时注意力遇上 GPU 原语——从 O(N²) 困境到 27 倍速的工程革命
2026-04-15 17:20:25 +0800 CST
view 208
深度解析中科院与腾讯微信联合研发的 FlashPrefill 如何通过即时注意力模式发现和动态阈值筛选,将 25.6 万字符长文本处理速度提升 27.78 倍,同时保持近乎完美的精度。
LLM推理优化
FlashAttention
GPU计算
长文本处理
注意力机制
Transformer
深度学习
WebGPU 深度解析:当 Chrome 正式发布 WebGPU 实现,Web 图形与通用计算的新纪元已至
编程
WebGPU 深度解析:当 Chrome 正式发布 WebGPU 实现,Web 图形与通用计算的新纪元已至
2026-04-15 19:20:07 +0800 CST
view 174
深入解析 Chrome 113 正式发布的 WebGPU 实现:架构设计、WGSL 着色器语言、Compute Shader 机器学习推理实战、性能对比与完整代码示例
WebGPU
WGSL
Chrome
图形API
GPU计算
Compute Shader
机器学习
Web图形
TriAttention深度解析:MIT韩松团队如何用三角函数让单卡4090跑出百万Token上下文
编程
TriAttention深度解析:MIT韩松团队如何用三角函数让单卡4090跑出百万Token上下文
2026-04-17 10:15:58 +0800 CST
view 193
2026年4月,MIT、英伟达、浙江大学联合发布TriAttention,用三角函数建模注意力距离偏好,实现KV缓存10.7倍压缩,让单卡4090跑出百万Token上下文。
AI
大模型
Transformer
注意力机制
KV缓存
长上下文
模型优化
论文解读
2026
TimesFM 2.5 深度解析:当时间序列预测终于学会零样本
编程
TimesFM 2.5 深度解析:当时间序列预测终于学会零样本
2026-04-08 16:35:10 +0800 CST
view 358
Google TimesFM 2.5 时间序列预测基础模型深度解析:200M参数零样本预测,16k上下文,Decoder-only Transformer架构,Patch分词,Monash基准测试击败监督模型
时间序列
机器学习
Google
Transformer
Dockge深度解析:自托管Docker Compose管理工具的革命性设计与工程实践
编程
Dockge深度解析:自托管Docker Compose管理工具的革命性设计与工程实践
2026-04-18 07:13:40 +0800 CST
view 182
深度解析Dockge的设计理念、架构实现与工程实践,探讨文件优先架构、交互式Web终端、多Agent支持等核心特性,以及与Portainer等工具的对比分析。
Docker
容器编排
DevOps
Homelab
开源工具
MIT黑科技:TriAttention如何用三角函数让大模型「记住」超长上下文
编程
MIT黑科技:TriAttention如何用三角函数让大模型「记住」超长上下文
2026-04-18 12:45:10 +0800 CST
view 236
深度解析MIT/NVIDIA/浙大联合发布的TriAttention技术,用三角函数预测注意力分布,实现KV Cache智能压缩,让超长上下文推理成为可能
大模型
注意力机制
KV缓存
Transformer
深度学习
AI优化
WASI 2.0 与 Component Model 深度解析:WebAssembly 跨语言运行时 2026 云原生变革
编程
WASI 2.0 与 Component Model 深度解析:WebAssembly 跨语言运行时 2026 云原生变革
2026-04-11 13:26:31 +0800 CST
view 736
深度解析 WASI 2.0 与 Component Model,揭示 WebAssembly 如何真正成为跨语言运行时,以及这对 2026 年云原生开发范式的深远影响。
WebAssembly
WASI
云原生
跨语言
Serverless
安全
Component Model
Kubernetes 1.36 深度解析:AI时代的容器编排新纪元——从DRA设备分区到ServiceAccount外部签名的技术革命
编程
Kubernetes 1.36 深度解析:AI时代的容器编排新纪元——从DRA设备分区到ServiceAccount外部签名的技术革命
2026-04-21 03:16:19 +0800 CST
view 182
深入解析Kubernetes 1.36核心特性:DRA可分区设备实现GPU细粒度共享、ServiceAccount Token外部签名支持企业级身份体系、SELinux卷标加速提升Pod启动性能。附完整代码示例与生产环境升级指南。
Kubernetes
云原生
AI基础设施
DRA
容器编排
GPU分区
ServiceAccount
SELinux
WebAssembly 深度实战:从浏览器端 AI 推理到 Serverless 容器——2026 年 WASM 如何重塑云原生与前端边界
编程
WebAssembly 深度实战:从浏览器端 AI 推理到 Serverless 容器——2026 年 WASM 如何重塑云原生与前端边界
2026-05-02 09:03:59 +0800 CST
view 152
从 Component Model 到 WASI Preview 2,从浏览器端 Qwen3-ASR 部署到 WASM Serverless 微服务,深度拆解 2026 年 WebAssembly 如何重塑云原生与前端边界
WebAssembly
WASM
Serverless
云原生
Rust
AI推理
边缘计算
Component Model
WASI
CVE-2026-34040深度解析:一个HTTP协议分层漏洞如何让Docker安全防护体系全线崩溃
编程
CVE-2026-34040深度解析:一个HTTP协议分层漏洞如何让Docker安全防护体系全线崩溃
2026-04-13 02:25:41 +0800 CST
view 387
深入分析Docker Engine CVE-2026-34040高危漏洞,揭示HTTP协议分层缺陷如何绕过AuthZ授权体系,详解AI Agent自动化攻击场景与多层防御策略。
Docker
容器安全
CVE
漏洞分析
Kubernetes
Kubernetes v1.36 深度解析:代号「晴(Haru)」背后的云原生进化论
编程
Kubernetes v1.36 深度解析:代号「晴(Haru)」背后的云原生进化论
2026-04-27 15:53:35 +0800 CST
view 277
2026年4月Kubernetes v1.36正式发布,代号「晴(Haru)」。本文深度解析44项GA特性、Sidecar容器、DRA动态资源分配、Gateway API等核心能力,并附完整的AI推理服务部署实战代码。
Kubernetes
云原生
Docker
容器编排
AI基础设施
2026 AI Agent 框架四分天下:OpenAI、Claude Code、CodeBuddy、OpenClaw 的架构哲学对决
编程
2026 AI Agent 框架四分天下:OpenAI、Claude Code、CodeBuddy、OpenClaw 的架构哲学对决
2026-04-09 06:54:56 +0800 CST
view 622
2026年AI Agent领域最值得关注的不是某个新框架的诞生,而是既有格局的彻底分叉。本文深入剖析OpenAI、Claude Code、CodeBuddy和OpenClaw四条路线的架构哲学、核心机制与实际取舍,为AI Agent选型提供真正有价值的参考。
AI Agent
OpenAI
Claude Code
OpenClaw
多Agent
框架对比
METATRON 深度解析:当 AI 渗透测试在本地跑出「免费版 GPT-4 安全助手」
编程
METATRON 深度解析:当 AI 渗透测试在本地跑出「免费版 GPT-4 安全助手」
2026-04-09 07:55:23 +0800 CST
view 533
深度解析 METATRON:如何在本地零成本跑起一个完整的 AI 渗透测试助手,基于 Qwen 微调模型 + Ollama + MariaDB,无需 API Key,数据完全不出本地。
AI渗透测试
Ollama
Qwen
本地大模型
MariaDB
Pentest
安全工具
Agent
开源仅5天暴涨18.2K星!Open Design:Claude Design最强开源替代
案例
开源仅5天暴涨18.2K星!Open Design:Claude Design最强开源替代
2026-05-04 07:34:23 +0800 CST
view 38
nexu.io创始人Tom Huang开源的Claude Design平替项目,开源5天斩获18.2K星,支持11种编码代理,129套设计系统
AI设计
开源
Claude
OpenDesign
前端开发
OpenHarness 深度解析:当港大用 1.1 万行代码"解构"51 万行工业级 Agent 系统
编程
OpenHarness 深度解析:当港大用 1.1 万行代码"解构"51 万行工业级 Agent 系统
2026-04-13 21:57:14 +0800 CST
view 281
深度解析香港大学开源的 OpenHarness 项目,用 1.1 万行 Python 代码实现 51 万行工业级 Agent 系统 98% 功能的工程哲学与技术架构。
AI Agent
OpenHarness
开源
Python
工程化
OpenHarness:港大开源的AI Agent轻量级框架,1.1万行代码复刻Claude Code 98%核心能力
编程
OpenHarness:港大开源的AI Agent轻量级框架,1.1万行代码复刻Claude Code 98%核心能力
2026-04-08 13:36:32 +0800 CST
view 815
OpenHarness是香港大学开源的AI Agent轻量级框架,用1.1万行Python代码实现了Claude Code 51.2万行代码98%的核心能力。本文深入解析其10大子系统架构、Agent Loop实现原理、与Claude Code的对比分析,以及如何快速上手构建自己的AI Agent。
AI Agent
开源项目
OpenHarness
Python
PersonaPlex 深度解析:当 NVIDIA 让全双工语音对话进入「角色扮演」时代
编程
PersonaPlex 深度解析:当 NVIDIA 让全双工语音对话进入「角色扮演」时代
2026-04-09 11:32:36 +0800 CST
view 336
NVIDIA发布的PersonaPlex在Moshi架构基础上增加了角色扮演和语音克隆能力,让AI可以扮演教师、客服等不同身份进行实时语音对话。本文从架构、代码、实战角度全面解析这项技术突破。
PersonaPlex
NVIDIA
Moshi
全双工语音
AI对话
角色扮演
Free Claude Code:让Claude Code接入任意模型,打破Anthropic绑定
编程
Free Claude Code:让Claude Code接入任意模型,打破Anthropic绑定
2026-04-29 12:20:38 +0800 CST
view 267
Free Claude Code是让Claude Code接入任意模型的代理层项目,打破Anthropic绑定,支持NVIDIA NIM/OpenRouter/DeepSeek/Ollama/LM Studio等后端,适合想降成本或本地部署AI编程环境的人。
Claude Code
AI编程
开源工具
OpenRouter
DeepSeek
Ollama
LM Studio
AI Coding
Anthropic
NVIDIA PersonaPlex 全双工语音 AI 深度解析:从 Moshi 架构到实时对话的工程实践
编程
NVIDIA PersonaPlex 全双工语音 AI 深度解析:从 Moshi 架构到实时对话的工程实践
2026-04-19 14:16:23 +0800 CST
view 200
深度解析 NVIDIA PersonaPlex:基于 Moshi 架构的 7B 参数全双工语音 AI 模型,170ms 打断延迟,MIT 商用许可,从架构原理到代码实战的完整技术指南。
NVIDIA
PersonaPlex
全双工语音
Moshi
Kyutai
AI语音
实时对话
语音AI
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
4
5
6
7
8
...
14
下一页