程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
DeepGEMM 深度解析:DeepSeek 开源的 FP8 GEMM 内核如何重塑 AI 推理性能边界
编程
DeepGEMM 深度解析:DeepSeek 开源的 FP8 GEMM 内核如何重塑 AI 推理性能边界
2026-04-21 05:16:09 +0800 CST
view 471
深入剖析 DeepSeek 开源的 DeepGEMM 库:从 FP8 精度革命到 1550 TFLOPS 性能突破,揭秘现代 AI 推理基础设施的底层优化技术
DeepGEMM
FP8
DeepSeek
CUDA
AI推理
GPU优化
GEMM
TensorCore
Google Gemma 4 深度解析:当开源AI进入「逐层嵌入平行化」时代
编程
Google Gemma 4 深度解析:当开源AI进入「逐层嵌入平行化」时代
2026-04-09 04:54:56 +0800 CST
view 539
Google于2026年4月发布Gemma 4开源模型系列,首次全面切换Apache 2.0许可证,搭载Per-Layer Embedding架构创新,26B MoE以3.8B激活参数击败Qwen3-235B。本文深度解析PLE架构、稀疏激活机制与全规格产品矩阵。
Gemma 4
Google
开源模型
Apache 2.0
MoE
Per-Layer Embedding
Google AI Edge Gallery 深度实战:让 Mac/Android 离线运行 Gemma 3——从原理到生产级本地 AI 部署完全指南(2026)
编程
Google AI Edge Gallery 深度实战:让 Mac/Android 离线运行 Gemma 3——从原理到生产级本地 AI 部署完全指南(2026)
2026-06-04 21:14:37 +0800 CST
view 17
深入剖析 Google AI Edge Gallery 的技术架构、Gemma 模型家族、端侧部署全流程,并通过完整代码示例,带你从零构建一个生产级本地 AI 应用。
Google AI Edge Gallery
本地AI
Gemma模型
端侧推理
Mac AI
Android AI
Google AI Edge Gallery:手机离线跑大模型时代来了,2.2万Star端侧AI神器
案例
Google AI Edge Gallery:手机离线跑大模型时代来了,2.2万Star端侧AI神器
2026-05-09 07:36:45 +0800 CST
view 327
Google开源AI神器AI Edge Gallery斩获2.2万Star,支持iOS和Android手机离线运行Gemma 4等大模型,提供AI Chat、Ask Image、Audio Scribe、Agent Skills四大功能,消费级入口形态让普通用户轻松体验端侧AI
端侧AI
手机大模型
离线推理
Gemma 4
Google开源
iOS
Android
Gemma 4 架构解密:MoE 路由 × GQA 注意力 × Thinking Mode——31B 如何击败 20 倍参数对手
编程
Gemma 4 架构解密:MoE 路由 × GQA 注意力 × Thinking Mode——31B 如何击败 20 倍参数对手
2026-04-19 17:47:49 +0800 CST
view 360
深入解析 Google Gemma 4 的核心技术架构:MoE 稀疏专家路由、GQA 分组查询注意力、PLE 逐层嵌入、Thinking Mode 推理机制,详解 31B 模型如何以小博大击败 20 倍参数对手,附全场景部署实战代码。
Gemma
Google
AI
开源大模型
MoE
GQA
Transformer
深度学习
模型架构
Gemma 4 MoE 架构技术深度解析:Dense MLP + Routed MoE 双路径设计如何重塑开源大模型
编程
Gemma 4 MoE 架构技术深度解析:Dense MLP + Routed MoE 双路径设计如何重塑开源大模型
2026-04-21 14:22:20 +0800 CST
view 367
深度解析 Google Gemma 4 的 Dual-Path 混合架构设计:Dense MLP 保障通用基座能力,Routed MoE 释放专业化推理效率。一文吃透技术原理、部署实战与选型对比。
Gemma 4
MoE架构
Dense MLP
Routed MoE
Google DeepMind
开源大模型
Transformer
模型部署
混合专家
DeepSeek DeepGEMM 2026年4月重磅更新:Mega MoE融合算子、FP4精度与极致性能优化
编程
DeepSeek DeepGEMM 2026年4月重磅更新:Mega MoE融合算子、FP4精度与极致性能优化
2026-04-23 08:41:45 +0800 CST
view 252
深度解析DeepSeek DeepGEMM 2026年4月重大更新:Mega MoE融合算子(dispatch+Linear+SwiGLU+Combine五合一,NVLink通信与Tensor Core计算重叠)、FP8xFP4 GEMM、FP4 Indexer、PDL调度优化与JIT加速,附完整代码实战。
DeepGEMM
DeepSeek
GPU优化
CUDA
FP8
FP4
MoE
AI Infra
高性能计算
NVIDIA
Gemma MacOS Tuner 深度解析:在 Apple Silicon 上用 PyTorch 和 MPS 高效微调多模态 Gemma
编程
Gemma MacOS Tuner 深度解析:在 Apple Silicon 上用 PyTorch 和 MPS 高效微调多模态 Gemma
2026-04-09 01:14:39 +0800 CST
view 743
详解 gemma-tuner-multimodal 项目:在 Apple Silicon 上通过 PyTorch MPS 后端对 Google Gemma 系列模型进行 LoRA 微调,支持文本、图像、音频三种模态,完全本地运行,数据不出机器,零 NVIDIA GPU 依赖。
Gemma
Apple Silicon
PyTorch
MPS
LoRA
微调
Machine Learning
TileLang + TileKernels 深度解析:DeepSeek 如何用 Python 写出让 GPU 逼近理论性能上限的 GPU 内核
编程
TileLang + TileKernels 深度解析:DeepSeek 如何用 Python 写出让 GPU 逼近理论性能上限的 GPU 内核
2026-04-28 10:55:20 +0800 CST
view 238
深度剖析 DeepSeek 开源的 TileLang DSL 和 TileKernels GPU 内核库:从 GEMM 到 MoE,从 TVM 编译基础设施到生产级量化内核,揭示用 Python 写接近硬件极限性能 GPU 代码的秘密。
TileLang
GPU内核
DeepSeek
高性能计算
CUDA
GEMM
MoE
量化
TVM
开源项目
AI Agent 沙箱三国杀:OpenSandbox vs CubeSandbox vs E2B,从内核隔离到秒级调度的全链路技术拆解
编程
AI Agent 沙箱三国杀:OpenSandbox vs CubeSandbox vs E2B,从内核隔离到秒级调度的全链路技术拆解
2026-05-02 06:06:14 +0800 CST
view 481
深度拆解阿里OpenSandbox、腾讯CubeSandbox与E2B三大AI Agent沙箱方案,从内核隔离原理、API协议设计、调度架构、性能实测到生产部署全链路技术分析
OpenSandbox
CubeSandbox
E2B
AI Agent
沙箱
KVM
Docker
Kubernetes
eBPF
RustVMM
视觉即代码:GLM-5V-Turbo 如何用 94.8 分重新定义 Design2Code
编程
视觉即代码:GLM-5V-Turbo 如何用 94.8 分重新定义 Design2Code
2026-05-11 09:52:48 +0800 CST
view 302
智谱AI发布GLM-5V-Turbo多模态编程基座模型,从预训练阶段原生融合视觉与语言,在Design2Code基准测试中以94.8分超越所有竞品。本文深度解析CogViT视觉编码器、MMTP多模态多Token预测、多任务RL优化等技术细节,以及如何用API接入实现从设计稿到可运行代码的完整工作流。
GLM-5V-Turbo
视觉编程
Design2Code
多模态
CogViT
MMTP
智谱AI
AI编程
Claude Memory Compiler 深度解析:当 AI 编程助手第一次拥有「编译器思维」的记忆系统
编程
Claude Memory Compiler 深度解析:当 AI 编程助手第一次拥有「编译器思维」的记忆系统
2026-04-10 03:35:31 +0800 CST
view 477
claude-memory-compiler 把 AI 对话当作源代码,用 LLM 编译成结构化知识库,让 Claude Code 拥有跨会话记忆能力
Claude Code
AI Agent
Knowledge Management
LLM
Memory System
React Compiler 深度解析:让 React 终于学会「自动优化」的编译器魔法
编程
React Compiler 深度解析:让 React 终于学会「自动优化」的编译器魔法
2026-05-12 02:15:08 +0800 CST
view 207
深度解析React Compiler(React Forget)的工作原理:通过静态分析自动推导依赖关系、自动插入useMemo/useCallback记忆化代码、构建数据流图与活性分析算法、Babel插件实现细节、与手动优化性能对比,附Vite/Next.js集成指南与渐进式迁移策略
React,React Compiler,性能优化,自动记忆化,useMemo,useCallback,React.memo,Babel插件,静态分析,前端性能
ASMR 彻底颠覆 RAG:Supermemory 如何以 99% 准确率重新定义 AI Agent 永久记忆
编程
ASMR 彻底颠覆 RAG:Supermemory 如何以 99% 准确率重新定义 AI Agent 永久记忆
2026-05-28 15:44:20 +0800 CST
view 150
ASMR(Agentic Search and Memory Retrieval)在 LongMemEval 基准测试中以 99% 准确率刷新世界纪录,彻底颠覆传统 RAG 方案。本文深入解析 ASMR 的 Observer Agents、Search Agents、Memory Graph 三大核心组件,以及无向量数据库的实现原理。
ASMR
AI Agent
永久记忆
LongMemEval
Supermemory
RAG替代
Supermemory 深度实战:AI 时代的 Memory API 完全指南——从记忆引擎架构到生产级集成的完整解析(2026)
编程
Supermemory 深度实战:AI 时代的 Memory API 完全指南——从记忆引擎架构到生产级集成的完整解析(2026)
2026-06-01 19:52:22 +0800 CST
view 74
Supermemory 是 AI 时代的 Memory Engine,自动提取事实、处理矛盾、构建用户画像。本文深入解析其架构原理、API 使用、集成实战(Vercel AI SDK、LangChain、OpenClaw)、性能优化与生产部署,并对比 Mem0、Zep 等竞品。
AI
Memory
Supermemory
LLM
编程
vue-element-admin 深度解析:90K Star 后台管理标杆,MIT 协议接私活首选
编程
vue-element-admin 深度解析:90K Star 后台管理标杆,MIT 协议接私活首选
2026-05-16 18:36:31 +0800 CST
view 203
GitHub 90K Star 的 Vue2 后台管理集成方案深度解析:权限系统、i18n、Mock、布局架构完整拆解,MIT 协议接私活首选。
vue-element-admin
Vue
Element UI
后台管理
开源
MIT
综合
FcDesigner:低代码表单设计平台
2024-11-19 03:50:18 +0800 CST
view 2101
FcDesigner是一个基于Vue和ElementPlus/ElementUI的低代码表单设计平台,支持拖拽操作,适配Vue2和Vue3,内置中英文国际化,提供36种组件和灵活的事件绑定,允许用户无需代码即可可视化编辑表单。该平台支持复杂布局和多种表单配置,适合快速开发和设计表单界面。
低代码
表单设计
前端开发
ElementUI
ElementPlus
vue
Google I/O 2026 深度解析:Gemini 3.5 Flash 如何以 4 倍速度颠覆 AI 编程——从基准测试到生产级 Agent 开发完全指南
编程
Google I/O 2026 深度解析:Gemini 3.5 Flash 如何以 4 倍速度颠覆 AI 编程——从基准测试到生产级 Agent 开发完全指南
2026-05-23 01:16:34 +0800 CST
view 171
2026年Google I/O大会深度解析:Gemini 3.5 Flash以289 tokens/s的输出速度4倍碾压竞品,从基准测试、技术架构到生产级Agent开发实战,全面解读谷歌Agentic AI战略。
Google I/O 2026
Gemini 3.5 Flash
AI编程
Agent开发
基准测试
Hermes Agent 深度解析:自进化智能体的工程架构与 Skill 生成机制
编程
Hermes Agent 深度解析:自进化智能体的工程架构与 Skill 生成机制
2026-04-12 05:23:08 +0800 CST
view 867
深入解析 Hermes Agent 的自进化智能体架构:从 Skill 自动生成引擎、三层记忆系统、Tool Router 到 Platform Bridge,源码级别剖析 + 代码示例,对比 OpenClaw
AI Agent
Hermes Agent
Nous Research
自进化
智能体
Skill生成
Memory Hub
Tool Router
Google Antigravity 2.0 深度实战:从 AI IDE 到 Agent 编排平台——Google I/O 2026 最大杀器的全栈指南
编程
Google Antigravity 2.0 深度实战:从 AI IDE 到 Agent 编排平台——Google I/O 2026 最大杀器的全栈指南
2026-05-30 11:39:14 +0800 CST
view 79
深度解析 Google Antigravity 2.0 从 AI IDE 到 Agent 编排平台的全面进化
Google
Antigravity
AI编程
Agent编排
Gemini
Google I/O 2026
开发工具
Google I/O 2026 深度解析:Gemini 3.5 Flash 横空出世,Agent 时代的计算范式革命
编程
Google I/O 2026 深度解析:Gemini 3.5 Flash 横空出世,Agent 时代的计算范式革命
2026-05-21 18:57:35 +0800 CST
view 536
2026年5月Google I/O大会发布Gemini 3.5 Flash,输出速度289 token/s达竞品4倍,免费开放,标志AI从被动应答进入Agent自主执行新时代。本文从技术架构、性能基准、工程实践三维度深度解析。
Google I/O 2026
Gemini 3.5 Flash
Agent
AI
大模型
多模态
GPT-6「土豆」深度解析:当「交响乐」架构敲响AGI大门
编程
GPT-6「土豆」深度解析:当「交响乐」架构敲响AGI大门
2026-04-09 08:47:06 +0800 CST
view 629
深度解析OpenAI GPT-6代号「土豆」的技术突破:Symphony原生多模态统一架构、5-6万亿MoE参数、200万Token上下文窗口、System-2双系统推理引擎。探讨其对AI Agent生态的影响。约12000字。
GPT-6
OpenAI
AGI
Symphony
MoE
多模态
上下文窗口
System-2
Agent
OpenHuman 深度实战:用 Rust 构建个人 AI 操作系统——从记忆树到模型路由,登顶 GitHub Trending 的技术内幕
编程
OpenHuman 深度实战:用 Rust 构建个人 AI 操作系统——从记忆树到模型路由,登顶 GitHub Trending 的技术内幕
2026-05-16 07:44:37 +0800 CST
view 293
OpenHuman 深度技术拆解:Memory Tree记忆树、TokenJuice压缩、模型路由、潜意识循环、SQLite+Markdown双轨存储
OpenHuman
Rust
AI Agent
Memory Tree
Model Router
开源项目
PromptSpy 深度解析:当安卓恶意软件第一次在运行时「调用 AI 思考」
编程
PromptSpy 深度解析:当安卓恶意软件第一次在运行时「调用 AI 思考」
2026-04-09 11:54:49 +0800 CST
view 399
2026年2月ESET披露首例Runtime AI安卓恶意软件PromptSpy,深度解析其如何调用Gemini实时决策、突破传统安全检测的技术架构与攻击链。
AI安全
Android
PromptSpy
Gemini
恶意软件
移动安全
ESET
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
...
26
下一页