程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
小米 MiMo UltraSpeed 深度解析:当 SWA 架构重塑 LLM 推理——从 O(n²) 困境到 1000 tokens/s 的极致跨越
编程
小米 MiMo UltraSpeed 深度解析:当 SWA 架构重塑 LLM 推理——从 O(n²) 困境到 1000 tokens/s 的极致跨越
2026-06-15 21:20:49 +0800 CST
view 124
深入解析小米MiMo UltraSpeed如何通过SWA架构在通用GPU上突破1000 tokens/s推理速度,从O(n²)困境到极致跨越的完整技术指南。
SWA
Sliding Window Attention
LLM推理
小米MiMo
推理优化
Transformer
PagedAttention
量化推理
端侧AI
分布式 LLM 推理架构深度实战:从 vLLM 单节点到 llm-d 多集群的生产级演进全链路解析
编程
分布式 LLM 推理架构深度实战:从 vLLM 单节点到 llm-d 多集群的生产级演进全链路解析
2026-05-09 03:39:58 +0800 CST
view 459
深度解析分布式 LLM 推理架构,从 vLLM 单节点到 llm-d 多集群的生产级演进。涵盖推理引擎层、编排调度层、Kubernetes 多机多卡部署实战、性能优化技巧及成本优化策略。
LLM
vLLM
分布式推理
Kubernetes
Ray
推理引擎
Biome 深度实战:当 Rust 把前端工具链做到极致——从 ESLint + Prettier 合体到 35 倍性能跨越的生产级完全指南(2026)
编程
Biome 深度实战:当 Rust 把前端工具链做到极致——从 ESLint + Prettier 合体到 35 倍性能跨越的生产级完全指南(2026)
2026-06-21 11:56:47 +0800 CST
view 78
深入解析 Biome:一个用 Rust 重写的 Web 工具链,整合 ESLint + Prettier,在 17 万行代码规模下比 Prettier 快 35 倍。包含架构原理、迁移实战、性能实测。
Rust
Biome
前端工具链
ESLint
Prettier
性能优化
MIT黑科技:TriAttention如何用三角函数让大模型「记住」超长上下文
编程
MIT黑科技:TriAttention如何用三角函数让大模型「记住」超长上下文
2026-04-18 12:45:10 +0800 CST
view 549
深度解析MIT/NVIDIA/浙大联合发布的TriAttention技术,用三角函数预测注意力分布,实现KV Cache智能压缩,让超长上下文推理成为可能
大模型
注意力机制
KV缓存
Transformer
深度学习
AI优化
CloakBrowser 深度解析:用源码级补丁绕过所有反爬虫检测——开源 Stealth Chromium 如何做到 30/30 测试全过
编程
CloakBrowser 深度解析:用源码级补丁绕过所有反爬虫检测——开源 Stealth Chromium 如何做到 30/30 测试全过
2026-05-16 01:14:57 +0800 CST
view 457
CloakBrowser通过49个C++补丁修改Chromium源码,实现真正的stealth浏览器自动化。本文深度解析其技术原理、架构设计、实战应用,以及与playwright-stealth等工具的本质区别。
CloakBrowser
浏览器自动化
反爬虫
Chromium
Stealth
Playwright
Python
JavaScript
开源
AI_Agent
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
47
48
49
下一页