程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
英伟达 CUDA-Oxide 0.1 深度解析:用 Rust 编写 GPU 内核的破冰之旅
编程
英伟达 CUDA-Oxide 0.1 深度解析:用 Rust 编写 GPU 内核的破冰之旅
2026-05-10 08:20:42 +0800 CST
view 446
英伟达发布实验性Rust-to-CUDA编译器CUDA-Oxide 0.1,支持用Rust编写SIMT GPU内核并输出标准PTX中间代码。深度解析其架构设计、代码示例与未来展望。
CUDA-Oxide
Rust
GPU编程
NVIDIA
PTX
SIMT
并行计算
高性能计算
PHP也能Native AOT编译了!Swoole-Compiler让PHP代码直接变成机器码,性能提升150倍
编程
PHP也能Native AOT编译了!Swoole-Compiler让PHP代码直接变成机器码,性能提升150倍
2026-04-23 16:03:56 +0800 CST
view 268
2026年4月22日Swoole团队发布Native AOT编译器,将PHP代码直接编译为原生二进制,斐波那契测试性能提升150倍,支持C++无缝互调用,PHP正式进入编译型语言性能时代。
Swoole
AOT编译
PHP性能优化
原生编译
C++互调
高性能计算
Polars 深度实战:碾压 Pandas 的 Rust 极速 DataFrame 引擎——从 Apache Arrow 内存模型到 Lazy Execution 的完全指南(2026)
编程
Polars 深度实战:碾压 Pandas 的 Rust 极速 DataFrame 引擎——从 Apache Arrow 内存模型到 Lazy Execution 的完全指南(2026)
2026-06-02 16:24:32 +0800 CST
view 91
深度解析 Polars 如何基于 Rust 和 Apache Arrow 实现比 Pandas 快 94 倍的性能,涵盖 Lazy Execution、查询优化、生产实践
Polars
Rust
DataFrame
Python数据分析
高性能计算
Apache Arrow
Lazy Execution
DeepSeek DeepGEMM 2026年4月重磅更新:Mega MoE融合算子、FP4精度与极致性能优化
编程
DeepSeek DeepGEMM 2026年4月重磅更新:Mega MoE融合算子、FP4精度与极致性能优化
2026-04-23 08:41:45 +0800 CST
view 262
深度解析DeepSeek DeepGEMM 2026年4月重大更新:Mega MoE融合算子(dispatch+Linear+SwiGLU+Combine五合一,NVLink通信与Tensor Core计算重叠)、FP8xFP4 GEMM、FP4 Indexer、PDL调度优化与JIT加速,附完整代码实战。
DeepGEMM
DeepSeek
GPU优化
CUDA
FP8
FP4
MoE
AI Infra
高性能计算
NVIDIA
TileLang + TileKernels 深度解析:DeepSeek 如何用 Python 写出让 GPU 逼近理论性能上限的 GPU 内核
编程
TileLang + TileKernels 深度解析:DeepSeek 如何用 Python 写出让 GPU 逼近理论性能上限的 GPU 内核
2026-04-28 10:55:20 +0800 CST
view 254
深度剖析 DeepSeek 开源的 TileLang DSL 和 TileKernels GPU 内核库:从 GEMM 到 MoE,从 TVM 编译基础设施到生产级量化内核,揭示用 Python 写接近硬件极限性能 GPU 代码的秘密。
TileLang
GPU内核
DeepSeek
高性能计算
CUDA
GEMM
MoE
量化
TVM
开源项目
Pgrx 深度解析:用 Rust 为 PostgreSQL 打造高性能扩展——从入门到生产级实战
编程
Pgrx 深度解析:用 Rust 为 PostgreSQL 打造高性能扩展——从入门到生产级实战
2026-04-28 14:24:36 +0800 CST
view 263
深度解析 Pgrx(4.5k+ Stars)框架:用 Rust 为 PostgreSQL 编写高性能扩展,涵盖类型映射、内存管理、代码实战与生产部署完整指南。
Rust
PostgreSQL
数据库扩展
高性能
开源
系统编程
Pgrx
基于 Rust Pingora 构建高性能的负载均衡器
编程
基于 Rust Pingora 构建高性能的负载均衡器
2024-11-18 08:49:35 +0800 CST
view 1808
本文介绍了使用Rust语言编写的Pingora框架,重点讲解了其高性能、低资源消耗和模块化设计的优势。通过一个简单的HTTP负载均衡器示例,展示了如何使用Pingora构建高性能的负载均衡解决方案,并介绍了健康检查、服务发现等扩展功能,适合构建高可用的网络服务。
编程
网络
负载均衡
Rust
高性能
Rust 高性能七层网关实战:从 Tokio 异步运行时到零拷贝 HTTP 转发的架构完全指南
编程
Rust 高性能七层网关实战:从 Tokio 异步运行时到零拷贝 HTTP 转发的架构完全指南
2026-05-23 20:31:57 +0800 CST
view 162
深度剖析如何用 Rust 构建高性能七层网关,从 Tokio 异步运行时原理、零拷贝转发机制、HTTP/2 与 HTTP/3 支持、连接池管理、到 TLS 硬件卸载等核心技术,结合生产级代码示例,带你掌握下一代高性能网关的架构设计与实战技巧。
Rust
异步编程
高性能网关
Tokio
零拷贝
PHP高性能框架Workerman的核心技术epoll,分析了其如何利用IO多路复用机制实现高性能
综合
PHP高性能框架Workerman的核心技术epoll,分析了其如何利用IO多路复用机制实现高性能
2024-11-19 03:09:27 +0800 CST
view 1696
本文深入探讨了PHP高性能框架Workerman的核心技术epoll,分析了其如何利用IO多路复用机制实现高性能。通过代码示例,展示了如何在PHP中使用epoll创建TCP服务器和处理客户端请求。Workerman的高性能依赖于epoll的高效事件处理能力,使其能够应对高并发场景,为PHP开发者提供了构建高效Web应用的基础。
编程
Web开发
高性能框架
PHP
网络编程
io_uring 深度解析:Linux 异步 I/O 的新纪元——从共享环形缓冲区到零拷贝的三层架构设计
编程
io_uring 深度解析:Linux 异步 I/O 的新纪元——从共享环形缓冲区到零拷贝的三层架构设计
2026-05-17 19:54:31 +0800 CST
view 197
io_uring 是 Linux 5.1 引入的高性能异步 I/O 框架,通过共享内存环形缓冲区、SQPOLL 内核线程池和零拷贝提交的三层架构,重新定义了 Linux 异步 I/O 的性能边界。本文从内核设计哲学到用户态实战,深入讲解 io_uring 的核心原理。
Linux
异步IO
io_uring
高性能
系统编程
io_uring 深度实战:Linux 异步 I/O 如何用零拷贝和共享内存把网络吞吐量推到极限
编程
io_uring 深度实战:Linux 异步 I/O 如何用零拷贝和共享内存把网络吞吐量推到极限
2026-05-04 20:07:01 +0800 CST
view 269
从 Linux 异步 I/O 的历史痛点出发,深度解析 io_uring 的共享内存环形队列架构、零拷贝通信机制,用大量 C/Rust/Go 代码实战演示网络服务开发,给出 SQPOLL、Multishot、Provided Buffers 等生产级优化策略和踩坑经验
io_uring
Linux
异步I/O
网络编程
高性能
Warp:Rust Web开发的急速列车 - 高性能与优雅并存的新一代框架
编程
Warp:Rust Web开发的急速列车 - 高性能与优雅并存的新一代框架
2024-11-19 10:05:16 +0800 CST
view 2192
Warp是一个高性能的RustWeb框架,旨在提供简洁和灵活的开发体验。它结合了Rust的类型安全和函数式编程思想,允许开发者通过组合Filter构建复杂的Web应用。Warp支持异步编程,具有强大的路由系统和内置WebSocket支持,适合各种应用场景。其设计理念使其在Rust生态中脱颖而出,是开发者构建高效Web应用的理想选择。
Rust
Web框架
编程
高性能
开发工具
eBPF/XDP 深度实战:当内核可编程遇上零拷贝网络——从架构原理到生产级高性能数据面完全指南(2026)
编程
eBPF/XDP 深度实战:当内核可编程遇上零拷贝网络——从架构原理到生产级高性能数据面完全指南(2026)
2026-06-05 10:37:30 +0800 CST
view 60
eBPF/XDP 完全指南:从内核可编程原理到 XDP 零拷贝网络实战,涵盖验证器机制、开发环境搭建、代码实战、性能优化、DDoS 防护案例,生产级部署最佳实践。
eBPF
XDP
Linux内核
网络编程
高性能
Hertz 深度实战:字节跳动开源的高性能 Go HTTP 框架——从架构原理到生产级 RESTful API 完全指南(2026)
编程
Hertz 深度实战:字节跳动开源的高性能 Go HTTP 框架——从架构原理到生产级 RESTful API 完全指南(2026)
2026-06-05 12:38:37 +0800 CST
view 52
Hertz是字节跳动开源的高性能Go HTTP框架,基于自研Netpoll网络库,性能显著优于Gin。本文从架构原理到生产级实战,完整讲解Hertz的核心设计与工程化落地。
Go,Hertz,高性能,微服务,HTTP框架
Rust + io_uring 高性能网络编程实战:从内核原理到生产级架构
编程
Rust + io_uring 高性能网络编程实战:从内核原理到生产级架构
2026-04-25 07:04:06 +0800 CST
view 289
深入剖析io_uring内核架构与Rust异步运行时生态,对比三大io_uring运行时,实战构建生产级TCP服务与HTTP解析器,性能优化从微秒到纳秒
Rust
io_uring
高性能网络编程
异步IO
Linux内核
Rust 异步编程深度实战:从 Future 原理到 Tokio 运行时调优的完整指南(2026版)
编程
Rust 异步编程深度实战:从 Future 原理到 Tokio 运行时调优的完整指南(2026版)
2026-05-19 09:27:23 +0800 CST
view 235
深入解析 Rust 异步编程的核心机制,从 Future trait 的底层原理到 Tokio 运行时的调度策略,结合大量实战代码,帮助你在生产环境中构建高性能、高可靠的异步应用。
Rust
异步编程
Tokio
高性能
Rust 异步运行时深度实战:Tokio 内幕、任务调度与生产级性能调优(2026)
编程
Rust 异步运行时深度实战:Tokio 内幕、任务调度与生产级性能调优(2026)
2026-05-29 04:38:01 +0800 CST
view 125
从 Tokio 源码级架构出发,深入讲解 Rust 异步运行时的核心原理、任务调度机制、Waker 实现、work-stealing 算法,以及生产级性能调优实战。
Rust
Tokio
异步运行时
高性能编程
并发编程
Volo 深度实战:字节跳动开源的高性能 Rust RPC 框架——从 AFIT/RPITIT 到微服务生产部署的全链路架构解析
编程
Volo 深度实战:字节跳动开源的高性能 Rust RPC 框架——从 AFIT/RPITIT 到微服务生产部署的全链路架构解析
2026-05-07 12:35:44 +0800 CST
view 298
字节跳动开源的高性能 Rust RPC 框架 Volo 深度解析,QPS 达 350k-440k,充分利用 AFIT/RPITIT 等最新 Rust 特性,支持 Thrift/gRPC/HTTP 多协议。
Rust
RPC
Volo
字节跳动
微服务
高性能
AFIT
RPITIT
W3C震撼官宣:WebAssembly正式成为Web一等编程语言——从 "JavaScript小弟" 到 "原生级性能霸主" 的完整技术解析
编程
W3C震撼官宣:WebAssembly正式成为Web一等编程语言——从 "JavaScript小弟" 到 "原生级性能霸主" 的完整技术解析
2026-05-16 21:49:12 +0800 CST
view 208
2026年3月W3C正式将WebAssembly定为Web一等编程语言。本文深度解析WASM如何打破JavaScript垄断,直接DOM操作、多语言支持(Rust/C++/Go/Python)、并行计算与GPU加速,以及Blazor从4.2秒优化到300ms的实战案例。
WebAssembly
WASM
Rust
性能优化
浏览器
WASI
边缘计算
并行计算
GPU加速
traj-dist-rs 深度解析:当 Rust + Rayon 把 Python 扮成「130 倍提速」的并行怪兽
编程
traj-dist-rs 深度解析:当 Rust + Rayon 把 Python 扮成「130 倍提速」的并行怪兽
2026-04-10 09:15:47 +0800 CST
view 474
深度解析 traj-dist-rs 如何用 Rust + Rayon 实现 Python 130倍提速。从 GIL 瓶颈、Work-Stealing 算法、零拷贝 FFI 到实战代码,全面剖析 Rust 加速 Python 的技术路径。
Rust
Python
Rayon
并行计算
性能优化
百度开源压测工具 dperf
综合
百度开源压测工具 dperf
2024-11-18 16:50:58 +0800 CST
view 1759
dperf是百度开源的高性能压测工具,基于DPDK技术,能够在普通x86服务器上模拟巨大的流量,支持每秒千万级的HTTP连接和数百Gbps的吞吐量。它提供详细的统计信息,适用于四层负载均衡、云虚拟机和HTTP服务器的性能测试,是企业级用户和开发者的理想选择。
开源
网络
性能测试
工具
云计算
WebGPU 计算着色器深度解析:WGSL 编程范式与 GPU 并行计算实战
编程
WebGPU 计算着色器深度解析:WGSL 编程范式与 GPU 并行计算实战
2026-05-17 11:46:05 +0800 CST
view 216
深入解析 WebGPU 计算着色器与 WGSL 着色语言,从架构原理到代码实战,涵盖图像处理、粒子模拟、神经网络推理三大场景,探讨 GPU 并行计算的优化策略与生态趋势。
WebGPU
WGSL
Compute Shader
GPU编程
并行计算
JavaScript
前端性能
GPGPU
综合
如何在短时间内向250万个主机发送5亿个不符合RFC的HTTP/1.1请求
2024-11-18 13:38:35 +0800 CST
view 1503
本文讨论了如何在短时间内向250万个主机发送5亿个不符合RFC的HTTP/1.1请求。通过深入研究Go语言和HTTP/1.1的细节,采用Kubernetes进行水平扩展,优化代码以充分利用CPU核心,并使用低级HTTP库fasthttp,最终在几个小时内成功完成任务。文章还探讨了DNS解析、TLS握手等请求复杂性及其优化策略。
编程
网络
性能优化
云计算
WebAssembly 3.0 多内存架构深度解析:当「内存隔离」成为前端性能的新引擎
编程
WebAssembly 3.0 多内存架构深度解析:当「内存隔离」成为前端性能的新引擎
2026-04-12 21:27:18 +0800 CST
view 294
本文深入解析WebAssembly3.0引入的多内存架构,从单内存模型的困境(内存越界、容量限制、安全模糊)出发,详细阐述多内存特性的设计目标、技术原理(内存索引、访问控制、安全隔离)及工程实践。通过浪潮软件的前端渲染专利案例,展示三层内存架构(GPU内存、SIMD内存、CPU内存)带来的显著性能提升(渲染帧率+37%,计算加速6.7倍)。结合Rust工具链、内存管理最佳实践及Rust1.96链接器变更,探讨多内存在在线设计工具、数据处理等场景的应用,并展望组件模型与64位地址空间的未来发展方向。
WebAssembly
前端性能
内存管理
并行计算
浏览器技术
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
...
19
下一页