程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Kronos 深度解析:金融市场基础模型的崛起——从120亿K线数据中炼金的AI革命
编程
Kronos 深度解析:金融市场基础模型的崛起——从120亿K线数据中炼金的AI革命
2026-04-17 15:45:39 +0800 CST
view 594
Kronos是首个开源金融K线基础模型,在45个交易所120亿条数据上预训练,零样本价格预测RankIC提升93%。本文深入解析其Tokenizer架构、预训练范式,并提供代码实战指南。
Kronos
金融AI
基础模型
时间序列
K线
量化交易
LLM 推理优化全景实战:从 PagedAttention 到投机解码——让大模型推理成本下降 70% 的技术革命(2026)
编程
LLM 推理优化全景实战:从 PagedAttention 到投机解码——让大模型推理成本下降 70% 的技术革命(2026)
2026-05-30 15:42:55 +0800 CST
view 201
深度解析 LLM 推理优化的核心技术:PagedAttention 内存管理革命、投机解码加速策略、INT4/FP8 量化技术、MoE 架构优化,从架构原理到代码实战,让大模型推理成本下降 70%。
LLM
推理优化
vLLM
PagedAttention
投机解码
量化
MoE
ds4 深度解析:Redis 作者的最后一战?—— DwarfStar 4 本地推理引擎的技术革命
编程
ds4 深度解析:Redis 作者的最后一战?—— DwarfStar 4 本地推理引擎的技术革命
2026-05-15 17:47:40 +0800 CST
view 404
深入解析 antirez(Redis 作者)新开源项目 ds4:DwarfStar 4 本地推理引擎,专门为 DeepSeek V4 Flash 打造,支持 Metal/CUDA 后端,2-bit 量化可在 96GB 内存 MacBook 上运行 284B 参数模型。
AI推理
本地部署
DeepSeek
Redis
Apple Silicon
CUDA
Metal
MoE
量化
Ollama 本地大模型部署实战:从零到生产级应用的完全指南(2026)
编程
Ollama 本地大模型部署实战:从零到生产级应用的完全指南(2026)
2026-06-10 01:20:57 +0800 CST
view 147
2026年Ollama本地大模型部署完全指南:从架构原理、GGUF量化、ModelFile自定义、多语言集成(Python/JS/Go)、RAG实战到Docker/K8s生产部署,8500字深度长文。
Ollama
本地部署
大模型
LLM
生产级
GGUF
量化
TensorRT-LLM 深度实战:从 Blackwell 架构到 INT4 量化的 LLM 推理性能革命
编程
TensorRT-LLM 深度实战:从 Blackwell 架构到 INT4 量化的 LLM 推理性能革命
2026-05-22 06:19:51 +0800 CST
view 307
深入解析TensorRT-LLM推理框架,从Paged KV Cache、连续批处理到INT4/INT8/FP8量化实战,覆盖Blackwell架构适配、Triton部署与K8s生产方案
TensorRT-LLM
LLM推理
量化
INT4
Blackwell
GPU优化
小米 MiMo UltraSpeed 深度解析:当 SWA 架构重塑 LLM 推理——从 O(n²) 困境到 1000 tokens/s 的极致跨越
编程
小米 MiMo UltraSpeed 深度解析:当 SWA 架构重塑 LLM 推理——从 O(n²) 困境到 1000 tokens/s 的极致跨越
2026-06-15 21:20:49 +0800 CST
view 25
深入解析小米MiMo UltraSpeed如何通过SWA架构在通用GPU上突破1000 tokens/s推理速度,从O(n²)困境到极致跨越的完整技术指南。
SWA
Sliding Window Attention
LLM推理
小米MiMo
推理优化
Transformer
PagedAttention
量化推理
端侧AI
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
编程
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
2026-04-09 03:15:44 +0800 CST
view 703
2026年TensorRT-LLM v0.19全面解析:Skip Softmax稀疏注意力、Paged KV Cache显存管理、INT8/INT4低比特量化完整实战,Blackwell架构适配指南,70B模型单卡部署方案
TensorRT-LLM
低比特量化
Blackwell
INT8
INT4
推理优化
NVIDIA
TileLang + TileKernels 深度解析:DeepSeek 如何用 Python 写出让 GPU 逼近理论性能上限的 GPU 内核
编程
TileLang + TileKernels 深度解析:DeepSeek 如何用 Python 写出让 GPU 逼近理论性能上限的 GPU 内核
2026-04-28 10:55:20 +0800 CST
view 314
深度剖析 DeepSeek 开源的 TileLang DSL 和 TileKernels GPU 内核库:从 GEMM 到 MoE,从 TVM 编译基础设施到生产级量化内核,揭示用 Python 写接近硬件极限性能 GPU 代码的秘密。
TileLang
GPU内核
DeepSeek
高性能计算
CUDA
GEMM
MoE
量化
TVM
开源项目
llama.cpp 深度实战:当 C/C++ 重写遇见端侧 LLM 推理——从 GGUF 量化到 Apple Silicon 38 tokens/s 的生产级完全指南(2026)
编程
llama.cpp 深度实战:当 C/C++ 重写遇见端侧 LLM 推理——从 GGUF 量化到 Apple Silicon 38 tokens/s 的生产级完全指南(2026)
2026-06-16 01:17:28 +0800 CST
view 30
llama.cpp 是端侧 LLM 推理的事实标准(180K+ Stars)。本文从源码架构、GGUF 格式、量化方法、跨平台后端、生产部署、性能优化到 DeepSeek V4 Flash 实战,全方位讲解本地 AI 推理。
llama.cpp
GGUF
量化
端侧推理
本地AI
C/C++
Apple Silicon
Polars 深度实战:Rust+Arrow 原生架构如何重构 Python 数据处理
编程
Polars 深度实战:Rust+Arrow 原生架构如何重构 Python 数据处理
2026-05-09 06:39:07 +0800 CST
view 257
深入解析 Polars 的 Rust+Arrow 原生架构,从内存格式革命到查询优化器原理,对比 Pandas 性能差异,详解 Polars 2.0 关键升级与生产级实战技巧。
Python
Rust
数据分析
DataFrame
Pathway 深度解析:Python ETL 框架的流式处理革命 —— 用 Rust 引擎吊打 Flink/Spark,构建实时 LLM Pipeline
编程
Pathway 深度解析:Python ETL 框架的流式处理革命 —— 用 Rust 引擎吊打 Flink/Spark,构建实时 LLM Pipeline
2026-05-16 03:46:12 +0800 CST
view 269
55K+ Star,基于 Differential Dataflow 的 Rust 引擎,增量计算,内存计算,无缝集成 Python ML 生态——Pathway 正在重新定义实时流处理与 LLM Pipeline 的边界。
Python
流处理
实时分析
LLM
RAG
Pathway
ETL
开源项目
GitHub Trending
sql语句分别按日,按周,按月,按季统计金额
编程
sql语句分别按日,按周,按月,按季统计金额
2024-11-17 05:05:22 +0800 CST
view 3140
本文讨论如何使用SQL语句按日、周、月和季节统计消费记录的总量。提供了四条SQL示例语句,分别实现不同时间段的消费总和计算,并说明了如何根据指定日期进行查询。示例中使用了聚合函数和groupby语句,适用于消费记录表的分析。
数据库
SQL
数据分析
Dirty Frag 深度实战:Linux 内核零拷贝页缓存污染漏洞——从 splice() 注入到双链提权的完整技术剖析
编程
Dirty Frag 深度实战:Linux 内核零拷贝页缓存污染漏洞——从 splice() 注入到双链提权的完整技术剖析
2026-05-16 12:14:12 +0800 CST
view 363
深度剖析 Linux 内核 Dirty Frag 漏洞链,从 splice() 零拷贝注入到 xfrm-ESP 与 RxRPC 双链提权的完整技术实战,含防护方案与 eBPF 检测
Linux
内核安全
漏洞分析
提权
零拷贝
eBPF
Chrome DevTools MCP 深度解析:谷歌官方出品的 AI 编程助手浏览器控制利器
编程
Chrome DevTools MCP 深度解析:谷歌官方出品的 AI 编程助手浏览器控制利器
2026-04-29 08:44:10 +0800 CST
view 398
37K+ Star 谷歌官方开源项目,让 Claude、Cursor、Copilot 等 AI 编程助手直接操控浏览器进行自动化调试、性能分析和智能测试。深度解析 MCP 协议、CDP 协议、30+ 工具详解、代码实战、部署指南。
Chrome DevTools
MCP
AI编程助手
浏览器自动化
性能分析
微软开源文档转换神器 MarkItDown:58K+ Star 的 Markdown 工具,支持 MCP 协议
编程
微软开源文档转换神器 MarkItDown:58K+ Star 的 Markdown 工具,支持 MCP 协议
2025-06-05 23:01:13 +0800 CST
view 1543
MarkItDown是微软开源的文档转换工具,支持多种文件格式(如PDF、Office、图片、音频等)转换为结构化的Markdown文档,适用于AI大模型和文本分析。该工具在GitHub上获得了超过58K的Star,提供了命令行和PythonAPI使用方式,并支持MarkdownConversionProtocol(MCP)。尽管在处理复杂格式时可能存在限制,但其多格式支持使其成为开发者的有力工具。
开源工具
文档处理
人工智能
文本分析
Polars 深度实战:碾压 Pandas 的 Rust 极速 DataFrame 引擎——从 Apache Arrow 内存模型到 Lazy Execution 的完全指南(2026)
编程
Polars 深度实战:碾压 Pandas 的 Rust 极速 DataFrame 引擎——从 Apache Arrow 内存模型到 Lazy Execution 的完全指南(2026)
2026-06-02 16:24:32 +0800 CST
view 184
深度解析 Polars 如何基于 Rust 和 Apache Arrow 实现比 Pandas 快 94 倍的性能,涵盖 Lazy Execution、查询优化、生产实践
Polars
Rust
DataFrame
Python数据分析
高性能计算
Apache Arrow
Lazy Execution
CVE-2026-31431 深度解析:732字节脚本攻破Linux内核的十年潜伏漏洞
编程
CVE-2026-31431 深度解析:732字节脚本攻破Linux内核的十年潜伏漏洞
2026-04-30 14:50:33 +0800 CST
view 478
深入剖析CVE-2026-31431漏洞原理、利用技术、容器逃逸影响及防护方案
Linux
内核安全
漏洞分析
提权
容器逃逸
如何判断用户是否离开了当前页面?
编程
如何判断用户是否离开了当前页面?
2025-06-28 17:11:21 +0800 CST
view 1111
在现代Web开发中,判断用户是否离开当前页面是一个重要需求。本文介绍了多种方法,包括使用PageVisibilityAPI判断页面可见性、beforeunload和unload事件处理用户离开、sendBeacon方法安全上报数据,以及pagehide和pageshow事件应对浏览器缓存。合理使用这些技术可以提升用户体验、节省资源和保证数据完整性。
Web开发
用户体验
数据分析
GitNexus 深度解析:32K Star 的零服务器代码知识图谱引擎,如何让 AI 编程助手拥有架构级理解能力
编程
GitNexus 深度解析:32K Star 的零服务器代码知识图谱引擎,如何让 AI 编程助手拥有架构级理解能力
2026-05-01 04:25:14 +0800 CST
view 429
深度拆解 32K Star 开源项目 GitNexus:零服务器代码知识图谱引擎的架构原理、六阶段索引流水线、16 个 MCP 工具详解、与 Claude Code/Cursor 的深度集成实战
GitNexus
知识图谱
代码分析
MCP
AI编程
数据可视化之 pyecharts 可视化 || 绘制箱图
编程
数据可视化之 pyecharts 可视化 || 绘制箱图
2024-11-19 10:06:29 +0800 CST
view 1944
箱线图是一种用于描述数据分布的统计图形,能够展示中位数、四分位数、上下限及异常值。本文介绍了如何使用pyecharts绘制基本和多组数据的箱线图,并提供了样式自定义的示例。通过代码示例,读者可以在JupyterNotebook中直接展示图表,满足数据分析和可视化的需求。
数据可视化
统计分析
Python编程
eBPF 深度实战:从内核探测原理到零侵入可观测性架构——一个系统程序员的性能分析全攻略
编程
eBPF 深度实战:从内核探测原理到零侵入可观测性架构——一个系统程序员的性能分析全攻略
2026-05-01 22:15:56 +0800 CST
view 360
eBPF深度实战:从底层架构到验证器机制,从Map数据结构到零侵入HTTP追踪、IO延迟分析、TCP生命周期监控,构建生产级可观测性系统的完整技术攻略
eBPF
Linux
可观测性
内核
性能分析
Tweepy是一个强大的Python库,简化了与TwitterAPI的交互
编程
Tweepy是一个强大的Python库,简化了与TwitterAPI的交互
2024-11-19 00:09:42 +0800 CST
view 1496
Tweepy是一个强大的Python库,简化了与TwitterAPI的交互。本文介绍了Tweepy的安装、基本用法和高级功能,包括实时推文监听和数据分页。通过实际案例,展示了如何使用Tweepy进行推文搜索和词频统计,并生成词云图,帮助开发者快速掌握该工具,适用于社交媒体分析和营销等领域。
Python
社交媒体
数据分析
Hypothesis是一个强大的Python测试库
综合
Hypothesis是一个强大的Python测试库
2024-11-19 04:31:30 +0800 CST
view 1691
Hypothesis是一个强大的Python测试库,专注于属性测试和基于示例的测试,能够自动生成测试用例,帮助开发者发现潜在的bug和边界情况。本文介绍了Hypothesis的安装、基本用法、高级特性及实际应用案例,强调其在提高代码质量和测试覆盖率方面的重要性。Hypothesis适合各种Python开发者,尤其是在复杂逻辑测试和数据处理验证中。
Python
测试
软件开发
数据分析
科学计算
ascacou是一个Python库,专注于数据分析和处理
综合
ascacou是一个Python库,专注于数据分析和处理
2024-11-18 06:19:36 +0800 CST
view 1455
ascacou是一个假设存在的Python库,专注于数据分析和处理。本文介绍了如何安装ascacou库,并展示了其基本用法,包括数据读取、数据清洗、数据聚合和异常值处理等功能。通过示例,读者可以了解如何使用ascacou进行高效的数据操作,帮助开发者快速分析和处理数据。
Python库
数据处理
数据分析
编程
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
5
6
下一页