程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
LLM 推理优化全景实战:从 PagedAttention 到投机解码——让大模型推理成本下降 70% 的技术革命(2026)
编程
LLM 推理优化全景实战:从 PagedAttention 到投机解码——让大模型推理成本下降 70% 的技术革命(2026)
2026-05-30 15:42:55 +0800 CST
view 207
深度解析 LLM 推理优化的核心技术:PagedAttention 内存管理革命、投机解码加速策略、INT4/FP8 量化技术、MoE 架构优化,从架构原理到代码实战,让大模型推理成本下降 70%。
LLM
推理优化
vLLM
PagedAttention
投机解码
量化
MoE
DuckDB 深度实战:从零构建高性能数据分析引擎,嵌入式 OLAP 的终极指南
编程
DuckDB 深度实战:从零构建高性能数据分析引擎,嵌入式 OLAP 的终极指南
2026-04-27 18:23:00 +0800 CST
view 373
DuckDB 深度解析:从架构设计到代码实战,全面剖析这款嵌入式分析型数据库的核心原理、性能优化技巧和生产环境实践。
DuckDB
嵌入式数据库
OLAP
数据分析
SQL
Python
列式存储
向量化执行
ds4 深度解析:Redis 作者的最后一战?—— DwarfStar 4 本地推理引擎的技术革命
编程
ds4 深度解析:Redis 作者的最后一战?—— DwarfStar 4 本地推理引擎的技术革命
2026-05-15 17:47:40 +0800 CST
view 415
深入解析 antirez(Redis 作者)新开源项目 ds4:DwarfStar 4 本地推理引擎,专门为 DeepSeek V4 Flash 打造,支持 Metal/CUDA 后端,2-bit 量化可在 96GB 内存 MacBook 上运行 284B 参数模型。
AI推理
本地部署
DeepSeek
Redis
Apple Silicon
CUDA
Metal
MoE
量化
Ollama 本地大模型部署实战:从零到生产级应用的完全指南(2026)
编程
Ollama 本地大模型部署实战:从零到生产级应用的完全指南(2026)
2026-06-10 01:20:57 +0800 CST
view 160
2026年Ollama本地大模型部署完全指南:从架构原理、GGUF量化、ModelFile自定义、多语言集成(Python/JS/Go)、RAG实战到Docker/K8s生产部署,8500字深度长文。
Ollama
本地部署
大模型
LLM
生产级
GGUF
量化
TensorRT-LLM 深度实战:从 Blackwell 架构到 INT4 量化的 LLM 推理性能革命
编程
TensorRT-LLM 深度实战:从 Blackwell 架构到 INT4 量化的 LLM 推理性能革命
2026-05-22 06:19:51 +0800 CST
view 309
深入解析TensorRT-LLM推理框架,从Paged KV Cache、连续批处理到INT4/INT8/FP8量化实战,覆盖Blackwell架构适配、Triton部署与K8s生产方案
TensorRT-LLM
LLM推理
量化
INT4
Blackwell
GPU优化
小米 MiMo UltraSpeed 深度解析:当 SWA 架构重塑 LLM 推理——从 O(n²) 困境到 1000 tokens/s 的极致跨越
编程
小米 MiMo UltraSpeed 深度解析:当 SWA 架构重塑 LLM 推理——从 O(n²) 困境到 1000 tokens/s 的极致跨越
2026-06-15 21:20:49 +0800 CST
view 36
深入解析小米MiMo UltraSpeed如何通过SWA架构在通用GPU上突破1000 tokens/s推理速度,从O(n²)困境到极致跨越的完整技术指南。
SWA
Sliding Window Attention
LLM推理
小米MiMo
推理优化
Transformer
PagedAttention
量化推理
端侧AI
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
编程
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
2026-04-09 03:15:44 +0800 CST
view 707
2026年TensorRT-LLM v0.19全面解析:Skip Softmax稀疏注意力、Paged KV Cache显存管理、INT8/INT4低比特量化完整实战,Blackwell架构适配指南,70B模型单卡部署方案
TensorRT-LLM
低比特量化
Blackwell
INT8
INT4
推理优化
NVIDIA
TileLang + TileKernels 深度解析:DeepSeek 如何用 Python 写出让 GPU 逼近理论性能上限的 GPU 内核
编程
TileLang + TileKernels 深度解析:DeepSeek 如何用 Python 写出让 GPU 逼近理论性能上限的 GPU 内核
2026-04-28 10:55:20 +0800 CST
view 318
深度剖析 DeepSeek 开源的 TileLang DSL 和 TileKernels GPU 内核库:从 GEMM 到 MoE,从 TVM 编译基础设施到生产级量化内核,揭示用 Python 写接近硬件极限性能 GPU 代码的秘密。
TileLang
GPU内核
DeepSeek
高性能计算
CUDA
GEMM
MoE
量化
TVM
开源项目
llama.cpp 深度实战:当 C/C++ 重写遇见端侧 LLM 推理——从 GGUF 量化到 Apple Silicon 38 tokens/s 的生产级完全指南(2026)
编程
llama.cpp 深度实战:当 C/C++ 重写遇见端侧 LLM 推理——从 GGUF 量化到 Apple Silicon 38 tokens/s 的生产级完全指南(2026)
2026-06-16 01:17:28 +0800 CST
view 53
llama.cpp 是端侧 LLM 推理的事实标准(180K+ Stars)。本文从源码架构、GGUF 格式、量化方法、跨平台后端、生产部署、性能优化到 DeepSeek V4 Flash 实战,全方位讲解本地 AI 推理。
llama.cpp
GGUF
量化
端侧推理
本地AI
C/C++
Apple Silicon
什么是 Vue 的服务端渲染(SSR)?它与客户端渲染的区别是什么?
编程
什么是 Vue 的服务端渲染(SSR)?它与客户端渲染的区别是什么?
2024-11-18 09:40:45 +0800 CST
view 1609
Vue的服务端渲染(SSR)是一种在服务器上生成完整HTML页面并发送给客户端的技术,提供更好的SEO和更快的首屏加载速度。与客户端渲染(CSR)相比,SSR减轻了客户端负担,适合需要优化加载时间和搜索引擎优化的场景。Vue提供了`vue-server-renderer`库来实现SSR,开发者可以根据需求选择合适的渲染方式。
Web开发
前端技术
Vue.js
渲染技术
性能优化
Plate:基于AI+MCP的下一代富文本编辑器开发框架
编程
Plate:基于AI+MCP的下一代富文本编辑器开发框架
2025-08-20 10:33:21 +0800 CST
view 996
Plate是一个基于AI和MCP协议的富文本编辑器开发框架,旨在解决传统编辑器的开发复杂性和扩展性问题。它通过原生AI集成、标准化的MCP协议和现代化的UI设计,提供高效的开发体验和智能编辑功能。Plate支持多种应用场景,包括智能内容创作、企业知识库和教育平台,致力于成为现代内容编辑的技术基石。
技术
开发
开源
编辑器
AI技术
社区
WebAssembly:前端开发的性能加速利器
编程
WebAssembly:前端开发的性能加速利器
2025-08-27 08:32:56 +0800 CST
view 858
WebAssembly(WASM)是一种可在浏览器中运行的二进制指令格式,提供接近原生的性能表现,支持多种编程语言。它的优势包括卓越的执行速度、多语言开发支持、增强的安全性和广泛的浏览器兼容性。WASM在视频处理、图像处理、游戏、AI推理等领域有广泛应用。它与JavaScript并存,专注于性能密集型任务,推动前端开发进入新的性能时代。
Web技术
编程语言
前端开发
性能优化
浏览器技术
地图API全面收费!5个零成本替代方案,省下百万开发成本!
编程
地图API全面收费!5个零成本替代方案,省下百万开发成本!
2025-08-28 15:15:45 +0800 CST
view 2981
本文探讨了面对高德、百度、腾讯地图API全面收费的情况,提供了五个零成本或低成本的地图替代方案,包括OpenStreetMap和MHCMap等。文章详细介绍了这些方案的优势、使用方式及适用场景,并强调了法律合规的重要性,建议企业考虑自建地图服务架构以降低长期成本和风险。
地图服务
开源技术
开发者资源
成本管理
技术自主
WebRTC直播技术详解:从原理到实战演示
编程
WebRTC直播技术详解:从原理到实战演示
2025-09-02 10:30:46 +0800 CST
view 1035
WebRTC是一种开放标准,允许Web应用实现实时音视频通信,广泛应用于直播、视频会议等场景。本文详细介绍了WebRTC的核心技术原理,包括信令服务器、SDP和ICE,并提供了一个完整的WebRTC直播系统的实战演示代码。通过理解这些核心概念,开发者可以构建低延迟的直播应用,提升用户体验。
实时通信
Web技术
直播技术
编程
浏览器居然自带语音 API 和流处理 API!
2024-11-19 06:19:21 +0800 CST
view 1497
本文介绍了浏览器内置的语音合成API和流处理API的工作原理及应用场景,强调了它们在提升网页可访问性和用户体验方面的重要性。语音合成API允许将文本转换为语音,适用于视觉障碍用户;流处理API则支持按需读取数据,适合处理大型文件和实时数据流。通过这些技术,开发者可以创建更智能的网页应用。
网页开发
无障碍技术
前端技术
Cursor 3 深度解析:当 IDE 退居二线,智能体控制台成为主角
编程
Cursor 3 深度解析:当 IDE 退居二线,智能体控制台成为主角
2026-04-08 14:02:14 +0800 CST
view 664
Cursor3.0版本(代号'Glass')彻底重构产品形态,将传统IDE退居次要位置,以智能体管理控制台为核心。它支持多智能体并行工作、本地-云端无缝切换、集成化PR工作流和多仓库支持,采用AI-First架构和智能体编排引擎,标志着AI辅助开发从'增强人类编码'向'人类指挥智能体'的根本转变,推动开发者角色从编码者向架构师或AI编排师演进。
AI编程工具
软件开发范式
智能体技术
开发者工作流
技术趋势分析
回到上次阅读位置技术实践
编程
回到上次阅读位置技术实践
2025-04-19 09:47:31 +0800 CST
view 1369
本文讨论了在长网页中自动定位用户上次阅读位置的技术需求与实现方案。主要包括位置记录、数据存储和位置恢复。对比了四种方案:使用scroll事件和localStorage、锚点ID与URL、IntersectionObserverAPI以及滚动位置预测,分析了各方案的优缺点及适用场景,提供了选型建议以提升用户体验。
前端开发
用户体验
技术方案
网页设计
综合
markdown语法
2024-11-18 18:38:43 +0800 CST
view 3773
Markdown是一种轻量级标记语言,以纯文本形式编写文档并可转换为HTML格式。由AaronSwartz和JohnGruber设计,因其易读、易写、易更改而受到广泛使用。Markdown支持多种语法,如标题、段落、引用、代码块等,适用于多种平台和工具,越来越多的网站和应用程序支持Markdown,方便用户组织内容。
编程
文档
技术
工具
网络
Vue3 中哪些 API 变化较大,需要开发者特别留意?
编程
Vue3 中哪些 API 变化较大,需要开发者特别留意?
2024-11-18 10:16:41 +0800 CST
view 1409
Vue3中的API变化为开发者带来了新的功能和优化,特别是CompositionAPI、Teleport和Fragments。CompositionAPI提供了灵活的逻辑组织方式,提升了代码的可维护性和重用性;Teleport允许将组件渲染到DOM的其他位置;Fragments让模板结构更加简洁,避免了不必要的包裹元素。这些变化显著提升了开发体验。
前端开发
Vue.js
编程
技术
框架
从OpenClaw到Hermes Agent:两款爆火开源AI Agent的对决与深层技术哲学
编程
从OpenClaw到Hermes Agent:两款爆火开源AI Agent的对决与深层技术哲学
2026-04-18 16:15:01 +0800 CST
view 371
深度解析OpenClaw与Hermes Agent的功能差异与底层架构:Skill体系谁按下启动键、记忆系统谁在替谁记事、上下文管理的确定性优先哲学,以及两者背后的干预递减光谱与自动化控制权之争。
AI Agent
OpenClaw
Hermes
NousResearch
Skill系统
记忆系统
自进化
GitHub
开源
技术哲学
10个优秀的开源无头浏览器—自动化测试、爬虫、RPA 操作利器
综合
10个优秀的开源无头浏览器—自动化测试、爬虫、RPA 操作利器
2024-11-19 09:36:25 +0800 CST
view 2466
无头浏览器是一种没有图形用户界面的Web浏览器,能够在后台执行任务,广泛应用于自动化测试、网络爬虫和数据抓取。它通过编程接口支持控制,提升测试效率并节省资源。主流工具包括Puppeteer、Selenium、Playwright等,适合在CI/CD流程中使用,但可能无法完全模拟真实用户体验。
开源工具
自动化
Web技术
测试
爬虫
100多个基础常用JS函数和语法集合大全
编程
100多个基础常用JS函数和语法集合大全
2024-11-19 06:30:20 +0800 CST
view 3611
本文总结了JavaScript的基础知识,包括常用的输出语句、注释、DOM结构、表单操作、字符串处理、数学函数、日期处理等。内容涵盖了变量声明、条件判断、循环结构、函数定义等基本语法,适合初学者快速了解JavaScript的核心概念和常用功能。
编程
Web开发
JavaScript
前端技术
学习资源
综合
中后台开发神器!Cool-Admin-Midway 让你一分钟完成后台搭建!
2024-11-18 01:31:19 +0800 CST
view 2189
Cool-Admin-Midway是基于Midway.js的后台管理系统解决方案,旨在帮助开发者快速搭建企业级管理系统。它结合了Midway.js的强大架构和Cool-Admin的高效前端模板,支持用户管理、权限控制等功能,适用于电商和SaaS平台。该系统具有模块化设计、AI编码、跨平台兼容性等特点,能够满足复杂的业务需求。
后台开发
企业级应用
技术框架
管理系统
开发工具
综合
基于Webcodecs + Vue3实现的Web端剪辑工具
2024-11-19 10:07:35 +0800 CST
view 2250
这是一个基于WebCodecs实现的Web端视频编辑工具,功能类似于剪映Web版。该工具允许用户在线编辑视频,提供了便捷的编辑体验。开源地址为:https://github.com/x007xyz/fly-cut。
视频编辑
Web技术
开源工具
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
5
...
16
下一页