程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Anthropic 玻璃翼计划深度解析:当最锋利的矛变成最坚固的盾
编程
Anthropic 玻璃翼计划深度解析:当最锋利的矛变成最坚固的盾
2026-04-10 01:23:24 +0800 CST
view 610
2026年4月7日,Anthropic发布Claude Mythos Preview并联合12家科技巨头启动Project Glasswing安全计划。本文深度解析这一事件的技术细节、战略意图及对安全行业的深远影响。
AI安全
Anthropic
Claude Mythos
Project Glasswing
网络安全
漏洞挖掘
wasm-pack 1.0 深度解析:Rust WASM 端侧计算的内存管理与性能调优实战
编程
wasm-pack 1.0 深度解析:Rust WASM 端侧计算的内存管理与性能调优实战
2026-04-19 08:16:43 +0800 CST
view 491
深度解析 wasm-pack 1.0 发布后 Rust WASM 的内存管理与性能调优实战,涵盖零拷贝传递、内存泄漏防护、WebGPU 结合等技术要点。
WebAssembly
wasm-pack
Rust
性能优化
内存管理
WebGPU
前端架构
Google LangExtract 深度解析:从非结构化文本到结构化知识的工程化桥梁——零微调实现 100% 可溯源的信息提取
编程
Google LangExtract 深度解析:从非结构化文本到结构化知识的工程化桥梁——零微调实现 100% 可溯源的信息提取
2026-05-09 16:13:25 +0800 CST
view 384
2026年4月Google开源LangExtract,一个基于LLM的结构化信息提取框架。核心创新:字符级溯源(Source Grounding)实现100%可验证提取,零微调只需3-5个示例即可适配任何领域。本文深入解析其技术架构、长文档处理策略、医疗/法律/金融实战应用及生产部署最佳实践。
LangExtract
LLM
信息提取
结构化数据
医疗AI
RAG
Google开源
vLLM 2026 推理引擎全解:从 PagedAttention 到分离式 Prefill,如何把大模型跑出 GPU 极限性能
编程
vLLM 2026 推理引擎全解:从 PagedAttention 到分离式 Prefill,如何把大模型跑出 GPU 极限性能
2026-06-29 17:16:04 +0800 CST
view 118
2026年vLLM 0.18深度解析:PagedAttention显存管理、EAGLE3推测解码、连续批处理、分离式Prefill、FP4量化,附生产级部署代码与Benchmark对比
vLLM
LLM推理
PagedAttention
推测解码
EAGLE3
FP4量化
CUDA
GPU性能优化
Rust 1.96.0 深度解读:Copy Range 重塑 slice 操作范式,双 CVE 加固 Cargo 安全防线
编程
Rust 1.96.0 深度解读:Copy Range 重塑 slice 操作范式,双 CVE 加固 Cargo 安全防线
2026-06-16 13:49:17 +0800 CST
view 177
深度解读 Rust 1.96.0 核心变化:Copy Range 类型重塑 slice 操作范式、双 CVE 加固 Cargo 安全防线、WebAssembly linker breaking change,附完整迁移指南。
Rust
1.96
Range
CVE
Cargo
WebAssembly
RFC3550
安全漏洞
万字长文拆解 vLLM 0.18:PagedAttention 如何用操作系统思维颠覆大模型推理
编程
万字长文拆解 vLLM 0.18:PagedAttention 如何用操作系统思维颠覆大模型推理
2026-06-29 17:17:00 +0800 CST
view 95
2026年vLLM 0.18深度解析:PagedAttention显存管理、EAGLE3推测解码、连续批处理、分离式Prefill、FP4量化,附生产级部署代码与Benchmark对比
vLLM
LLM推理
PagedAttention
推测解码
EAGLE3
FP4量化
CUDA
GPU性能优化
编程
php 连接mssql数据库
2024-11-17 05:01:41 +0800 CST
view 2984
本文记录了如何与MSSQL数据库进行对接的步骤,包括下载MSSQL数据库扩展、配置php.ini文件以及重启服务器的操作。提供了相关链接和案例,帮助用户顺利完成数据库连接和操作。
数据库
编程
PHP
MSSQL
开发
HunyuanVideo 1.5 深度解析:腾讯 8.3B 参数视频生成模型,消费级显卡的革命性突破
编程
HunyuanVideo 1.5 深度解析:腾讯 8.3B 参数视频生成模型,消费级显卡的革命性突破
2026-05-09 18:51:15 +0800 CST
view 410
腾讯混元开源 HunyuanVideo 1.5 视频生成模型,8.3B 参数 Diffusion Transformer 架构,14G 显存消费级显卡可运行。SSTA 稀疏注意力机制实现推理速度 1.87 倍提升,3D 因果 VAE 实现空间 16 倍、时间 4 倍压缩。
AI视频生成
腾讯混元
HunyuanVideo
Diffusion Transformer
SSTA
开源模型
消费级显卡
Rust vs JavaScript: 使用 WebAssembly 提升 66% 的性能
编程
Rust vs JavaScript: 使用 WebAssembly 提升 66% 的性能
2024-11-19 04:18:48 +0800 CST
view 1897
本文探讨如何通过WebAssembly在JavaScript应用中提升性能,以斐波那契算法为例。介绍了JavaScript的单线程问题及其对用户体验的影响,展示了如何使用WebWorker和WebAssembly进行多线程计算。通过Rust和AssemblyScript编写的WebAssembly模块,性能分别提升了66%和53%。总结指出WebAssembly是高性能计算的有效优化手段。
编程
性能优化
Web开发
前端技术
WebAssembly
WebAssembly 2.0 深度实战:当「浏览器虚拟机」进化为「全栈运行时」——从 GC 原语到 WASI Preview2 生产级完全指南(2026)
编程
WebAssembly 2.0 深度实战:当「浏览器虚拟机」进化为「全栈运行时」——从 GC 原语到 WASI Preview2 生产级完全指南(2026)
2026-06-10 21:18:02 +0800 CST
view 270
2026年WebAssembly 2.0标准正式落地,从浏览器性能优化工具彻底蜕变为通用跨平台运行时。本文深入解析GC原语、SIMD增强、WASI Preview2、Component Model四大核心特性,配以完整代码示例和生产级部署指南。
WebAssembly,Rust,Go,AI推理,Wasmtime,WASI,后端,跨平台
🚀纯CSS实现3D翻书特效!无JavaScript也能玩出花
代码
🚀纯CSS实现3D翻书特效!无JavaScript也能玩出花
2025-05-15 10:22:08 +0800 CST
view 1562
本文介绍了一种纯CSS实现的3D翻书特效,展示了如何通过CSS的高级特性如transform-style、perspective和transition等,创建逼真的翻页效果。该特效无需JavaScript,提供了优秀的交互体验,适合练习CSS3变换与3D动画。文中还提供了完整的HTML源码,便于读者直接使用和修改。
前端开发
CSS
动画效果
网页设计
用户体验
Claude Memory Compiler 深度解析:当 AI 编程助手第一次拥有「编译器思维」的记忆系统
编程
Claude Memory Compiler 深度解析:当 AI 编程助手第一次拥有「编译器思维」的记忆系统
2026-04-10 03:35:31 +0800 CST
view 684
claude-memory-compiler 把 AI 对话当作源代码,用 LLM 编译成结构化知识库,让 Claude Code 拥有跨会话记忆能力
Claude Code
AI Agent
Knowledge Management
LLM
Memory System
编程
CSS中实现从左下角到右上角的渐变效果
2024-11-19 02:17:33 +0800 CST
view 1816
本文详细介绍了如何在CSS中实现从左下角到右上角的渐变效果。通过使用`linear-gradient`函数,可以指定渐变的方向和颜色过渡。示例中展示了两种颜色渐变、使用角度定义渐变以及添加多个颜色停止点来创建复杂的渐变效果。总结了方向渐变、颜色控制和多颜色渐变的实现方法,帮助读者更好地理解和应用CSS渐变。
前端开发
CSS
网页设计
Docker 27「Orion」深度解析:原生 AI 调度时代来临——GPU 拓扑感知、NUMA 绑定与容器化大模型部署新范式
编程
Docker 27「Orion」深度解析:原生 AI 调度时代来临——GPU 拓扑感知、NUMA 绑定与容器化大模型部署新范式
2026-05-10 00:41:20 +0800 CST
view 364
Docker 27 Orion深度解析:GPU拓扑感知调度与PCIe/NVLink自动绑定、NUMA内存带宽限制、dockerd-scheduler AI调度代理、docker ai run零配置LLM部署、Dockerfile.ai模型封装语法、OOM Killer五步防御、cgroups v2集成与生产环境避坑指南
Docker
容器化
GPU调度
NUMA
AI推理
LLM
docker-compose
cgroups
Dockerfile
NVIDIA
如何实现元素的拖动功能,包括简单元素的拖动、列表项的拖动以及表格列和行的拖动
编程
如何实现元素的拖动功能,包括简单元素的拖动、列表项的拖动以及表格列和行的拖动
2024-11-18 15:30:45 +0800 CST
view 1560
本文介绍了如何实现元素的拖动功能,包括简单元素的拖动、列表项的拖动以及表格列和行的拖动。通过处理鼠标的mousedown、mousemove和mouseup事件,结合动态DOM操作,读者可以掌握拖动效果的实现技巧,提升用户体验。文中提供了详细的HTML和JavaScript代码示例,帮助读者理解拖动功能的核心逻辑和实现方法。
前端开发
用户交互
JavaScript
DOM操作
CSS
50 个实用前端 JavaScript/CSS 代码片段
代码
50 个实用前端 JavaScript/CSS 代码片段
2025-05-21 09:53:05 +0800 CST
view 1576
本文整理了50个实用的JavaScript和CSS代码片段,涵盖设备判断、事件监听、DOM操作、数据处理等多个方面,旨在提高前端开发的效率。每个代码片段都提供了具体的实现方式,适合开发者在日常工作中参考和使用。
前端开发
JavaScript
CSS
代码片段
实用工具
Google I/O 2026 深度解析:Gemini 3.5 Flash 如何以 4 倍速度颠覆 AI 编程——从基准测试到生产级 Agent 开发完全指南
编程
Google I/O 2026 深度解析:Gemini 3.5 Flash 如何以 4 倍速度颠覆 AI 编程——从基准测试到生产级 Agent 开发完全指南
2026-05-23 01:16:34 +0800 CST
view 397
2026年Google I/O大会深度解析:Gemini 3.5 Flash以289 tokens/s的输出速度4倍碾压竞品,从基准测试、技术架构到生产级Agent开发实战,全面解读谷歌Agentic AI战略。
Google I/O 2026
Gemini 3.5 Flash
AI编程
Agent开发
基准测试
oMLX 深度实战:当 Apple Silicon 遇见本地大模型推理——从 MTP 加速到分层 KV 缓存的生产级完全指南(2026)
编程
oMLX 深度实战:当 Apple Silicon 遇见本地大模型推理——从 MTP 加速到分层 KV 缓存的生产级完全指南(2026)
2026-06-16 16:46:05 +0800 CST
view 321
深度解析 2026 年 Apple Silicon 本地大模型推理技术栈:从 llama.cpp 量化体系到 oMLX 分层 KV 缓存架构,从 MTP 加速到 CoreAI 全栈指南,包含实测 Benchmark 与生产级部署方案。
Apple Silicon
MLX
llama.cpp
oMLX
MTP
本地大模型
量化
本地推理
NVIDIA PersonaPlex 全双工语音 AI 深度解析:从 Moshi 架构到实时对话的工程实践
编程
NVIDIA PersonaPlex 全双工语音 AI 深度解析:从 Moshi 架构到实时对话的工程实践
2026-04-19 14:16:23 +0800 CST
view 669
深度解析 NVIDIA PersonaPlex:基于 Moshi 架构的 7B 参数全双工语音 AI 模型,170ms 打断延迟,MIT 商用许可,从架构原理到代码实战的完整技术指南。
NVIDIA
PersonaPlex
全双工语音
Moshi
Kyutai
AI语音
实时对话
语音AI
Redis之父antirez亲自下场!为DeepSeek V4 Flash打造专属推理引擎,Mac上跑出468 token/s
案例
Redis之父antirez亲自下场!为DeepSeek V4 Flash打造专属推理引擎,Mac上跑出468 token/s
2026-05-10 08:40:22 +0800 CST
view 641
Redis之父antirez亲自下场!为DeepSeek V4 Flash打造专属推理引擎ds4.c,C+Metal从头编写,Mac Studio M3 Ultra上预填充468 token/s。关键优化:非对称量化(MoE专家层2-bit)、KV缓存搬硬盘、内置OpenAI/Anthropic双API。128GB Mac可跑,专为coding agent优化。
DeepSeek
AI推理
Mac
Redis
antirez
Metal
本地推理
MoE
GGUF
C语言
Apple Silicon
Claude Code
OpenAI API
Anthropic API
我把 Claude Code 变成了专属运维工程师:MCP + Skills 实战全记录
案例
我把 Claude Code 变成了专属运维工程师:MCP + Skills 实战全记录
2026-05-10 08:41:57 +0800 CST
view 449
通过 MCP + Skills 把 Claude Code 变成专属运维工程师。核心工具:mcp-ssh-manager(SSH操作)、vps-setup Skill(服务器初始化)。一句话完成 VPS 优化、项目部署、监控、Cloudflare 配置。安全边界设计:低权限账号、敏感操作人工审核、Zone-level 权限。
Claude Code
MCP
Skills
运维
SRE
SSH
Docker
Nginx
Cloudflare
AI运维
自动化
DiffusionGemma 深度实战:当 Google 用「扩散」颠覆自回归——从离散文本扩散原理到 MoE 架构、本地推理加速与生产级部署的完全指南(2026)
编程
DiffusionGemma 深度实战:当 Google 用「扩散」颠覆自回归——从离散文本扩散原理到 MoE 架构、本地推理加速与生产级部署的完全指南(2026)
2026-06-16 18:52:52 +0800 CST
view 293
Google DeepMind联合NVIDIA发布DiffusionGemma——基于离散文本扩散的实验性开源模型。本文深入解读26B MoE架构、双向注意力机制、本地推理4倍加速原理,附完整代码示例和部署实战。
Google
DiffusionGemma
扩散模型
MoE
开源LLM
本地推理
AI推理加速
Gemma 4 架构解密:MoE 路由 × GQA 注意力 × Thinking Mode——31B 如何击败 20 倍参数对手
编程
Gemma 4 架构解密:MoE 路由 × GQA 注意力 × Thinking Mode——31B 如何击败 20 倍参数对手
2026-04-19 17:47:49 +0800 CST
view 577
深入解析 Google Gemma 4 的核心技术架构:MoE 稀疏专家路由、GQA 分组查询注意力、PLE 逐层嵌入、Thinking Mode 推理机制,详解 31B 模型如何以小博大击败 20 倍参数对手,附全场景部署实战代码。
Gemma
Google
AI
开源大模型
MoE
GQA
Transformer
深度学习
模型架构
狂揽50000 Star!谷歌开源Agent Skills:让AI从只会写代码进化成懂工程有纪律的靠谱队友
编程
狂揽50000 Star!谷歌开源Agent Skills:让AI从只会写代码进化成懂工程有纪律的靠谱队友
2026-06-16 19:45:38 +0800 CST
view 204
Google开源Agent Skills(50000+ Star):把《Software Engineering at Google》方法论拆解成20+独立Skill,/spec需求定义+/plan任务拆解+/ship三Agent并行评审,让AI从只会写代码进化成懂工程有纪律的靠谱队友。
Agent Skills
Google
AI编程
软件工程
Claude Code
Cursor
开源
Code Review
测试覆盖
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
16
17
18
19
20
...
46
下一页