程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Helidon 4.4 深度解析:当 Oracle 把 LangChain4j AI Agent 能力直接内建进 Java 微服务框架
编程
Helidon 4.4 深度解析:当 Oracle 把 LangChain4j AI Agent 能力直接内建进 Java 微服务框架
2026-04-11 11:26:05 +0800 CST
view 632
2026年4月Oracle发布Helidon 4.4,原生集成LangChain4j AI Agent能力。本文深度解析这一重磅更新,从架构演进、代码实战到性能优化,全面展示Java微服务框架如何拥抱AI Agent时代。
Java
Helidon
LangChain4j
AI Agent
微服务
CloakBrowser:4.3k Stars!开源浏览器反检测终极解决方案
案例
CloakBrowser:4.3k Stars!开源浏览器反检测终极解决方案
2026-05-11 08:20:25 +0800 CST
view 468
4300+ Stars 的开源项目 CloakBrowser,可能是目前最接近完美伪装的浏览器解决方案。通过 49 个 C++ 源码级补丁,从 Chromium 层面修改浏览器指纹,绕过 reCAPTCHA、Cloudflare、FingerprintJS 等反爬虫检测。仅需 3 行代码即可替换 Playwright。
CloakBrowser
反爬虫
浏览器指纹
绕过检测
Playwright
Chromium
WebRTC
CloakBrowser深度解析:源代码级指纹修补如何让AI爬虫彻底绕过所有Bot检测
编程
CloakBrowser深度解析:源代码级指纹修补如何让AI爬虫彻底绕过所有Bot检测
2026-05-17 02:15:27 +0800 CST
view 435
深入解析CloakBrowser如何通过源代码级修改彻底解决浏览器Bot检测问题,涵盖Navigator/WebGL/Canvas指纹修补、Playwright兼容接口、实测30/30检测点全通过的技术内幕。
爬虫
Bot检测
Chromium
浏览器指纹
反爬虫
TriAttention深度解析:用三角函数革命性压缩KV Cache,让长推理从「显存地狱」中脱困
编程
TriAttention深度解析:用三角函数革命性压缩KV Cache,让长推理从「显存地狱」中脱困
2026-05-17 04:14:18 +0800 CST
view 223
深入解析MIT韩松团队提出的TriAttention方法,利用Pre-RoPE空间Q/K集中性和三角函数级数实现革命性的KV Cache压缩,在AIME25上以3072 KV budget达到与Full Attention持平的40.8%准确率,同时实现10.7倍KV显存压缩和2.5-6.3倍吞吐量提升。
LLM
KV Cache
TriAttention
MIT
英伟达
浙大
长推理
KV压缩
三角函数
RoPE
Attention优化
vLLM 深度实战:从 PagedAttention 到 Speculative Decoding——2026年大模型推理引擎内核架构完全指南
编程
vLLM 深度实战:从 PagedAttention 到 Speculative Decoding——2026年大模型推理引擎内核架构完全指南
2026-05-23 18:44:14 +0800 CST
view 244
2026年深度长文,从PagedAttention分页思想、Continuous Batching调度算法、Speculative Decoding并行验证机制到CUDA Kernel底层实现,全面拆解vLLM推理引擎内核架构,附生产级部署实战与框架横向对比。
vLLM
PagedAttention
Continuous Batching
Speculative Decoding
GPU推理
大模型部署
深度学习
CUDA
【重制版】TriAttention深度解析:三角函数如何让长推理从显存地狱中脱困
编程
【重制版】TriAttention深度解析:三角函数如何让长推理从显存地狱中脱困
2026-05-17 04:14:33 +0800 CST
view 205
深入解析MIT韩松团队提出的TriAttention方法,利用Pre-RoPE空间Q/K集中性和三角函数级数实现革命性的KV Cache压缩,在AIME25上以3072 KV budget达到与Full Attention持平的40.8%准确率,同时实现10.7倍KV显存压缩和2.5-6.3倍吞吐量提升。
LLM
KV Cache
TriAttention
MIT
英伟达
浙大
长推理
KV压缩
三角函数
RoPE
Attention优化
CC Switch:45K Star 的 AI 大模型万能遥控器,让 100+模型说同一种语言
案例
CC Switch:45K Star 的 AI 大模型万能遥控器,让 100+模型说同一种语言
2026-05-01 15:33:28 +0800 CST
view 1032
GitHub 45K+ Star 的 CC Switch 是什么?详解这款大模型万能遥控器的核心功能、与 One API 的区别、以及如何配合 OpenClaw 使用。
CC Switch
AI工具
大模型
OpenClaw
Claude Code
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
编程
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
2026-05-11 10:53:54 +0800 CST
view 295
DeepSeek-V4-Pro 以 1.6T 总参数、49B 激活参数的 MoE 架构,原生支持 100 万 token 上下文,同时将推理算力降至 V3.2 的 27%、KV Cache 降至 10%。本文深度解析 CSA/HCA 混合注意力机制、mHC 流形约束超连接、KV Cache 极致优化、Muon 优化器等核心技术创新,以及如何在 Ollama、vLLM、官方 API 三种方式下部署运行。
DeepSeek-V4,MoE架构,CSA注意力,HCA注意力,KV Cache,1M上下文,长文本推理,开源大模型
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
编程
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
2026-05-17 10:21:56 +0800 CST
view 298
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
编程
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
2026-05-17 10:22:13 +0800 CST
view 257
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
Apache Doris 4.1 深度拆解:当实时数仓长出 AI 大脑——从向量检索到统一数据底座的全链路技术实战
编程
Apache Doris 4.1 深度拆解:当实时数仓长出 AI 大脑——从向量检索到统一数据底座的全链路技术实战
2026-05-02 10:33:28 +0800 CST
view 309
深入拆解Apache Doris 4.1的技术内核:从FE/BE架构到存算分离、从原生向量检索到混合搜索、从RAG实战到生产部署,全方位解析实时数仓如何演化为AI时代统一数据底座
Apache Doris
向量检索
实时数仓
RAG
存算分离
OLAP
AI数据库
Kimi K2.6 开源了!还附送了 300 个 Agent 员工?
编程
Kimi K2.6 开源了!还附送了 300 个 Agent 员工?
2026-04-21 07:57:28 +0800 CST
view 444
Kimi K2.6开源发布,SWE-Bench Pro 58.6分超越GPT-5.4和Claude Opus 4.6,300个子Agent并行4000步骤持续5天
Kimi
开源
AI编程
Agent
月之暗面
SWE-Bench
大模型
PostgreSQL:从关系数据库到万能数据平台——扩展生态如何让 PG 吞掉一切场景
编程
PostgreSQL:从关系数据库到万能数据平台——扩展生态如何让 PG 吞掉一切场景
2026-04-21 08:50:25 +0800 CST
view 316
深度解析 PostgreSQL 如何通过六大扩展覆盖向量搜索、HTAP、时序、地理空间、图数据库、消息队列全场景,含完整代码实战与性能优化方案
PostgreSQL
pgvector
pgvectorscale
pg_duckpipe
TimescaleDB
PostGIS
Apache AGE
pgmq
数据库
扩展
告别"辅助驾驶":GPT-5-Codex如何用动态思考重新定义AI编程
编程
告别"辅助驾驶":GPT-5-Codex如何用动态思考重新定义AI编程
2026-05-11 19:45:54 +0800 CST
view 284
GPT-5-Codex突破性引入Dynamic Thinking机制,简单任务节省93.7%token,复杂任务可自主工作7小时以上。深度解析核心技术架构与SWE-Bench表现,及其对开发者工作方式的根本性改变。
GPT-5-Codex
OpenAI
AI编程
Dynamic Thinking
Codex
SWE-Bench
自主编程
Agent
AI Scientist-v2 深度解析:当人工智能学会「从零开始做科研」——Agentic Tree Search 如何改写科学发现的游戏规则
编程
AI Scientist-v2 深度解析:当人工智能学会「从零开始做科研」——Agentic Tree Search 如何改写科学发现的游戏规则
2026-04-12 15:55:06 +0800 CST
view 632
AI Scientist-v2 由 Sakana AI 联合牛津大学等机构研发,于 2026 年正式发表于 Nature,首次实现端到端科研自动化。其核心创新 Agentic Tree Search 让 AI 在 ML 领域生成论文通过 ICLR Workshop 双盲评审,获 6.33 分高于 55% 人类投稿。本文全面解析其系统架构、核心算法与未来方向。
AI Scientist
Sakana AI
Agentic Tree Search
科研自动化
AI Agent
LLM
Nature
开源Chrome插件一键扒光网站设计:自动提取配色/字体/间距,生成AI可读的SKILL.md
编程
开源Chrome插件一键扒光网站设计:自动提取配色/字体/间距,生成AI可读的SKILL.md
2026-04-21 09:02:26 +0800 CST
view 353
design-md-chrome:Chrome插件一键提取网站设计规范(字体/配色/间距/阴影/动画),生成DESIGN.md或SKILL.md喂给Claude Code/Cursor复刻
开源
Chrome插件
设计工具
AI编程
前端
设计系统
Claude Code
Cursor
Archon 深度解析:当 AI 编码进入「工程化 Harness」时代——首个开源工作流引擎如何让 AI 编程从玄学变科学
编程
Archon 深度解析:当 AI 编码进入「工程化 Harness」时代——首个开源工作流引擎如何让 AI 编程从玄学变科学
2026-04-12 18:54:54 +0800 CST
view 351
Archon 是 GitHub 本周 16.7k 星的热门项目,首个开源 AI 编码 Harness 构建器。本文深度解析其设计理念、架构实现、核心特性,以及如何用 YAML 工作流让 AI 编程从玄学变科学。
AI编程
Archon
Claude Code
工作流引擎
编程工具
YAML
OpenSSL 4.0 深度解析:ECH 加密握手与后量子密码学的双重革命
编程
OpenSSL 4.0 深度解析:ECH 加密握手与后量子密码学的双重革命
2026-05-12 01:18:07 +0800 CST
view 290
深度解析OpenSSL4.0三大核心升级:ECH加密整个TLS握手消除SNI隐私泄露、ML-DSA-MU与RFC8998后量子国密混合算法套件实现量子安全、cSHAKE可定制哈希函数防止重放攻击,附完整C/Python/Go多语言迁移实战与ECH部署指南
OpenSSL,TLS,ECH,后量子密码学,ML-DSA-MU,RFC8998,SM2,SM3,SM4,cSHAKE,隐私保护,国密算法,迁移指南
CSS 2026 新特性深度解析:从锚点定位到瀑布流布局,前端开发迎来纯 CSS 解决方案时代
编程
CSS 2026 新特性深度解析:从锚点定位到瀑布流布局,前端开发迎来纯 CSS 解决方案时代
2026-04-21 10:51:18 +0800 CST
view 412
深度解析 CSS 2026 核心新特性:锚点定位彻底替代 Popper.js、原生瀑布流布局告别 JavaScript 库、滚动驱动动画实现零 JS 滚动效果。包含完整代码示例、性能对比和浏览器兼容性方案。
CSS
前端
Web开发
Anchor Positioning
Masonry
Scroll Animation
Ruflo 深度解析:39K Star 的 AI Agent 编排平台,如何用 Rust + WASM 重塑多智能体协作的工程范式
编程
Ruflo 深度解析:39K Star 的 AI Agent 编排平台,如何用 Rust + WASM 重塑多智能体协作的工程范式
2026-05-04 16:23:37 +0800 CST
view 499
深度解析 Ruflo Agent 编排平台:100+专业化Agent、SONA自学习神经网络、HNSW向量记忆、Swarm群体协调、零信任联邦协作。从架构设计到代码实战,全面剖析多智能体协作的工程范式。
AI Agent
Rust
WASM
Multi-Agent
Architecture
Ruflo 深度解析:39K Star 的 AI Agent 编排平台如何重塑多智能体协作
编程
Ruflo 深度解析:39K Star 的 AI Agent 编排平台如何重塑多智能体协作
2026-05-04 16:23:56 +0800 CST
view 639
深度解析 Ruflo Agent 编排平台:100+专业化Agent、SONA自学习神经网络、HNSW向量记忆、Swarm群体协调、零信任联邦协作。从架构设计到代码实战,全面剖析多智能体协作的工程范式。
AI Agent
Rust
WASM
Multi-Agent
Architecture
向量数据库终极选型指南(2026版):Qdrant、Milvus、Pgvector、Chroma 深度对比与架构解析
编程
向量数据库终极选型指南(2026版):Qdrant、Milvus、Pgvector、Chroma 深度对比与架构解析
2026-05-18 05:44:15 +0800 CST
view 654
深度对比2026年最主流的四大向量数据库:Qdrant、Milvus、Pgvector、Chroma,从架构设计、索引算法、性能基准到生产实践,帮你做出不后悔的技术决策。
向量数据库
Qdrant
Milvus
Pgvector
Chroma
Archon 深度解析:AI 编程的「Harness 工程」革命——当编码智能体从「随缘执行」到「工业化交付」
编程
Archon 深度解析:AI 编程的「Harness 工程」革命——当编码智能体从「随缘执行」到「工业化交付」
2026-04-13 11:53:10 +0800 CST
view 757
Archon是2026年GitHub最火的开源项目之一,首个AI编程Harness构建器。本文深度解析其设计哲学、架构实现和工程实践。
AI编程
Archon
Harness Engineering
Claude Code
GitHub
开源项目
WeChatFerry 聊天 MCP 工具:让 AI 直接操控微信
编程
WeChatFerry 聊天 MCP 工具:让 AI 直接操控微信
2026-05-12 12:18:09 +0800 CST
view 284
基于WeChatFerry的聊天MCP工具,通过标准MCP协议让AI编程工具直接操控微信:发消息、管群聊、查通讯录、接收转账。支持Claude Code/Codex/VSCode等客户端,Go语言开发,仅Windows。
WeChatFerry
MCP
微信
Claude Code
Codex
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
5
6
7
8
9
...
22
下一页