程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Google LangExtract 深度解析:从非结构化文本到结构化知识的工程化桥梁——零微调实现 100% 可溯源的信息提取
编程
Google LangExtract 深度解析:从非结构化文本到结构化知识的工程化桥梁——零微调实现 100% 可溯源的信息提取
2026-05-09 16:13:25 +0800 CST
view 305
2026年4月Google开源LangExtract,一个基于LLM的结构化信息提取框架。核心创新:字符级溯源(Source Grounding)实现100%可验证提取,零微调只需3-5个示例即可适配任何领域。本文深入解析其技术架构、长文档处理策略、医疗/法律/金融实战应用及生产部署最佳实践。
LangExtract
LLM
信息提取
结构化数据
医疗AI
RAG
Google开源
Rust 1.95.0 深度解析:cfg_select! 宏与编译器优化的实战指南
编程
Rust 1.95.0 深度解析:cfg_select! 宏与编译器优化的实战指南
2026-04-29 10:11:38 +0800 CST
view 394
2026年4月Rust 1.95.0正式发布,cfg_select!宏正式稳定、match表达式支持if let guards、编译器优化全面升级。本文从实战角度深入解析新特性,助你全面掌握Rust最新版本。
Rust
Rust1.95
cfg_select
编译器优化
编程语言
Claude Memory Compiler 深度解析:当 AI 编程助手第一次拥有「编译器思维」的记忆系统
编程
Claude Memory Compiler 深度解析:当 AI 编程助手第一次拥有「编译器思维」的记忆系统
2026-04-10 03:35:31 +0800 CST
view 590
claude-memory-compiler 把 AI 对话当作源代码,用 LLM 编译成结构化知识库,让 Claude Code 拥有跨会话记忆能力
Claude Code
AI Agent
Knowledge Management
LLM
Memory System
Docker 27「Orion」深度解析:原生 AI 调度时代来临——GPU 拓扑感知、NUMA 绑定与容器化大模型部署新范式
编程
Docker 27「Orion」深度解析:原生 AI 调度时代来临——GPU 拓扑感知、NUMA 绑定与容器化大模型部署新范式
2026-05-10 00:41:20 +0800 CST
view 286
Docker 27 Orion深度解析:GPU拓扑感知调度与PCIe/NVLink自动绑定、NUMA内存带宽限制、dockerd-scheduler AI调度代理、docker ai run零配置LLM部署、Dockerfile.ai模型封装语法、OOM Killer五步防御、cgroups v2集成与生产环境避坑指南
Docker
容器化
GPU调度
NUMA
AI推理
LLM
docker-compose
cgroups
Dockerfile
NVIDIA
Google I/O 2026 深度解析:Gemini 3.5 Flash 如何以 4 倍速度颠覆 AI 编程——从基准测试到生产级 Agent 开发完全指南
编程
Google I/O 2026 深度解析:Gemini 3.5 Flash 如何以 4 倍速度颠覆 AI 编程——从基准测试到生产级 Agent 开发完全指南
2026-05-23 01:16:34 +0800 CST
view 302
2026年Google I/O大会深度解析:Gemini 3.5 Flash以289 tokens/s的输出速度4倍碾压竞品,从基准测试、技术架构到生产级Agent开发实战,全面解读谷歌Agentic AI战略。
Google I/O 2026
Gemini 3.5 Flash
AI编程
Agent开发
基准测试
oMLX 深度实战:当 Apple Silicon 遇见本地大模型推理——从 MTP 加速到分层 KV 缓存的生产级完全指南(2026)
编程
oMLX 深度实战:当 Apple Silicon 遇见本地大模型推理——从 MTP 加速到分层 KV 缓存的生产级完全指南(2026)
2026-06-16 16:46:05 +0800 CST
view 169
深度解析 2026 年 Apple Silicon 本地大模型推理技术栈:从 llama.cpp 量化体系到 oMLX 分层 KV 缓存架构,从 MTP 加速到 CoreAI 全栈指南,包含实测 Benchmark 与生产级部署方案。
Apple Silicon
MLX
llama.cpp
oMLX
MTP
本地大模型
量化
本地推理
NVIDIA PersonaPlex 全双工语音 AI 深度解析:从 Moshi 架构到实时对话的工程实践
编程
NVIDIA PersonaPlex 全双工语音 AI 深度解析:从 Moshi 架构到实时对话的工程实践
2026-04-19 14:16:23 +0800 CST
view 582
深度解析 NVIDIA PersonaPlex:基于 Moshi 架构的 7B 参数全双工语音 AI 模型,170ms 打断延迟,MIT 商用许可,从架构原理到代码实战的完整技术指南。
NVIDIA
PersonaPlex
全双工语音
Moshi
Kyutai
AI语音
实时对话
语音AI
Redis之父antirez亲自下场!为DeepSeek V4 Flash打造专属推理引擎,Mac上跑出468 token/s
案例
Redis之父antirez亲自下场!为DeepSeek V4 Flash打造专属推理引擎,Mac上跑出468 token/s
2026-05-10 08:40:22 +0800 CST
view 562
Redis之父antirez亲自下场!为DeepSeek V4 Flash打造专属推理引擎ds4.c,C+Metal从头编写,Mac Studio M3 Ultra上预填充468 token/s。关键优化:非对称量化(MoE专家层2-bit)、KV缓存搬硬盘、内置OpenAI/Anthropic双API。128GB Mac可跑,专为coding agent优化。
DeepSeek
AI推理
Mac
Redis
antirez
Metal
本地推理
MoE
GGUF
C语言
Apple Silicon
Claude Code
OpenAI API
Anthropic API
DiffusionGemma 深度实战:当 Google 用「扩散」颠覆自回归——从离散文本扩散原理到 MoE 架构、本地推理加速与生产级部署的完全指南(2026)
编程
DiffusionGemma 深度实战:当 Google 用「扩散」颠覆自回归——从离散文本扩散原理到 MoE 架构、本地推理加速与生产级部署的完全指南(2026)
2026-06-16 18:52:52 +0800 CST
view 149
Google DeepMind联合NVIDIA发布DiffusionGemma——基于离散文本扩散的实验性开源模型。本文深入解读26B MoE架构、双向注意力机制、本地推理4倍加速原理,附完整代码示例和部署实战。
Google
DiffusionGemma
扩散模型
MoE
开源LLM
本地推理
AI推理加速
Gemma 4 架构解密:MoE 路由 × GQA 注意力 × Thinking Mode——31B 如何击败 20 倍参数对手
编程
Gemma 4 架构解密:MoE 路由 × GQA 注意力 × Thinking Mode——31B 如何击败 20 倍参数对手
2026-04-19 17:47:49 +0800 CST
view 475
深入解析 Google Gemma 4 的核心技术架构:MoE 稀疏专家路由、GQA 分组查询注意力、PLE 逐层嵌入、Thinking Mode 推理机制,详解 31B 模型如何以小博大击败 20 倍参数对手,附全场景部署实战代码。
Gemma
Google
AI
开源大模型
MoE
GQA
Transformer
深度学习
模型架构
狂揽50000 Star!谷歌开源Agent Skills:让AI从只会写代码进化成懂工程有纪律的靠谱队友
编程
狂揽50000 Star!谷歌开源Agent Skills:让AI从只会写代码进化成懂工程有纪律的靠谱队友
2026-06-16 19:45:38 +0800 CST
view 110
Google开源Agent Skills(50000+ Star):把《Software Engineering at Google》方法论拆解成20+独立Skill,/spec需求定义+/plan任务拆解+/ship三Agent并行评审,让AI从只会写代码进化成懂工程有纪律的靠谱队友。
Agent Skills
Google
AI编程
软件工程
Claude Code
Cursor
开源
Code Review
测试覆盖
LiteRT-LM:Google端侧大模型推理引擎的革命性架构——从TensorFlow Lite的困境到LLM原生推理的全链路解析
编程
LiteRT-LM:Google端侧大模型推理引擎的革命性架构——从TensorFlow Lite的困境到LLM原生推理的全链路解析
2026-04-19 22:17:39 +0800 CST
view 663
深入解析Google LiteRT-LM端侧LLM推理引擎的核心架构:分层内存池、KV Cache量化、算子融合、WebGPU运行时。与TensorFlow Lite、llama.cpp、MLX横向对比,提供生产级部署实战指南。
Google
端侧AI
LiteRT-LM
WebGPU
量化
KV Cache
TensorFlow Lite
LLM推理
当 Apple Silicon 遇上视觉大模型:MLX-VLM 如何把「本地多模态推理」变成现实
编程
当 Apple Silicon 遇上视觉大模型:MLX-VLM 如何把「本地多模态推理」变成现实
2026-04-11 10:24:48 +0800 CST
view 677
深度解析 Apple Silicon 上的视觉语言模型推理引擎 MLX-VLM,涵盖架构设计、模型支持、性能优化与实战部署。
Apple Silicon
MLX
视觉语言模型
VLM
Mac本地AI
多模态推理
OpenTelemetry 深度解析:可观测性终极标准如何重塑云原生监控——从三大支柱到 AI 根因分析的全链路实战
编程
OpenTelemetry 深度解析:可观测性终极标准如何重塑云原生监控——从三大支柱到 AI 根因分析的全链路实战
2026-05-11 05:48:38 +0800 CST
view 392
OpenTelemetry深度解析:可观测性终极标准如何重塑云原生监控,从Traces/Metrics/Logs三大支柱到AI根因分析的全链路实战
OpenTelemetry,可观测性,分布式追踪,Metrics,Logs,OTLP,云原生
Flutter 2026 深度解析:Impeller 接管 Android、Wasm 颠覆 Web 端——跨平台框架的底层革命
编程
Flutter 2026 深度解析:Impeller 接管 Android、Wasm 颠覆 Web 端——跨平台框架的底层革命
2026-05-11 07:21:12 +0800 CST
view 474
Flutter 2026深度解析:Impeller渲染引擎全面接管Android解决卡顿,Wasm成为Web默认实现原生性能,AI原生架构重塑跨平台开发
Flutter
Impeller
Wasm
跨平台
渲染引擎
AI原生
Wails:Go 版 Electron,打包体积直接缩小 10 倍!
编程
Wails:Go 版 Electron,打包体积直接缩小 10 倍!
2026-06-11 11:57:18 +0800 CST
view 164
Wails是Go语言写的跨平台桌面应用框架,GitHub 34.7K Stars,打包体积10-20MB(Electron的1/10)。Go后端+任意前端+系统原生WebView,Go方法直接当JS函数调用,支持热重载和v3跨平台编译。
Wails
Go桌面应用
Electron替代
Tauri对比
跨平台桌面
WebView
前端开发
Golang
谷歌 I/O 2026 全景深度解析:从 Gemini 3.5 Flash 到 Antigravity 2.0,从 93 个 Agent 造 OS 到 Spark 全天候个人助手——一场重新定义开发者工作流的架构革命
编程
谷歌 I/O 2026 全景深度解析:从 Gemini 3.5 Flash 到 Antigravity 2.0,从 93 个 Agent 造 OS 到 Spark 全天候个人助手——一场重新定义开发者工作流的架构革命
2026-06-17 06:29:30 +0800 CST
view 95
从 Gemini 3.5 Flash 的 289 tokens/秒到 Antigravity 2.0 的 93 个 Agent 造 OS,从 Spark 的 7×24 小时自主运转到 Omni 的任意输入直出视频——谷歌 I/O 2026 全景技术深度解析
Google I/O 2026
Gemini 3.5 Flash
Antigravity 2.0
AI Agent
Gemini Spark
Gemini Omni
Agent-fox 深度解析:让AI用自然语言接管你的测试——从Selenium尸骸中诞生的下一代自动化测试框架
编程
Agent-fox 深度解析:让AI用自然语言接管你的测试——从Selenium尸骸中诞生的下一代自动化测试框架
2026-05-17 01:50:10 +0800 CST
view 259
Agent-fox是一个基于AI Agent的自动化测试框架,让测试从编写代码变成描述意图,支持自然语言测试、自动元素定位、自愈机制等核心功能。
Agent-fox,AI测试,自动化测试,Selenium,Playwright,ReAct,LLM
agents-cli:谷歌开源 AI Agent 全流程开发工具,从搭建到部署一键搞定
案例
agents-cli:谷歌开源 AI Agent 全流程开发工具,从搭建到部署一键搞定
2026-05-11 08:01:29 +0800 CST
view 326
谷歌云官方开源的 agents-cli 工具,专为简化 AI 智能体开发生命周期设计。支持 Gemini CLI、Claude Code、Codex、Cursor 等主流编程助手,内置七大技能包覆盖构建-评估-部署全流程,支持本地模拟评估、自动化部署到 Cloud Run/GKE、Gemini Enterprise 注册。
Google
agents-cli
AI Agent
CLI
部署
评估
ADK
Cloud Run
Agent-fox深度解析:AI接管自动化测试的革命——ReAct模式下的自愈测试框架
编程
Agent-fox深度解析:AI接管自动化测试的革命——ReAct模式下的自愈测试框架
2026-05-17 01:50:54 +0800 CST
view 311
Agent-fox是基于AI Agent的自动化测试框架,让测试从编写代码变成描述意图。核心特性包括:自然语言解析引擎(NL Parser)、多策略融合元素定位(Smart Locator)、数据准备智能体(Data Preparation Agent)和自愈恢复机制。
Agent-fox,AI测试,自动化测试,Selenium,Playwright,ReAct,LLM,测试框架
用 Rust 玩转 Google Sheets API
编程
用 Rust 玩转 Google Sheets API
2024-11-19 02:36:20 +0800 CST
view 1758
本文介绍了如何使用Rust语言连接和使用GoogleSheetsAPI,适合构建最小化可行产品(MVP)或原型。内容包括项目搭建、依赖添加、获取API密钥和凭据、Rust代码实现以及如何运行程序。通过这些步骤,用户可以高效管理数据并利用GoogleSheets的强大功能。
编程
API
Rust
Google
数据管理
在网页中嵌入 Google 翻译小部件的实践指南
编程
在网页中嵌入 Google 翻译小部件的实践指南
2025-07-17 22:32:44 +0800 CST
view 1275
本文介绍了如何在网页中嵌入Google翻译小部件的实践指南,包括背景、基本使用方法、注意事项及替代方案。尽管Google于2019年停止推广该小部件,但仍可在非商业网站上使用。提供了代码示例和样式定制建议,并推荐了适合商业站点的替代方案,如GoogleCloudTranslationAPI和TranslatePress插件。
网页开发
翻译工具
技术指南
Google服务
aardio 深度解析:22 年持续更新的国产桌面开发利器,6.8MB 干翻 Electron
编程
aardio 深度解析:22 年持续更新的国产桌面开发利器,6.8MB 干翻 Electron
2026-05-01 20:12:47 +0800 CST
view 365
aardio 是一个诞生于 2002 年的国产桌面软件快速开发工具,体积仅 6.8MB,开发出的程序普遍在 1MB 以内。对比 Electron 动辄 100MB+ 的体积,它是被低估的 Windows 桌面开发利器。
aardio
桌面开发
Windows
国产软件
Electron
轻量级
GreptimeDB 深度实战:当可观测性告别「三件套」——从宽事件统一引擎到存算分离、Flow 流处理与 PB 级日检索亚秒的生产级完全指南(2026)
编程
GreptimeDB 深度实战:当可观测性告别「三件套」——从宽事件统一引擎到存算分离、Flow 流处理与 PB 级日检索亚秒的生产级完全指南(2026)
2026-06-17 10:58:30 +0800 CST
view 83
GreptimeDB深度实战:从宽事件统一模型到存算分离架构、Flow流处理引擎、SQL+PromQL双查询、PB级亚秒检索的完整生产级指南
GreptimeDB
可观测性
时序数据库
Rust
OpenTelemetry
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
10
11
12
13
14
...
33
下一页