程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
UI-TARS-desktop实战:用Qwen3-4B构建跨平台多模态AI Agent——从屏幕理解到桌面自动化
编程
UI-TARS-desktop实战:用Qwen3-4B构建跨平台多模态AI Agent——从屏幕理解到桌面自动化
2026-05-15 23:18:28 +0800 CST
view 278
深度解析字节跳动开源的UI-TARS-desktop项目,探讨多模态AI Agent如何通过视觉语言模型实现桌面自动化操作,包含完整架构分析、代码实战和性能优化。
AI Agent
多模态
字节跳动
UI-TARS
桌面自动化
Qwen3
MiroFish 深度解析:当群体智能引擎把"预测未来"做成了一门生意
编程
MiroFish 深度解析:当群体智能引擎把"预测未来"做成了一门生意
2026-04-09 03:35:55 +0800 CST
view 800
深度解析MiroFish——北邮学生用Claude Code 10天写出的群体智能预测引擎,获陈天桥3000万投资的技术内幕、架构原理与商业前景
MiroFish
群体智能
多智能体
Agent
OASIS
数字沙盘
预测引擎
OpenSRE 深度解析:当 AI Agent 遇上生产故障排查,SRE 的范式革命正在发生
编程
OpenSRE 深度解析:当 AI Agent 遇上生产故障排查,SRE 的范式革命正在发生
2026-04-18 11:15:31 +0800 CST
view 680
OpenSRE 是一个开源的 AI SRE Agent 框架,专注于生产环境故障的根因分析。本文深度解析其架构设计、合成测试体系与实战应用。
OpenSRE
SRE
AI Agent
DevOps
故障排查
开源项目
Scenethesis 深度实战:当 Agent 闭环遇见 3D 世界生成——英伟达 ICLR 2026 论文全解析
编程
Scenethesis 深度实战:当 Agent 闭环遇见 3D 世界生成——英伟达 ICLR 2026 论文全解析
2026-05-09 06:06:57 +0800 CST
view 372
深度解析英伟达ICLR 2026论文Scenethesis:用四阶段Agent闭环系统实现文本到3D场景生成,碰撞率降至0.8%,首轮通过率72%,自检后提升至91%。含完整代码实现。
AI
3D生成
Agent
英伟达
ICLR
MiroFish 深度解析:群体智能预测引擎的技术革命——用数千个AI Agent构建平行数字世界,让未来在数字沙盘中预演
编程
MiroFish 深度解析:群体智能预测引擎的技术革命——用数千个AI Agent构建平行数字世界,让未来在数字沙盘中预演
2026-05-16 00:46:06 +0800 CST
view 326
MiroFish 深度解析:群体智能预测引擎的技术革命。本文从核心概念、架构分析、代码实战、算法解析、性能优化等维度,全面剖析 MiroFish 如何用数千个 AI Agent 构建平行数字世界,让未来在数字沙盘中预演。
MiroFish
群体智能
AI Agent
预测引擎
Google AI Edge Gallery:手机离线跑大模型时代来了,2.2万Star端侧AI神器
案例
Google AI Edge Gallery:手机离线跑大模型时代来了,2.2万Star端侧AI神器
2026-05-09 07:36:45 +0800 CST
view 527
Google开源AI神器AI Edge Gallery斩获2.2万Star,支持iOS和Android手机离线运行Gemma 4等大模型,提供AI Chat、Ask Image、Audio Scribe、Agent Skills四大功能,消费级入口形态让普通用户轻松体验端侧AI
端侧AI
手机大模型
离线推理
Gemma 4
Google开源
iOS
Android
7.8K Star!GPT-Image-2 提示词宝库:120+ 精选案例涵盖肖像、海报、UI、角色设定
编程
7.8K Star!GPT-Image-2 提示词宝库:120+ 精选案例涵盖肖像、海报、UI、角色设定
2026-04-28 17:31:08 +0800 CST
view 465
GitHub 7.8K Star 的 GPT-Image-2 提示词宝库,收录120+精选案例,涵盖肖像、海报、UI原型、角色设定等,详解提示词编写技巧和实战示例。
AI绘图
GPT-Image-2
提示词工程
OpenAI
设计资源
GitHub
DiffusionGemma 深度实战:当文本生成告别逐字蹦字——从离散扩散到 1100 tokens/s 的生产级完全指南(2026)
编程
DiffusionGemma 深度实战:当文本生成告别逐字蹦字——从离散扩散到 1100 tokens/s 的生产级完全指南(2026)
2026-06-16 07:18:07 +0800 CST
view 101
Google DeepMind 开源 DiffusionGemma 离散文本扩散模型深度实战:从并行去噪原理到 1100 tokens/s 推理,完整代码示例与 Agent 构建
DiffusionGemma
文本扩散
离散扩散
LLM
开源模型
Google DeepMind
PromptSpy 深度解析:当安卓恶意软件第一次在运行时「调用 AI 思考」
编程
PromptSpy 深度解析:当安卓恶意软件第一次在运行时「调用 AI 思考」
2026-04-09 11:54:49 +0800 CST
view 493
2026年2月ESET披露首例Runtime AI安卓恶意软件PromptSpy,深度解析其如何调用Gemini实时决策、突破传统安全检测的技术架构与攻击链。
AI安全
Android
PromptSpy
Gemini
恶意软件
移动安全
ESET
Google LangExtract 深度解析:从混乱文本到结构化数据的工程化实践
编程
Google LangExtract 深度解析:从混乱文本到结构化数据的工程化实践
2026-04-29 01:09:56 +0800 CST
view 405
深度解析Google开源的LangExtract库:基于LLM的结构化信息提取框架,精确来源定位、交互可视化、零微调部署。从架构设计到代码实战,全面剖析21k+ Star背后的技术内核。
LangExtract
Google
信息提取
LLM
结构化数据
Python
开源
Hermes Agent + Bridge 深度解析:开源自进化 AI Agent 如何实现手机自动化操控
编程
Hermes Agent + Bridge 深度解析:开源自进化 AI Agent 如何实现手机自动化操控
2026-05-09 13:11:22 +0800 CST
view 432
Hermes Agent是Nous Research发布的开源AI Agent框架,主打自进化能力——每用一次变强一点。结合Bridge功能,AI可以直接操控手机实现自动化。
Python
开源
AI
自动化
Bridge
Google LangExtract 深度解析:从非结构化文本到结构化知识的工程化桥梁——零微调实现 100% 可溯源的信息提取
编程
Google LangExtract 深度解析:从非结构化文本到结构化知识的工程化桥梁——零微调实现 100% 可溯源的信息提取
2026-05-09 16:13:25 +0800 CST
view 305
2026年4月Google开源LangExtract,一个基于LLM的结构化信息提取框架。核心创新:字符级溯源(Source Grounding)实现100%可验证提取,零微调只需3-5个示例即可适配任何领域。本文深入解析其技术架构、长文档处理策略、医疗/法律/金融实战应用及生产部署最佳实践。
LangExtract
LLM
信息提取
结构化数据
医疗AI
RAG
Google开源
编程
MarkItDown 深度实战:微软 AutoGen 团队开源的万能文档转 Markdown 引擎——从四层架构到 LLM/RAG 生产级集成的完全指南(2026)
2026-06-02 08:52:38 +0800 CST
view 177
微软AutoGen团队开源的MarkItDown能将PDF、Word、PPT、Excel、图片、音频等20+格式一键转为LLM友好的结构化Markdown。本文从四层架构、源码解析、代码实战、性能优化到生产级部署,彻底拆解这一11.9万星开源项目的核心技术。
MarkItDown
Microsoft
文档转换
Markdown
LLM
RAG
AutoGen
Python
DiffusionGemma 深度实战:当 Google 用「扩散」颠覆自回归——从离散文本扩散原理到 MoE 架构、本地推理加速与生产级部署的完全指南(2026)
编程
DiffusionGemma 深度实战:当 Google 用「扩散」颠覆自回归——从离散文本扩散原理到 MoE 架构、本地推理加速与生产级部署的完全指南(2026)
2026-06-16 18:52:52 +0800 CST
view 149
Google DeepMind联合NVIDIA发布DiffusionGemma——基于离散文本扩散的实验性开源模型。本文深入解读26B MoE架构、双向注意力机制、本地推理4倍加速原理,附完整代码示例和部署实战。
Google
DiffusionGemma
扩散模型
MoE
开源LLM
本地推理
AI推理加速
Sage-Wiki 深度解析:当知识管理从「手动整理」变成「LLM自动编译」
编程
Sage-Wiki 深度解析:当知识管理从「手动整理」变成「LLM自动编译」
2026-04-10 06:03:55 +0800 CST
view 917
sage-wiki 是基于 Andrej Karpathy 想法实现的 LLM-compiled 个人知识库,支持15种格式自动编译成互链 Wiki,MCP 接口让 AI Agent 访问你的知识。
sage-wiki
知识管理
LLM
Go
编译器
Karpathy
MCP
DiffusionGemma 深度实战:当离散文本扩散颠覆自回归霸权——从并行去噪原理到 MoE 架构、本地推理优化与混合范式展望的生产级完全指南(2026)
编程
DiffusionGemma 深度实战:当离散文本扩散颠覆自回归霸权——从并行去噪原理到 MoE 架构、本地推理优化与混合范式展望的生产级完全指南(2026)
2026-06-17 07:55:50 +0800 CST
view 93
Google开源DiffusionGemma:基于离散文本扩散的26B MoE模型,并行去噪实现4倍推理加速,双向注意力天然支持代码补全与行内编辑
DiffusionGemma
LLM
扩散模型
推理加速
MoE
WebAssembly WASI Component Model 完全解析:云原生时代的USB-C接口标准——从底层原理到生产级部署的工程实践(2026)
编程
WebAssembly WASI Component Model 完全解析:云原生时代的USB-C接口标准——从底层原理到生产级部署的工程实践(2026)
2026-06-03 14:44:57 +0800 CST
view 303
深入解析 WebAssembly WASI Component Model 标准:Interface Types 设计哲学、Core Module 与 Component Layer 分层架构、WASI Preview 2 完整 API 与 Capability Model。从 Rust 编写 Wasm 组件到三大运行时(Wasmtime/Wasmer/WasmEdge)对比与生产选型,覆盖 AI 推理加速、CI/CD 插件化、Serverless 冷启动优化等落地实践。
WebAssembly
WASI
云原生
容器化
Rust
Wasmtime
WasmEdge
Google LangExtract 深度实战:从非结构化文本到结构化知识的工程化完全指南(2026)
编程
Google LangExtract 深度实战:从非结构化文本到结构化知识的工程化完全指南(2026)
2026-05-24 13:30:29 +0800 CST
view 242
Google LangExtract 深度实战:从非结构化文本到结构化知识的工程化完全指南,涵盖架构分析、代码实战、性能优化。
LangExtract
LLM
结构化提取
Google
Python
Gemini 2.5 Pro I/O 版深度实战:从思考模型到 AI 编程之巅——2026 年最强推理大模型工程化完全指南
编程
Gemini 2.5 Pro I/O 版深度实战:从思考模型到 AI 编程之巅——2026 年最强推理大模型工程化完全指南
2026-05-24 14:03:27 +0800 CST
view 303
2026年I/O大会后Gemini 2.5 Pro I/O版深度解析,涵盖动态思考、并行推理、百万token上下文、代码实战、性能优化全链路指南
AI
Gemini
Google
大模型
代码生成
Forge Admin:SpringBoot3+Vue3 企业级管理框架,AI写代码+一键生成大屏
编程
Forge Admin:SpringBoot3+Vue3 企业级管理框架,AI写代码+一键生成大屏
2026-05-12 12:15:31 +0800 CST
view 319
Forge Admin是一个微内核+插件化的企业级管理框架,基于SpringBoot3+JDK17+Vue3,AI驱动代码生成和一键数据大屏,支持7家AI供应商,核心只有几百KB,按需引入绝不冗余。
Forge Admin
SpringBoot3
Vue3
AI代码生成
数据大屏
微内核
InsForge 深度实战:面向AI编码代理的后端开发平台——2026年完全指南
编程
InsForge 深度实战:面向AI编码代理的后端开发平台——2026年完全指南
2026-05-25 03:34:05 +0800 CST
view 223
本文深入讲解InsForge的核心概念、架构设计、实战安装与插件开发,以及性能优化方法,帮助开发者全面掌握这一2026年热门的AI编码代理后端开发平台。
InsForge
AI编码代理
后端开发平台
开源项目
2026
DeepSeek DeepGEMM 2026年4月重磅更新:Mega MoE融合算子、FP4精度与极致性能优化
编程
DeepSeek DeepGEMM 2026年4月重磅更新:Mega MoE融合算子、FP4精度与极致性能优化
2026-04-23 08:41:45 +0800 CST
view 357
深度解析DeepSeek DeepGEMM 2026年4月重大更新:Mega MoE融合算子(dispatch+Linear+SwiGLU+Combine五合一,NVLink通信与Tensor Core计算重叠)、FP8xFP4 GEMM、FP4 Indexer、PDL调度优化与JIT加速,附完整代码实战。
DeepGEMM
DeepSeek
GPU优化
CUDA
FP8
FP4
MoE
AI Infra
高性能计算
NVIDIA
WebGen-R1 深度实战:7B 小模型如何用强化学习独立建站,碾压 DeepSeek-R1
编程
WebGen-R1 深度实战:7B 小模型如何用强化学习独立建站,碾压 DeepSeek-R1
2026-05-05 11:33:45 +0800 CST
view 357
香港科技大学与阿里巴巴联合研究 WebGen-R1,用强化学习训练 7B 小模型独立生成完整网站,功能成功率超越 DeepSeek-R1,美学评分吊打 GPT-5。
AI
强化学习
代码生成
WebGen-R1
深度学习
GPT-Image-2深度解析:让AI先思考再画图,一句话生成专业级视觉内容
编程
GPT-Image-2深度解析:让AI先思考再画图,一句话生成专业级视觉内容
2026-04-23 15:54:58 +0800 CST
view 337
2026年4月22日OpenAI发布GPT-Image-2,以1512分登顶Arena.AI图像榜单,断层领先第二名Google Nano-banana-2达242分。它是全球首个具备思考能力的图像生成模型:联网搜索+规划布局+自我复核,三步智能流水线让AI先想后画。
GPT-Image-2
OpenAI
图像生成
AI绘图
自回归模型
Arena评测
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
68
69
70
71
72
73
下一页