程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
UI-TARS-desktop 深度解析:字节跳动开源多模态AI Agent技术栈——让AI真正"看懂"并"操作"你的桌面
编程
UI-TARS-desktop 深度解析:字节跳动开源多模态AI Agent技术栈——让AI真正"看懂"并"操作"你的桌面
2026-05-15 23:17:35 +0800 CST
view 270
深度解析字节跳动开源的UI-TARS-desktop项目,探讨多模态AI Agent如何通过视觉语言模型实现桌面自动化操作,包含完整架构分析、代码实战和性能优化。
AI Agent
多模态
字节跳动
UI-TARS
桌面自动化
Qwen3
Superpowers 深度解析:当 AI 编程 Agent 终于学会「按规矩写代码」
编程
Superpowers 深度解析:当 AI 编程 Agent 终于学会「按规矩写代码」
2026-04-09 03:23:19 +0800 CST
view 745
Superpowers 是一个为 AI 编程 Agent 设计的结构化技能框架,通过 14 个核心技能强制 Agent 遵循「规划→隔离→实现→验证→交付」的完整工程流程。GitHub 122K+ Stars,支持 Claude Code、Cursor、Copilot CLI 等平台。
AI编程
Agent框架
Claude Code
Cursor
软件工程
TDD
代码审查
UI-TARS-desktop实战:用Qwen3-4B构建跨平台多模态AI Agent——从屏幕理解到桌面自动化
编程
UI-TARS-desktop实战:用Qwen3-4B构建跨平台多模态AI Agent——从屏幕理解到桌面自动化
2026-05-15 23:18:28 +0800 CST
view 209
深度解析字节跳动开源的UI-TARS-desktop项目,探讨多模态AI Agent如何通过视觉语言模型实现桌面自动化操作,包含完整架构分析、代码实战和性能优化。
AI Agent
多模态
字节跳动
UI-TARS
桌面自动化
Qwen3
MiroFish 深度解析:当群体智能引擎把"预测未来"做成了一门生意
编程
MiroFish 深度解析:当群体智能引擎把"预测未来"做成了一门生意
2026-04-09 03:35:55 +0800 CST
view 722
深度解析MiroFish——北邮学生用Claude Code 10天写出的群体智能预测引擎,获陈天桥3000万投资的技术内幕、架构原理与商业前景
MiroFish
群体智能
多智能体
Agent
OASIS
数字沙盘
预测引擎
Scenethesis 深度实战:当 Agent 闭环遇见 3D 世界生成——英伟达 ICLR 2026 论文全解析
编程
Scenethesis 深度实战:当 Agent 闭环遇见 3D 世界生成——英伟达 ICLR 2026 论文全解析
2026-05-09 06:06:57 +0800 CST
view 296
深度解析英伟达ICLR 2026论文Scenethesis:用四阶段Agent闭环系统实现文本到3D场景生成,碰撞率降至0.8%,首轮通过率72%,自检后提升至91%。含完整代码实现。
AI
3D生成
Agent
英伟达
ICLR
MiroFish 深度解析:群体智能预测引擎的技术革命——用数千个AI Agent构建平行数字世界,让未来在数字沙盘中预演
编程
MiroFish 深度解析:群体智能预测引擎的技术革命——用数千个AI Agent构建平行数字世界,让未来在数字沙盘中预演
2026-05-16 00:46:06 +0800 CST
view 246
MiroFish 深度解析:群体智能预测引擎的技术革命。本文从核心概念、架构分析、代码实战、算法解析、性能优化等维度,全面剖析 MiroFish 如何用数千个 AI Agent 构建平行数字世界,让未来在数字沙盘中预演。
MiroFish
群体智能
AI Agent
预测引擎
微软 Build 2026 全景拆解:从MAI-Thinking-1零蒸馏推理到MXC安全沙箱,Agent优先时代的七款自研模型+量子芯片深度技术指南(2026)
编程
微软 Build 2026 全景拆解:从MAI-Thinking-1零蒸馏推理到MXC安全沙箱,Agent优先时代的七款自研模型+量子芯片深度技术指南(2026)
2026-06-10 07:15:42 +0800 CST
view 16
微软Build 2026开发者大会全景技术拆解:MAI-Thinking-1稀疏MoE架构、MAI-Code-1-Flash代码生成、Scout多智能体、MXC内核级安全沙箱、Project Solara Agent Shell、Majorana 2量子芯片,从模型层到硬件层的完整分析
微软
Build 2026
MAI模型
GitHub Copilot
Agent
MXC
Project Solara
量子计算
TriAttention深度解析:用三角函数革命性压缩KV Cache,让长推理从「显存地狱」中脱困
编程
TriAttention深度解析:用三角函数革命性压缩KV Cache,让长推理从「显存地狱」中脱困
2026-05-17 04:14:18 +0800 CST
view 224
深入解析MIT韩松团队提出的TriAttention方法,利用Pre-RoPE空间Q/K集中性和三角函数级数实现革命性的KV Cache压缩,在AIME25上以3072 KV budget达到与Full Attention持平的40.8%准确率,同时实现10.7倍KV显存压缩和2.5-6.3倍吞吐量提升。
LLM
KV Cache
TriAttention
MIT
英伟达
浙大
长推理
KV压缩
三角函数
RoPE
Attention优化
【重制版】TriAttention深度解析:三角函数如何让长推理从显存地狱中脱困
编程
【重制版】TriAttention深度解析:三角函数如何让长推理从显存地狱中脱困
2026-05-17 04:14:33 +0800 CST
view 205
深入解析MIT韩松团队提出的TriAttention方法,利用Pre-RoPE空间Q/K集中性和三角函数级数实现革命性的KV Cache压缩,在AIME25上以3072 KV budget达到与Full Attention持平的40.8%准确率,同时实现10.7倍KV显存压缩和2.5-6.3倍吞吐量提升。
LLM
KV Cache
TriAttention
MIT
英伟达
浙大
长推理
KV压缩
三角函数
RoPE
Attention优化
Flowsint 深度实战:开源情报图形调查平台完全指南——从实体关联分析到自动化情报收集的工程化实践(2026)
编程
Flowsint 深度实战:开源情报图形调查平台完全指南——从实体关联分析到自动化情报收集的工程化实践(2026)
2026-06-02 23:14:35 +0800 CST
view 212
Flowsint 是一个现代化的开源情报(OSINT)图形调查平台,通过可视化、灵活且可扩展的架构,让复杂的情报关联分析变得直观高效。本文深入剖析 Flowsint 的架构设计、核心功能、实战部署和高级用法。
OSINT
网络安全
开源情报
图形数据库
Flowsint
Event-Driven Architecture 完全指南:从 Kafka 到 EventMesh 的现代事件驱动架构实践(2026)
编程
Event-Driven Architecture 完全指南:从 Kafka 到 EventMesh 的现代事件驱动架构实践(2026)
2026-06-03 04:16:03 +0800 CST
view 145
深度解析事件驱动架构核心原理与实战,涵盖 Apache Kafka、Apache Pulsar、EventMesh 等主流方案,通过完整代码示例展示如何构建高可用、可扩展的现代事件驱动系统。
Event-Driven
Kafka
Pulsar
EventMesh
事件驱动架构
微服务
云原生
消息队列
Google AI Edge Gallery:手机离线跑大模型时代来了,2.2万Star端侧AI神器
案例
Google AI Edge Gallery:手机离线跑大模型时代来了,2.2万Star端侧AI神器
2026-05-09 07:36:45 +0800 CST
view 408
Google开源AI神器AI Edge Gallery斩获2.2万Star,支持iOS和Android手机离线运行Gemma 4等大模型,提供AI Chat、Ask Image、Audio Scribe、Agent Skills四大功能,消费级入口形态让普通用户轻松体验端侧AI
端侧AI
手机大模型
离线推理
Gemma 4
Google开源
iOS
Android
7.8K Star!GPT-Image-2 提示词宝库:120+ 精选案例涵盖肖像、海报、UI、角色设定
编程
7.8K Star!GPT-Image-2 提示词宝库:120+ 精选案例涵盖肖像、海报、UI、角色设定
2026-04-28 17:31:08 +0800 CST
view 397
GitHub 7.8K Star 的 GPT-Image-2 提示词宝库,收录120+精选案例,涵盖肖像、海报、UI原型、角色设定等,详解提示词编写技巧和实战示例。
AI绘图
GPT-Image-2
提示词工程
OpenAI
设计资源
GitHub
PromptSpy 深度解析:当安卓恶意软件第一次在运行时「调用 AI 思考」
编程
PromptSpy 深度解析:当安卓恶意软件第一次在运行时「调用 AI 思考」
2026-04-09 11:54:49 +0800 CST
view 421
2026年2月ESET披露首例Runtime AI安卓恶意软件PromptSpy,深度解析其如何调用Gemini实时决策、突破传统安全检测的技术架构与攻击链。
AI安全
Android
PromptSpy
Gemini
恶意软件
移动安全
ESET
Google LangExtract 深度解析:从混乱文本到结构化数据的工程化实践
编程
Google LangExtract 深度解析:从混乱文本到结构化数据的工程化实践
2026-04-29 01:09:56 +0800 CST
view 329
深度解析Google开源的LangExtract库:基于LLM的结构化信息提取框架,精确来源定位、交互可视化、零微调部署。从架构设计到代码实战,全面剖析21k+ Star背后的技术内核。
LangExtract
Google
信息提取
LLM
结构化数据
Python
开源
Hermes Agent + Bridge 深度解析:开源自进化 AI Agent 如何实现手机自动化操控
编程
Hermes Agent + Bridge 深度解析:开源自进化 AI Agent 如何实现手机自动化操控
2026-05-09 13:11:22 +0800 CST
view 349
Hermes Agent是Nous Research发布的开源AI Agent框架,主打自进化能力——每用一次变强一点。结合Bridge功能,AI可以直接操控手机实现自动化。
Python
开源
AI
自动化
Bridge
Google LangExtract 深度解析:从非结构化文本到结构化知识的工程化桥梁——零微调实现 100% 可溯源的信息提取
编程
Google LangExtract 深度解析:从非结构化文本到结构化知识的工程化桥梁——零微调实现 100% 可溯源的信息提取
2026-05-09 16:13:25 +0800 CST
view 245
2026年4月Google开源LangExtract,一个基于LLM的结构化信息提取框架。核心创新:字符级溯源(Source Grounding)实现100%可验证提取,零微调只需3-5个示例即可适配任何领域。本文深入解析其技术架构、长文档处理策略、医疗/法律/金融实战应用及生产部署最佳实践。
LangExtract
LLM
信息提取
结构化数据
医疗AI
RAG
Google开源
GPT Image 2 + Codex 深度解析:从「vibe art」到高端网站,AI 工作流的最后一公里
编程
GPT Image 2 + Codex 深度解析:从「vibe art」到高端网站,AI 工作流的最后一公里
2026-05-09 18:28:12 +0800 CST
view 560
当 AI 能生成代码、能生成图片,却始终生成不出「好看」的网站——这个问题,终于被一个不到 100 行的 SKILL.md 解决了一半。本文深度解析 Taste-Skill + GPT Image 2 + Codex 的完整工作流,从设计图到可上线的品牌网站,全流程实操演示。
AI图像生成
OpenAI
Codex
Taste-Skill
GPT Image 2
前端开发
工作流
编程
MarkItDown 深度实战:微软 AutoGen 团队开源的万能文档转 Markdown 引擎——从四层架构到 LLM/RAG 生产级集成的完全指南(2026)
2026-06-02 08:52:38 +0800 CST
view 99
微软AutoGen团队开源的MarkItDown能将PDF、Word、PPT、Excel、图片、音频等20+格式一键转为LLM友好的结构化Markdown。本文从四层架构、源码解析、代码实战、性能优化到生产级部署,彻底拆解这一11.9万星开源项目的核心技术。
MarkItDown
Microsoft
文档转换
Markdown
LLM
RAG
AutoGen
Python
Sage-Wiki 深度解析:当知识管理从「手动整理」变成「LLM自动编译」
编程
Sage-Wiki 深度解析:当知识管理从「手动整理」变成「LLM自动编译」
2026-04-10 06:03:55 +0800 CST
view 794
sage-wiki 是基于 Andrej Karpathy 想法实现的 LLM-compiled 个人知识库,支持15种格式自动编译成互链 Wiki,MCP 接口让 AI Agent 访问你的知识。
sage-wiki
知识管理
LLM
Go
编译器
Karpathy
MCP
WebAssembly WASI Component Model 完全解析:云原生时代的USB-C接口标准——从底层原理到生产级部署的工程实践(2026)
编程
WebAssembly WASI Component Model 完全解析:云原生时代的USB-C接口标准——从底层原理到生产级部署的工程实践(2026)
2026-06-03 14:44:57 +0800 CST
view 114
深入解析 WebAssembly WASI Component Model 标准:Interface Types 设计哲学、Core Module 与 Component Layer 分层架构、WASI Preview 2 完整 API 与 Capability Model。从 Rust 编写 Wasm 组件到三大运行时(Wasmtime/Wasmer/WasmEdge)对比与生产选型,覆盖 AI 推理加速、CI/CD 插件化、Serverless 冷启动优化等落地实践。
WebAssembly
WASI
云原生
容器化
Rust
Wasmtime
WasmEdge
Google LangExtract 深度实战:从非结构化文本到结构化知识的工程化完全指南(2026)
编程
Google LangExtract 深度实战:从非结构化文本到结构化知识的工程化完全指南(2026)
2026-05-24 13:30:29 +0800 CST
view 171
Google LangExtract 深度实战:从非结构化文本到结构化知识的工程化完全指南,涵盖架构分析、代码实战、性能优化。
LangExtract
LLM
结构化提取
Google
Python
Gemini 2.5 Pro I/O 版深度实战:从思考模型到 AI 编程之巅——2026 年最强推理大模型工程化完全指南
编程
Gemini 2.5 Pro I/O 版深度实战:从思考模型到 AI 编程之巅——2026 年最强推理大模型工程化完全指南
2026-05-24 14:03:27 +0800 CST
view 210
2026年I/O大会后Gemini 2.5 Pro I/O版深度解析,涵盖动态思考、并行推理、百万token上下文、代码实战、性能优化全链路指南
AI
Gemini
Google
大模型
代码生成
Codex+Figma MCP:GPT-image-2 出图转前端的完整实践
案例
Codex+Figma MCP:GPT-image-2 出图转前端的完整实践
2026-05-12 06:38:15 +0800 CST
view 545
GPT-image-2 生成的图怎么变成前端代码?两种路径完整实践:直接用 Codex 生图转前端,或通过 Figma MCP 读取设计文件转代码。Playwright 自动校验,AI 自己检查自己。
GPT-image-2
Codex
Figma MCP
AI前端
设计转代码
Playwright
OpenAI
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
44
45
46
47
48
下一页