AI 控制 Mac 电脑和手机的 MCP/Skill 方案全解析
从桌面自动化到手机操控,盘点 2025-2026 年最值得关注的 AI Agent 工具链
前言
MCP(Model Context Protocol)协议在 2025 年被 Anthropic、OpenAI、Google DeepMind、Microsoft 等巨头相继采纳,已成为 AI Agent 调用外部工具的标准协议。随着协议成熟,一批专注于操作系统级控制的 MCP Server 涌现出来——让 AI 不仅能"说话",还能直接"动手"操作你的电脑和手机。
本文整理了目前主流的控制 Mac 电脑和手机的 MCP/Skill 方案,帮你快速选型。
一、控制 Mac 电脑的方案
1. Anthropic Computer Use(官方方案)
Anthropic 在 Claude 3.5 Sonnet 中推出了 Computer Use 能力,2026 年 3 月正式在 Claude Code CLI 中上线原生 macOS 桌面控制。
核心能力:
- 模拟鼠标点击、键盘输入
- 截屏识别界面元素
- 打开应用、操控 GUI
- 以内置 MCP Server 形式集成,通过
/mcp命令启用
使用要求:
- Claude Code v2.1.85 及以上
- macOS 系统
- Claude Pro 或 Max 订阅计划
工作原理:Claude Code 会按优先级选择工具——有 MCP Server 用 MCP,Shell 命令用 Bash,浏览器任务用 Chrome 扩展,以上都不适用时才启用 Computer Use 控制屏幕。
评价:最原生的桌面控制方案,但绑定 Claude 生态,需付费订阅。
2. computer-use-mcp(开源替代)
- 项目地址:github.com/domdomegg/computer-use-mcp
- 定位:功能类似 Anthropic Computer Use 的开源 MCP Server
核心能力:
- 截屏、鼠标点击、键盘输入
- 屏幕元素识别与操控
- 不绑定特定 LLM,可接入任何支持 MCP 的客户端
评价:通用性最好的方案,适合不想绑定 Claude 的用户。推荐首选。
3. DesktopCommanderMCP(命令行级控制)
- 安装:
npm install -g desktop-commander - 技术栈:Node.js MCP Server
核心能力:
- 执行系统命令(启动应用、查询系统信息)
- 文件系统操作(读写文件、列出目录)
- 进程管理(启动、监控、终止进程)
- 跨平台支持(Windows、Linux、macOS)
局限性:只能命令行级别操作,不能操控 GUI 界面。
适用场景:自动化脚本任务、批处理、系统管理。
4. macOS Automation MCP(自建方案)
基于 Python + FastMCP 框架自建,核心逻辑示例:
from mcp.server.fastmcp import FastMCP
mcp = FastMCP()
@mcp.tool()
def organize_desktop():
"""自动将桌面文件按类型分类"""
# 调用 AppleScript 或 osascript 实现
...
能力:
- 桌面文件整理
- AppleScript / osascript 调用
- 自定义自动化工作流
评价:灵活度最高,但需要自行开发和维护。
5. OpenClaw 内置方案(零成本)
如果你已经在使用 OpenClaw,其实已经具备了部分 Mac 控制能力:
- exec 工具:执行
osascript命令控制 Mac 的许多功能 - browser 工具:内置浏览器自动化(截图、点击、输入等)
# 用 osascript 打开应用
osascript -e 'tell application "Safari" to activate'
# 用 osascript 模拟按键
osascript -e 'tell application "System Events" to keystroke "h" using command down'
二、控制手机的方案
1. mobile-mcp(跨平台,最成熟)⭐
- 项目地址:github.com/mobile-next/mobile-mcp
- 维护状态:317+ commits,活跃维护
- 协议:MCP(Model Context Protocol)
支持平台:
- iOS(真机 + 模拟器)
- Android(真机 + 模拟器)
核心能力:
- UI 交互:点击、滑动、长按
- 截屏与界面识别
- 自动化测试
- 统一接口,一套代码控制双平台
评价:手机控制领域的首选方案,跨平台覆盖最全,社区活跃。
2. claude-in-mobile(多端支持)
- 项目地址:github.com/AlexGladkov/claude-in-mobile
- 定位:MCP Server for 移动 + 桌面自动化
支持平台:
- Android(通过 ADB)
- iOS 模拟器(通过 simctl)
- 桌面应用(Compose Multiplatform)
- Aurora OS(通过 audb)
特色:类似 "Claude in Chrome" 但给手机和桌面用,覆盖面广。
3. phoneMcp(安卓专用,中文友好)
- 项目地址:github.com/kengerlwl/phoneMcp
- 定位:专为安卓手机设计,支持 MCP + Skill 双接入
核心能力:
- 自然语言控制安卓手机
- 类似豆包手机效果
- Skill 和 MCP 两种接入方式
评价:中文用户友好,安卓场景专用,适合国内开发者。
4. android-mcp-server(轻量安卓控制)
- 项目地址:github.com/minhalvp/android-mcp-server
- 定位:通过 ADB 控制安卓设备
核心能力:
- ADB 设备管理
- 应用安装/卸载/控制
- 自动设备选择
评价:轻量级,专注安卓 ADB 场景。
5. iOS Simulator MCP Server
系统要求:
- macOS(需 Xcode 和 iOS 模拟器)
- Facebook IDB 工具
- Node.js
核心能力:
ui_tap:点击操作ui_swipe:滑动手势ui_describe_point:获取元素坐标- 复杂手势组合
局限性:仅支持 iOS 模拟器,不支持真机。
6. OpenClaw Node Connect(已有能力)
OpenClaw 本身内置 node-connect 功能,配对手机后可以:
- 截屏、拍照
- 获取位置信息
- 读取通知
- 发送消息
三、选型建议
Mac 电脑控制
| 需求场景 | 推荐方案 | 理由 |
|---|---|---|
| 需要 GUI 操控(点击/输入) | computer-use-mcp | 开源通用,不绑定生态 |
| 只需命令行自动化 | DesktopCommanderMCP | 轻量稳定 |
| 快速实现、零成本 | osascript + exec | 已有工具 |
| 高度定制化 | 自建 macOS Automation MCP | 灵活可控 |
| Claude 生态用户 | Anthropic Computer Use | 最原生 |
手机控制
| 需求场景 | 推荐方案 | 理由 |
|---|---|---|
| iOS + Android 跨平台 | mobile-mcp | 最成熟,社区活跃 |
| 仅安卓手机 | phoneMcp | 中文友好,双接入 |
| 安卓 ADB 脚本 | android-mcp-server | 轻量专注 |
| iOS 模拟器开发测试 | iOS Simulator MCP | 专为模拟器优化 |
| 基础手机交互 | OpenClaw node-connect | 已内置 |
四、安全提醒
AI 操控电脑和手机的能力非常强大,但也带来安全风险:
- 权限最小化:只授予必要的系统权限,避免全盘访问
- 操作可审计:保留操作日志,便于回溯
- 敏感操作确认:涉及支付、删除、发送等操作应有二次确认
- 沙箱优先:优先在模拟器/沙箱环境中测试
- 网络隔离:MCP Server 尽量本地运行,避免暴露到公网
总结
MCP 协议让 AI Agent 从"能说"进化到"能做"。在 Mac 电脑控制方面,computer-use-mcp 是当前最通用的开源选择;在手机控制方面,mobile-mcp 覆盖最全面。如果你已经在使用 OpenClaw,别忘了先试试内置的 exec + osascript 和 node-connect 能力——很多时候零成本就能解决问题。
AI 控制设备的时代才刚刚开始,这些工具会越来越强大。选一个趁手的,先跑起来。