Magentic-UI:微软开源的人机协作网页自动化神器(详细安装使用指南)
文章目录
- 🌟 前言
- 🛠️ 项目介绍
- 💻 安装教程
- 1. 克隆仓库
- 2. 创建Python虚拟环境
- 3. 激活环境并安装依赖
- 4. 启动服务
- 🖥️ 使用教程
- 1. 访问界面
- 2. 配置AI模型
- 3. 执行任务
- 🎯 实际效果
- 💡 使用技巧
- 📌 总结
🌟 前言
今天给大家介绍一款微软最新开源的人机协作网页自动化工具——Magentic-UI!它是一个以人为中心的Agent研究原型 ,由多代理系统提供支持,可以在 Web 上浏览和执行作,生成和执行代码,以及生成和分析文件。和其他Agent区别在于允许高效的人机交互,而不是完全由ai自主决定,导致流程不可控。
🛠️ 项目介绍
Magentic-UI是微软开发的一款基于多智能体系统的网页自动化工具,主要特点包括:
- 🤖 多智能体协作:包含指挥者、网页浏览者、代码编写者等专业AI角色
- 👩💻 人机协同:每个步骤都可人工审核和修改
- 🛡️ 安全防护:敏感操作需人工确认
- 📚 学习能力:自动保存成功的工作流
- ⚡ 并行处理:同时执行多个任务
🏢 软件架构
更多介绍请参考Microsoft Research Blog
GitHub仓库地址:https://github.com/microsoft/magentic-ui
💻 安装教程
注意: 运行依赖docker,如果使用的是windows。请使用wsl2。
1. 克隆仓库
首先克隆项目到本地:
git clone https://github.com/microsoft/magentic-ui.git
2. 创建Python虚拟环境
进入项目目录并创建虚拟环境:
cd magentic-ui
uv venv --python=3.11
3. 激活环境并安装依赖
source .venv/bin/activate
uv pip install magentic-ui
4. 启动服务
magentic ui --port 8081
首次启动会自动下载和构建Docker镜像:
还会自动安装Playwright浏览器依赖:
🖥️ 使用教程
1. 访问界面
启动成功后,在浏览器访问:http://localhost:8081
2. 配置AI模型
默认使用OpenAI,国内用户可以使用DeepSeek等兼容API:
- 复制配置文件模板
- 修改为DeepSeek配置:
model_config: &client
provider: OpenAIChatCompletionClient
config:
model: "deepseek-chat"
base_url: "https://api.deepseek.com"
api_key: "你的API_KEY"
model_info:
vision: false
function_calling: true
json_output: true
family: unknown
structured_output: false
max_retries: 5
orchestrator_client: *client
coder_client: *client
web_surfer_client: *client
file_surfer_client: *client
action_guard_client: *client
- 点击"IMPORT YAML"上传配置文件
3. 执行任务
-
输入任务描述,例如:“搜集magentic-ui相关信息,并以公众号风格编写一篇介绍magentic-ui的markdown文章”
-
系统会自动生成执行计划
-
你可以对步骤进行增删修改,这里我们添加一下字数限制。确认并确定计划后,系统会自动执行
-
实时查看执行过程
- 任务完成后会有任务相关结果并进行标识
🎯 实际效果
看看自动生成的文章质量如何:
💡 使用技巧
- 可以随时暂停任务进行调整
- 复杂任务建议分阶段执行
- 善用"重新生成"功能优化计划
- 重要操作务必开启人工确认
📌 总结
Magentic-UI作为微软开源的网页自动化神器,具有以下优势:
✅ 操作透明:每个步骤都可查看和干预
✅ 安全可靠:关键操作需要人工确认
✅ 智能高效:自动学习优化工作流
✅ 功能强大:支持复杂多步骤任务
如果觉得本文有帮助,别忘了点赞收藏🌟!有任何问题欢迎在评论区交流讨论~
本文地址:https://www.vps345.com/13988.html