Browser Use 使用教程
task = """1. 访问 https://example.com/login2. 填写用户名:test@example.com3. 填写密码:SecurePass123!4. 点击登录按钮5. 提取登录后的欢迎消息"""# 生成并执行自动化脚本print(result["welcome_message"]) # 输出提取的文本。
Browser Use 是一款开源的浏览器自动化工具,通过集成AI智能体(如OpenAI的GPT模型),实现了对网页浏览、数据抓取、表单填写等操作的智能化控制。相较于传统自动化工具(如Selenium、Puppeteer),Browser Use 的核心优势在于:
-
AI驱动决策:通过自然语言交互生成自动化脚本,降低编码门槛;
-
动态适配:自动处理验证码、反爬机制及页面结构变化;
-
跨平台支持:兼容Chrome、Firefox等主流浏览器。

本文将详细介绍从环境搭建到部署优化的完整流程。
1. 安装所需依赖
1.1 基础环境
-
**Python 3.8+**:推荐使用虚拟环境(如
venv或conda)。 -
浏览器驱动:根据目标浏览器下载对应驱动(如ChromeDriver)。
1.2 核心库安装
pip install browser-use playwright openai python-dotenv
-
Playwright:提供无头浏览器控制能力。
-
OpenAI:调用GPT模型生成自动化策略。
-
python-dotenv:管理环境变量(如API密钥)。
2. 生成OpenAI密钥
-
访问OpenAI平台,注册账号并创建API密钥。
- 在项目根目录创建
.env文件,存储密钥:OPENAI_API_KEY=sk-xxx...
3. 编写代码
3.1 初始化浏览器与AI代理
from browser_use import BrowserAgent
import openai
import os
# 加载环境变量
openai.api_key = os.getenv("OPENAI_API_KEY")
# 初始化AI驱动的浏览器代理
agent = BrowserAgent(
browser="chrome", # 支持chrome/firefox/webkit
headless=True, # 无头模式
ai_model="gpt-4o" # 指定AI模型
)
3.2 定义自动化任务
通过自然语言描述任务,AI将生成执行计划:
task = """
1. 访问 https://example.com/login
2. 填写用户名:test@example.com
3. 填写密码:SecurePass123!
4. 点击登录按钮
5. 提取登录后的欢迎消息
"""
# 生成并执行自动化脚本
result = agent.execute(task)
print(result["welcome_message"]) # 输出提取的文本
3.3 高级功能:动态适配反爬
# 处理验证码(示例:调用AI生成OCR逻辑)
def solve_captcha(page):
captcha_image = page.locator("img#captcha").screenshot()
prompt = f"识别以下验证码图片内容:{captcha_image}"
response = openai.ChatCompletion.create(
model="gpt-4o",
messages=[{"role": "user", "content": prompt}]
)
return response.choices[0].message.content
agent.register_hook("captcha", solve_captcha)
4. 运行代码
python main.py
常见问题排查:
-
驱动路径错误:通过
playwright install自动安装依赖。 -
API限流:在
.env中添加OPENAI_PROXY配置代理。
5. 部署与优化
5.1 部署AI代理
- Docker容器化:
FROM python:3.9-slim COPY requirements.txt . RUN pip install -r requirements.txt CMD ["python", "main.py"] -
云服务部署:推荐使用AWS Lambda或Google Cloud Run实现无服务器化。
5.2 优化与扩展
-
性能优化:
# 启用浏览器缓存复用 agent = BrowserAgent(reuse_context=True) # 并行任务处理 from concurrent.futures import ThreadPoolExecutor with ThreadPoolExecutor(max_workers=5) as executor: executor.map(agent.execute, tasks) -
异常处理:
try: agent.execute(task) except BrowserTimeoutError: agent.refresh_page() # 自动刷新重试 -
扩展功能:
-
集成
langchain实现复杂对话式自动化。 -
添加
mitmproxy支持HTTP流量监控。
-
推荐学习
行业首个「知识图谱+测试开发」深度整合课程【人工智能测试开发训练营】,赠送智能体工具。提供企业级解决方案,人工智能的管理平台部署,实现智能化测试,落地大模型,实现从传统手工转向用AI和自动化来实现测试,提升效率和质量。
推荐阅读
DeepSeek实践指导手册、人工智能在软件测试中的应用、我们是如何测试人工智能的?
在本地部署属于自己的 DeepSeek 模型,搭建AI 应用平台
DeepSeek 大模型与智能体公开课,带你从零开始,掌握 AI 的核心技术,开启智能未来!
深度解析:如何通过DeepSeek优化软件测试开发工作,提升效率与准确度
DeepSeek、文心一言、Kimi、豆包、可灵……谁才是你的最佳AI助手?
DeepSeek与Playwright结合:利用AI提升自动化测试脚本生成与覆盖率优化
DeepSeek大模型6大部署模式解析与探索测试开发技术赋能点
爱测智能化服务平台
测开人必看!0代码+AI驱动,测试效率飙升300% ——霍格沃兹测试开发学社重磅上新「爱测智能化服务平台」限时开放体验!
一码难求的Manus:智能体技术如何重构生产力?测试领域又有哪些新机遇?
开源工具
AppCrawler 开源版
https://github.com/seveniruby/AppCrawler
Hogwarts-Browser-Use 开源版
指导安装贴:hogwarts-browser-use - 开源项目 - 爱测-测试人社区
专业版 (7天免费试用)
自动遍历测试框架 AppCrawler 专业版
通用数据驱动测试框架 hogwarts-ddt 专业版
测试智能体框架 hogwarts-agent 专业版
学社提供的资源
教育官网:霍格沃兹测试开发学社
科技官网:测吧(北京)科技有限公司
火焰杯就业选拔赛:火焰杯就业选拔赛 - 霍格沃兹测试开发学社
火焰杯职业竞赛:火焰杯职业竞赛 - 霍格沃兹测试开发学社
学习路线图:霍格沃兹测试开发学社
公益社区论坛:爱测-测试人社区 - 软件测试开发爱好者的交流社区,交流范围涵盖软件测试、自动化测试、UI测试、接口测试、性能测试、安全测试、测试开发、测试平台、开源测试、测试教程、测试面试题、appium、selenium、jmeter、jenkins
公众号:霍格沃兹测试学院
视频号:霍格沃兹软件测试
ChatGPT体验地址:霍格沃兹测试开发学社
本套视频教程所有配套资料领取方式如下:
方式1:访问官网可下载:testingstudio.com
方式2:关注ceshiren.com社区
人工智能/AI/为什么测试工程师需要掌握AI_哔哩哔哩_bilibili
adb命令:【霍格沃兹测试开发】adb命令零基础快速入门–深入理解掌握app自动化测试底层技术_哔哩哔哩_bilibili
Python语法:1.闭包和装饰器_哔哩哔哩_bilibili?
人工智能:人工智能在音频、视觉、多模态领域的应用_哔哩哔哩_bilibili
软件测试入门:【霍格沃兹测试开发】7小时速成!软件测试新手入门指南,轻松掌握测试技能!_哔哩哔哩_bilibili
测试开发:【霍格沃兹测试开发】面试BAT软件测试开发,你需要具备哪些技能?_哔哩哔哩_bilibili
面试题指导:【霍格沃兹测试开发】软件测试工程师如何拿到P5-P7高薪offer?_哔哩哔哩_bilibili
JMeter:JMeter从入门到精通全集 包含http/dubbo/Kafka压测、Grafana监控_哔哩哔哩_bilibili
Java测试框架:【软件测试】Java测试框架Junit5与Allure测试报告免费课_哔哩哔哩_bilibili
简历面试教程:软件测试工程师简历面试教程攻略–如何写出能进BAT大厂测开岗的优质简历?如何在面试中向HR要到更高薪资?如何拿到更高级别的offer?–持续更新!_哔哩哔哩_bilibili
Java:【软件测试教程】Java自动化测试平台开发入门篇之初识springboot_哔哩哔哩_bilibili?
java语言rest-assured:【霍格沃兹测试开发】java语言rest-assured框架进行接口测试实战_哔哩哔哩_bilibili
Java接口自动化:【软件测试】Java接口自动化测试之RestAssured_哔哩哔哩_bilibili
性能测试:【软件测试教程】高级性能测试-JMeter+InfluxDB+Grafana压测数据展示_哔哩哔哩_bilibili
Linux:Linux 中如何实时查看日志记录-【软件测试面试题】_哔哩哔哩_bilibili
接口测试:【软件测试教程】接口测试入门实战-基于企业微信api进行接口测试_哔哩哔哩_bilibili
APP自动化:【霍格沃兹测试开发】APP移动端自动化测试从入门到精通/Appium环境安装/元素定位与隐式等待(最全攻略)_哔哩哔哩_bilibili
MySQL:【软件测试教程】MySQL数据库基本增删改查与多表查询_哔哩哔哩_bilibili
postman:【软件测试】postman基础-发送post请求_哔哩哔哩_bilibili
性能实战:【软件测试教程】性能测试压测实战-JMeter+InfluxDB+Grafana压测数据展示_哔哩哔哩_bilibili
零基础入门:零基础快速入门软件测试的秘籍_哔哩哔哩_bilibili
Java-JUnit5:软件测试之Java测试框架JUnit5 L1_哔哩哔哩_bilibili
接口测试:【软件测试】App抓包实战练习-接口测试初级入门_哔哩哔哩_bilibili
接口mitmproxy工具:【软件测试教程】测开必备工具mitmproxy_哔哩哔哩_bilibili
pytest:1.pytest简介与安装-【软件测试实战教程】_哔哩哔哩_bilibili
app功能测试:14.app压力测试-【软件测试实战教程】_哔哩哔哩_bilibili
前端开发-vue:Vue生命周期_哔哩哔哩_bilibili
flask:Flask环境安装与配置_哔哩哔哩_bilibili
Appium:appium的基本介绍_哔哩哔哩_bilibili
精品课试听:1.接口测试价值与体系_哔哩哔哩_bilibili
Docker
Docker cp命令详解:在Docker容器和主机之间复制文件/文件夹
Docker Kill/Pause/Unpause命令详细使用指南
Selenium
软件测试/测试开发/全日制|selenium NoSuchDriverException问题解决
软件测试/人工智能|解决Selenium中的异常问题:“error sending request for url”
Python
更多推荐



所有评论(0)