browser-use
1 介绍
- 原理:基于 Langchain 开发
- 方法:可以在 Python 程序中调用,或通过脚本使用
- 运行:运行后,会自动打开浏览器,并进行搜索等操作获得结果
- 用途:适用于获取实时信息,例如股价、天气等
- 源码地址: https://github.com/browser-use/browser-use
- 代码分析:以 Python 为主,目前 5000+ 代码
2 用法
2.1 使用 venv 虚拟环境
1 | sudo apt install python3.12-venv |
2.2 安装 browser-use
1 | pip install browser-use |
2.3 运行 demo
1 | # test_browser_use.py |
3 原理
旨在让大型语言模型(LLM)能够像人类一样自然地浏览和操作网页。
Browser Use 利用浏览器自动化工具(如 Playwright),通过其提供的 API 与浏览器建立连接,发送指令以控制浏览器的行为,例如打开网页、点击按钮、输入文本等。
4 用后感
- 喜欢的地方:
- 不再需要知道 API 是由谁提供的,或是怎么用的。理论上,只要是能在网上查到的,都可以直接用来进行交互。
- 不喜欢的地方:
- 不能用 Docker 部署
- 依赖浏览器
5 参考文档
- 用法介绍:https://blog.csdn.net/2301_78677192/article/details/145083954
- 视频介绍:【开源工具】Browser Use开源项目:单提示控制浏览器
- 网页介绍:Browser Use - 让 AI 像人类一样浏览网页
All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.