@0xme66
云服务器能不能跑 Hermes 浏览器自动化? 昨天我录了个小视频,用 Hermes 的 /browser connect 直接连上我本地的 Chrome,然后让它自己去点赞推文。 本来就是试试看效果的,结果浏览量还挺高的,可能这个视频让很多人对ai能力更具像化了。 其实还是要感谢Hermes开发者@Teknium 的转推,哈哈。 看到评论区很多人提到:“能不能在云服务器上跑?”,说明大家的需求更多在云端。 我下午把官方文档仔细阅读了一下,发现 Hermes 的浏览器连接方式其实有好几种: Browserbase、Browser Use、Firecrawl、Camofox,还有本地 Chrome 通过 CDP 连,以及本地装个 agent-browser 再跑 Chromium。 不得不再一次夸一下Hermes的文档真清晰,它详细的给了一套完整的浏览器后端方案。你想本地玩、想云上跑,还是自己搭环境,都能接得上。 先说我视频里用的那个。就是官方说的 Local Chrome via CDP。 说白了,Hermes 就是通过google的这个协议开了一个浏览器窗口进行操作,当然你的模型本身能力也需要高一点,我用的是gpt-5.3-codex。 CLI 里敲 /browser connect,它默认连 ws://localhost:9222,你也可以手动填别的地址。连上之后,那些 browser_navigate、browser_click 之类的命令,就全砸在你这个活的 Chrome 上了。 文档里还专门提了,这个模式适合三种情况: 1.想实时看着 agent 在干嘛、 2.想直接用自己已有的 cookies 和登录状态, 3.或者……单纯不想花钱开云浏览器(我属于最后一种,嘿嘿)。 所以我那个视频能让人一下看懂,不是因为点赞行为有多牛,而是它把一件挺抽象的事拍得特别具体。 当然云服务器也跑,而且不止一种跑法。最省事的,其实不是把你本地 Chrome 硬搬到云上,而是直接用官方提到的云浏览器服务。 现在文档里主要写了三个:Browserbase、Browser Use、Firecrawl。 它们共同点就是——浏览器本身就在云上,你本地啥都不用开,Hermes 直接调用就行。官方还特意写了 “no local browser needed”。 如果你问我云服务器最推荐哪条,我第一反应还是这三个。 1. Browserbase 文档里排最前面,看起来也最稳(看了一下价格也挺贵的,不过有免费的版本可以先体验体验)。 官方链接:https://t.co/Icy9nFa67S 你在 ~/.hermes/.env 里配上 BROWSERBASE_API_KEY 和 BROWSERBASE_PROJECT_ID 就行了。它自带 stealth、住宅代理、自动解决验证码这些功能,用完 session 还会自动清理,超时就回收。 我感觉最适合下面这些人: 想把 Hermes 扔到 VPS 上长期挂着跑的,不想自己折腾浏览器环境的,目标网站比较敏感、容易被反爬的,或者想把浏览器这层也彻底外包出去、少操一份心的。 简单说,就是“我不想自己养浏览器,就想 Hermes 上了云立刻有东西能用”,那这条路最直接。 2.Browser Use 也是官方支持的云方案,配个 BROWSER_USE_API_KEY 就行。 官方链接:https://t.co/AXEHbezbV3 如果同时配了 Browserbase,它会优先走 Browserbase。适合本来就在用 Browser Use 的人,或者想多一个选项、先试试水的人。 3.Firecrawl 这个相对独特一点,它本身带抓取功能,适合你本来就想一边抓网页一边操作浏览器的情况。 配上FIRECRAWL_API_KEY,还能自托管。 如果你本来就在做数据抓取相关的事,这个接起来会比较自然。 官方链接:https://t.co/n7tzn5QpR8 说完云的,再说很多人脑子里第一个蹦出来的那个土办法:能不能在云服务器上自己起一个 Chrome,然后用 /browser connect ws://xxx 连过去? 理论上……是可以的。 文档里写得很清楚,/browser connect 支持连任意 ws 地址,不只是 localhost。但我个人觉得,这条路能走,但一般不建议当第一选择。为什么呢? 因为稍微复杂一点,不再是简单的“浏览器自动化”,而是变成: 远端 Chrome 怎么启动、端口怎么暴露、图形界面怎么搞、登录状态怎么保持等等。 本来你只是想偷个懒让 agent 帮你点点网页,结果最后可能从提效变成给自己找事儿干了,没有基本运维能力的就不要这么折腾了。 所以如果你真正想的是“把 Hermes 放云服务器上,稳稳地长期跑浏览器任务”,我还是建议优先看 Browserbase、Browser Use、Firecrawl 这几条专门做云路线的方案。它们本来就是为“浏览器不在本地”这个场景准备的。 Hermes 其实还留了两条不上云、也不直接接你当前 Chrome 的路: 1.Camofox 这是一个自己部署的 Node.js 服务,底层用的是 Camoufox(Firefox 的一个反指纹分支)。 配好 CAMOFOX_URL 之后,Hermes 会优先走它,还支持持久化 session、不同 profile 隔离,headed 模式下甚至能用 VNC 实时看。适合不想用云、想自己完全掌控环境、又特别在意反检测的人。 2.Local browser mode 是最简单的一种。你啥都不用配,也没有 connect,直接装个 agent-browser(npm install -g agent-browser),Hermes 就能调用本地的 Chromium。 适合不想上云、也不需要用你当前那个已登录 Chrome 的人。在自己机器上或者能控的远程服务器上先跑通,挺方便的。 最后简单总结一下吧: 想演示、想实时看着、想直接用自己登录态 → 用 /browser connect 接本地 Chrome(我视频里就是这个) 想扔云服务器上省心长期跑 → 优先 Browserbase / Browser Use / Firecrawl 想自己控环境、注重反检测 → Camofox 不想上云,但机器上想有个本地浏览器跑 → local browser mode + agent-browser AI 已经不是只会嘴上说说了,它开始真的会动手操作浏览器了。而Hermes让这变得更容易,如果能操作浏览器的话,那可玩的空间就很大了…… 最后奉上Hermes的官方文档:https://t.co/0S3Y53WmQU