Selenium 和 RSSHub 看起来不是一类工具,但它们都常出现在“自动化获取页面内容”这个场景里。整理时要把自动化测试、内容订阅、本地服务和合规边界分开。
Selenium 适合什么
Selenium 适合浏览器自动化场景,例如:
- 页面功能测试。
- 表单流程验证。
- 浏览器兼容性检查。
- 截图。
- 简单页面操作回放。
- 登录后页面的人工辅助验证。
它的优势是接近真实浏览器环境,缺点是慢、脆弱、依赖页面结构。
Selenium 不适合什么
不建议把 Selenium 当成万能采集器。
如果只是调用公开接口,直接用 HTTP 客户端更稳定;如果只是解析静态 HTML,普通解析库更轻;如果目标站点明确禁止自动化抓取,就应该停止。
公开资料里只记录测试和合法自动化使用场景,不写绕过限制、规避风控或批量冲量方法。
RSSHub 的定位
RSSHub 适合把一些公开页面转换成订阅源,方便聚合阅读。
整理 RSSHub 资料时可以记录:
- 部署方式。
- 本地端口。
- 路由格式。
- 常用订阅源。
- 更新频率。
- 缓存策略。
- 失败排查。
如果只是本地自用,记录本地入口即可;如果对外暴露,要补鉴权、限流和日志策略。
本地服务边界
很多工具一开始只是本机跑一跑,后来可能被长期使用。
这时要补几件事:
- 端口是否固定。
- 是否需要开机启动。
- 日志放在哪里。
- 数据是否持久化。
- 是否对外暴露。
- 是否需要代理。
- 是否有升级记录。
本地服务如果没有边界,过一段时间就会变成“谁也不知道为什么在跑”的进程。
维护建议
Selenium 和 RSSHub 资料可以按场景拆:
- 浏览器自动化测试。
- 页面截图和验证。
- RSSHub 本地部署。
- 订阅源维护。
- 本地服务运行边界。
这样整理后,工具不只是链接和命令,而是能放进自己的内容自动化和测试流程里。
正文完




