想找满足这 5 个特性的低代码爬虫
方便获取稳定的 selector 。最好可以在页面上直接选取元素,获得 selector 。
准确提取 data 。可以解析常见数据类型,如提取文本数字。也可以自定义解析脚本。
存储到指定的位置。将上述的 data 与 db 对应起来,最好可以用连线的方式,可视化的编辑 1 对 1 的关系。
构建循环的流程。爬虫一般都有循环结构,要能简单方便的构建流程,例如简单的逻辑不需要写代码。
异常的处理。如果采集过程中出错,要能够指定后续的流程。是返回上一级,还是抛出异常,还是加入到队列。
想请问常用爬虫工具的 v 友,有没有满足这些条件的低代码爬虫工具呢?
chrome 商店搜一下
火车头?
这不是最基本的需求吗😂虽然没几个做的好的。只能自己写脚本。
火车头,八爪鱼
熟悉 python 就 scrapy
github.com/ferventdesert/Hawk可以试试这个开源的,前几年用过,也确实解决了我当时的问题。虽然可视化配置,但使用上有一点门槛,需要摸索一下
八爪鱼
火车浏览器
要在浏览器上还是脱离浏览器在服务端后台运行?
#9如果要写数据库,应该是需要脱离浏览器。如果能在浏览器中写入数据库也可以,不过这种应该还需要通过 webapi 接口。感谢上面各位 v 友的回复,我去看一下提到的软件。
影刀
github.com/huginn/huginn楼主看看这个
爬虫 自己内部用数据还是做网站用?小心被告
不该先考虑反爬和风控?
这么多年了,还是火车头最好用,我找到一个免费的
来个免费的 大佬。
easyspider ?之前看到了,不过没用过
百度搜索一下高铁采集(本质就是火车头的 vvvip )
www.automa.site/这个可以说非常符合
automa 或者 rpa? 我在闲鱼上有做脚本的链接,做过几单
手机只有单卡,带两个手机又太麻烦,趁国庆有空写了个程序转发短信和未接来电。 已经用 Github Action 自动编译成 apk 了,下载安卓即用,干净,安全。 githu…
某DBA在查看自己的数库日志的时候,看到了数据库服务器上出现了很多很怪异的SQL的Where条件语句,是下面这个样子:(所有的where语句前都有了一个叫“1=1”的子条件)呵…
我们的号用了几年了,前两天突然被封,说是滥用 raw 外链,我们只是放了些几 KB 的 app 的配置文件在仓库,不是用来做图床的,问客服直接说没权限解决,企业群的客服也直接说…