数据分析交流吧 关注:21贴子:97
  • 3回复贴,共1

【推荐】傻瓜式爬虫软件——八爪鱼

只看楼主收藏回复

八爪鱼的出现,对于爬虫爱好者来说喜忧参半。
喜的往往是初学者,通过点击式操作即可实现数据的采集,降低了掌握爬虫技术的门槛;忧的是懂一些爬虫技术的人,辛苦学来的代码可能还不如做好的模板使用的效率更高。
当然八爪鱼也有局限,例如模板更新慢,可爬取的字段与方式较为有限,以及收费等,爬虫的高级用户可以无视这个软件。
这里仅简单介绍一下这个软件的功能,给爬虫入门者多一个工具参考。
爬虫的原理,是“可见即可爬”,翻译给业务人员,就是将网站信息整理成结构化数据,相当于拓展了外部数据源,可以用来做舆情趋势监控等等

可爬取的网站,包括百度、淘宝、天猫、京东、豆瓣、微博、bilibili等;知乎的反爬措施非常高级,八爪鱼暂时没有提供爬去的模板

八爪鱼的采集模式有两种,简易模式和自定义模式,可爬取的字段与模式、模板对应
八爪鱼官网提供了操作教程,有需要的同学可以参考链接进一步了解了


IP属地:北京1楼2019-02-01 12:04回复
    怎么下载使用


    来自iPhone客户端2楼2019-03-05 20:06
    回复
      2025-08-12 05:24:28
      广告
      不感兴趣
      开通SVIP免广告
      总是出错,垃圾,


      IP属地:河南来自Android客户端4楼2021-12-17 03:26
      回复
        可以爬运满满之类的物流网站吗?


        IP属地:河北来自iPhone客户端5楼2022-09-13 23:50
        回复