定向爬虫是网络爬虫的一种。
定向爬虫可以精准的获取目标站点信息。
定向爬虫获取信息,配上手工或者自动的模版进行信息匹配,将信息进行格式化分析存储。
优势:
基于模版的信息提取技术,能提供更加精准的信息。比如价格,房屋面积,时间,职位,公司名等等。
劣势:
目标网站难以大面积覆盖,因为基于模版匹配的信息提取技术,需要人工的参与配置模版,欲要大面积覆盖各个目标网站,需要大量的人力成本,同样维护模板也需要很大的人力成本。
笑话军事旅游美容女性百态母婴家电游戏互联网财经美女干货家饰健康探索资源娱乐学院 数码美食景区养生手机购车首饰美妆装修情感篇厨房科普动物植物编程百科知道汽车珠宝 健康评测品位娱乐居家情感星座服饰美体奢侈品美容达人亲子图库折扣生活美食花嫁风景 | 首页 |
定向爬虫是网络爬虫的一种。
定向爬虫可以精准的获取目标站点信息。
定向爬虫获取信息,配上手工或者自动的模版进行信息匹配,将信息进行格式化分析存储。
优势:
基于模版的信息提取技术,能提供更加精准的信息。比如价格,房屋面积,时间,职位,公司名等等。
劣势:
目标网站难以大面积覆盖,因为基于模版匹配的信息提取技术,需要人工的参与配置模版,欲要大面积覆盖各个目标网站,需要大量的人力成本,同样维护模板也需要很大的人力成本。