基础教程2多页数据信息采集

应用场景描述:网站搜索产品,循环点击下一页,提取每一页产品的第一个标题(单重循环)

第一步:从项目列表点击进入项目详情界面→去编辑爬虫规则

第二步:添加步骤→打开网页→输入https://list.jd.com/list.html?cat=1713,12775,12779→勾选“当前页面加载完成后滚动”,设置滚动次数为3,滚动间隔为2秒,滚动方式为一次滚动一屏→确定

第三步:添加步骤→添加循环→单个元素→获取元素→点击网页元素→选中京东网页中的“下一页”按钮→确定

第四步:单击左侧项目详情列表中“循环”下的子按钮“添加”→提取数据→添加→点击网页元素→选中列表第一个产品的标题→确定

第五步:修改字段名为“书名”→调整执行前等待为2秒→确定

第六步:将提取数据步骤上移→保存→启动→运行→提取完毕→导出数据