基础教程3单页数据所有信息采集

应用场景描述:提取京东第一页所有产品标题(单重循环)

第一步:从项目列表点击进入项目详情界面→去编辑爬虫规则→添加步骤→打开网页→输入 https://list.jd.com/list.html?cat=1713,12775,12779→勾选“当前页面加载完成后滚动”,设置滚动次数为3,滚动间隔为2秒,滚动方式为一次滚动一屏→确定

第二步:添加步骤→添加循环→不固定元素列表→获取选择框→点击第一个网页元素→选中第一个商品→调整扩大范围按钮直至阴影选中整个商品

第三步:点击第二个网页元素→选中第二个商品→调整扩大范围按钮直至阴影选中整个商品→确定



第四步:双击左边项目详情列表中“提取数据”→添加→点击网页元素→选中列表第一个产品的标题→双击修改字段名为书名→调整执行前等待2秒→确定

第五步:保存→启动→运行→提取完毕→导出数据