列表页数据自动采集

所属栏目:演示站点一 更新时间:2023-04-23 点击: 文章来源:https://www.sznest.net/jzjc/0001/7573.html

第一步:添加采集规则有两种方式(二选一)

第一种方式:一步到位
1:点击caijisql这个文件复制里面的内容
2:点击SQL,点击添加SQL,将复制的内容粘贴到这里,然后点击提交

第二种方式:分步添加(点击图片下方蓝色文字可直接复制)

添加行业资迅采集规则
行业资迅采集规则
1:列表页默认页url:https://www.sznest.net/_mfmb/0001/xwzx/hyzx/
2:带参数的详情页url:https://www.sznest.net/_mfmb/0001/xwzx/idvalue.html
3:列表页循环体正则:/<div class="clear"></div></div><ul class="news_list mt20">(.*?)</ul><div class="clear"></div></div><div class="bg_foot" data-am-scrollspy/i
4:列表页循环体内id正则:/<li><span class="date">[0-9]{2}<em>[0-9]{4}-[0-9]{2}</em></span><div><a href="https://www.sznest.net/_mfmb/0001/xwzx/([a-z]{1,}/[0-9]{1,}).html" title="[^"]{1,}">[^<]{1,}</a>[^<]{1,}</div></li>/i
5:列表页循环体内标题正则:/<li><span class="date">[0-9]{2}<em>[0-9]{4}-[0-9]{2}</em></span><div><a href="https://www.sznest.net/_mfmb/0001/xwzx/[a-z]{1,}/[0-9]{1,}.html" title="([^"]{1,})">[^<]{1,}</a>[^<]{1,}</div></li>/i
6:详情页标签循环体正则:/</script>&nbsp;&nbsp;&nbsp;标签:(.*?)</div><div class="intro">/i
7:详情页标签循环体内文本正则:/<a href="[^"]{1,}">([^<]{1,})</a>&nbsp;&nbsp;&nbsp;/i
8:列表页循环体内简介正则:/<li><span class="date">[0-9]{2}<em>[0-9]{4}-[0-9]{2}</em></span><div><a href="https://www.sznest.net/_mfmb/0001/xwzx/[a-z]{1,}/[0-9]{1,}.html" title="[^"]{1,}">[^<]{1,}</a>([^<]{1,})</div></li>/i
9:详情页时间正则:/<div class="info">日期:([0-9-]{1,}) 人气:/i
10:详情页详情正则:/<div class="intro">(.*?)<div class="clear"></div></div><div class="other">/i

添加公司动态采集规则
1:将行业资迅的采集规则复制给公司动态
2:修改公司动态的列表页url默认页:https://www.sznest.net/_mfmb/0001/xwzx/gsdt/

添加生活家电采集规则
生活家电采集规则
1:列表页默认页url:https://www.sznest.net/_mfmb/0001/cpzs/shjd/
2:带参数的详情页url:https://www.sznest.net/_mfmb/0001/cpzs/idvalue.html
3:列表页循环体正则:/<div class="home_pro"><ul id="home_pro_ul">(.*?)</ul><div class="clear"></div></div></div><div class="bg_foot" data-am-scrollspy=/i
4:列表页循环体内id正则:/<li><a href="https://www.sznest.net/_mfmb/0001/cpzs/([a-z]{1,}/[0-9]{1,}).html" title="[^"]{1,}"><div><img src="[^"]{1,}" alt="[^"]{1,}" height="279"></div><p class="title">[^<]{1,}</p></a></li>/i
5:列表页循环体内标题正则:/<li><a href="https://www.sznest.net/_mfmb/0001/cpzs/[a-z]{1,}/[0-9]{1,}.html" title="([^"]{1,})"><div><img src="[^"]{1,}" alt="[^"]{1,}" height="279"></div><p class="title">[^<]{1,}</p></a></li>/i
6:列表页循环体内图片正则:/<li><a href="https://www.sznest.net/_mfmb/0001/cpzs/[a-z]{1,}/[0-9]{1,}.html" title="[^"]{1,}"><div><img src="([^"]{1,})" alt="[^"]{1,}" height="279"></div><p class="title">[^<]{1,}</p></a></li>/i
7:详情页简介正则:/<div class="right"><h1>[^<]{1,}</h1><hr><h5>([^<]{1,})</h5><hr><ul class="attribute">/i
8:详情页时间正则:/<li id="date"><em>日期:</em>([0-9-]{1,})</li>/i
9:详情页属性循环体正则:/</h5><hr><ul class="attribute">(.*?)<li id="date"><em>日期:</em>/i   
10:详情页属性循环体内属性名正则:/<li><em>([^:]{1,}):</em>[^<]{1,}</li>/i
11:详情页属性循环体内属性值正则:/<li><em>[^:]{1,}:</em>([^<]{1,})</li>/i
12:详情页相册循环体正则:/<div class="thumb_pic">(.*?)</div></div><div class="right">/i
13:详情页相册循环体内路径正则:/<li><img src="([^"]{1,})" data-url="[^"]{1,}" alt="" width="60" height="60"></li>/i
14:详情页详情正则:/<div class="intro" id="con_one_1">(.*?)</div></div><div class="clear"></div></div></div><div class="bg_foot" data-am-scrollspy=/i

添加智能家电采集规则
1:将生活家电的采集规则复制给智能家电
2:修改智能家电的列表页url默认页:https://www.sznest.net/_mfmb/0001/cpzs/znjd/
3:清空详情页属性循环体正则、详情页属性循环体内属性名正则、详情页属性循环体内属性值正则(因为智能家电没有属性)

添加客户案例采集规则
客户案例采集规则
1:列表页默认页url:https://www.sznest.net/_mfmb/0001/khal/
2:带参数的列表页url:https://www.sznest.net/_mfmb/0001/khal/index_endpage.html
3:带参数的详情页url:https://www.sznest.net/_mfmb/0001/khal/idvalue.html
4:列表页循环体正则:/<div class="list_pic"><ul id="list_pic_ul">(.*?)/ul><div class="clear"></div></div></div><div class="bg_foot"/i
5:列表页循环体内id正则:/<li><a href="https://www.sznest.net/_mfmb/0001/khal/([0-9]{1,}).html" title="[^"]{1,}"><div><img src="[^"]{1,}" alt="[^"]{1,}" height="200"></div><p class="title">[^<]{1,}</p></a></li>/i
6:列表页循环体内标题正则:/<li><a href="https://www.sznest.net/_mfmb/0001/khal/[0-9]{1,}.html" title="([^"]{1,})"><div><img src="[^"]{1,}" alt="[^"]{1,}" height="200"></div><p class="title">[^<]{1,}</p></a></li>/i
7:列表页循环体内图片正则:/<li><a href="https://www.sznest.net/_mfmb/0001/khal/[0-9]{1,}.html" title="[^"]{1,}"><div><img src="([^"]{1,})" alt="[^"]{1,}" height="200"></div><p class="title">[^<]{1,}</p></a></li>/i
8:详情页时间正则:/<div class="news_show"><h1>[^<]{1,}</h1><div class="info">日期:([0-9]{4}-[0-9]{2}-[0-9]{2}) 人气/i
9:详情页详情正则:/</script></div><div class="intro">(.*?)<div class="clear"></div></div><div class="other">/i

第二步:添加完规则之后,接下来进入采集规则列表页面,然后点击开始采集就可以了

第三步:全部采集完成之后,还需要进入新闻中心、产品展示、客户案例三个节点的采集记录页面中去批量审核

相关阅读

第一集:初始化、登录后台、搭建网站节点框架

一:点击http://mfmb0001.sznest.net/admin/init.php这个链接初始化服务器上的网站数据二:登录后台登录地址:http://mfmb0001.sznest.net/admin/登录账号:手机与密码全填写13798214959初始化成功之后进入后台你将能看到左侧的“管理信息”只有一个首页在顶部依次点击以下的菜单1:配置1.1:…

了解详情 >>

第二集:采集PC站与手机站的网站资源

一:什么是网站资源?所谓网站的资源是指以下的几种文件1:网页文件2:样式文件,简称css文件3:javascript文件,简称js文件4:图片、视频、字体文件二:采集到的网站资源会保存到哪些目录里?1:/html/存放网页文件2:/_backup/html/css/存放css文件3:/_backup/html/js/存放js文件4:/_backup/_upl…

了解详情 >>

第三集:手动添加数据

一:添加公司简介与企业文化,见下图二:添加联系我们,见下图(下图的源代码是&lt;iframesrc=&quot;/html/baidumap.php&quot;width=&quot;100%&quot;height=&quot;400&quot;frameborder=&quot;0&quot;&gt;&lt;/iframe&gt;点击左侧蓝色文字可复制…

了解详情 >>

第四集:获取PC站公共部分的代码、格式化及修改代码

一:点击备份下的/html/目录备份,会自动将当前目录压缩到网站的/_backup/zip/下二:将压缩的备份文件下载到本地电脑的D盘并且解压到D盘(这里为了演示方便,我就直接下载到D盘的根目录下)三:点击打开解压的文件夹一层一层进入直到找到html文件夹,然后移到D盘四:打开html文件夹,里面有以下的原始文件1:baidumap.php这个是百度地图的网…

了解详情 >>

第五集:获取手机站公共部分的代码、格式化及修改代码

一:点击备份下的/wap/目录备份,会自动将当前目录压缩到网站的/_backup/zip/下二:将压缩的备份文件下载到本地电脑的D盘并且解压到D盘三:点击解压的文件夹一层一层进入直到找到wap文件夹,然后移到D盘四:创建搜索文件,在wap文件夹中复制bodytop.php或者bodyfoot.php中的任意一个文件,改名为search.php五:新建站点1:…

了解详情 >>

怎么免费给自己建网站?

第一步,下载所需要的文件1:下载免费后台压缩包(后台压缩包含两个文件夹)将其解压到根目录下,下载地址:后台.zip1.1:_admin是用于存放后台的样式,JS,及百度编辑器1.1:admin是存放后台脚本文件2:下载免费前台压缩包(包含二个文件,三个文件夹)将其解压到根目录下,前台压缩包去官网首页找免费模板去下载2.1:index.php这个是首页文件)2…

了解详情 >>

Copyright @ 2008-2019   www.sznest.net   All rights reserved  网巢网是一家专业为企业提供免费建站、自助建站的模板建站公司     友情链接:香港张元洪律师行   

微信

移动端

客服

顶部