
我们用go007这个分类信息平台做个例子吧。先看一下一天内它的网站收录情况怎么样,太少了,我们也不值得去发。
从第二截图可以看出来此时此刻这个平台一天内收录的数量就是7页。我们看看这个平台栏目收录的大致规律是什么。把这个平台这7个页面的收录链接都采集出来,或复制出来。
像这样整理出来,看一下规律。小编用EXCEL分类汇总了一下,结果显示在为数不多(目前只有7页)的这几个栏目,对分类信息也就说这几个地区的收录明显好于其他地方。
看一下右边,这几个地区出现的次数,所有数据里出现频次最高的,也就是目前收录数据里,该地区该栏目的收录效果最好,你选择栏目的时候可以参考这个数据。
栏目分类比较多,地区分了之后,细分下还有各品类,比如招商,教育,五金,房产,二手,求职,宠物,餐饮等,如果想做细致一点,看起来也不是眨眼就能洞穿的。
这样准确不准确,这么简单?这样不准确。因为小编只抽取了当天之内的70个数据进行测算,而这个采集的样本应该至少应该上千条吧,时间跨度也应该多几天。思路就是这样的,很简单,但是需要你动手做。