什么是黑名单页面呢?简而言之就是那些内容质量很好的页面,但是一直没有被百度收录,一个网站不可能做到百分百的收录率,可一些内容质量好的页面不收录,总是感觉很可惜。这样的情况我们在做优化的时候经常碰到,可以说几乎每个站点都有一些所谓的黑名单页面,比较典型的例子:一个权重很高的大型网站,几篇原创内容的内页,百度蜘蛛也正常爬取过,但就是不收录,当然一些小站中这样的页面就更多了。那么如何才能让这些页面重新被收录呢?或者说如何才能让整站的收录率上去呢?下面先来分析下百度为何不收录那些质量很高的页面?笔者总结为以下几个因素:
第一个因素就是网站的整体权重,这点是显而易见的,网站权重高一般情况下收录的页面就多,当然一个大型网站的会遇到收录瓶颈,百度对一个网站的收录量是有限的,当到达一定收录量以后,再继续收录页面就比较困难了。网站权重高的大型网站,即便是转载其他站点的文章,同样也会被大量的收录,而一些小站即便是原创,有时候也很难收录,尤其是当小站上的内容被大站转载后。第二个因素就是站内结构做的不好,比方说URL不标准,URL中包含太长的参数等,第三个因素是某些页面蜘蛛爬行的次数太少,缺乏更多的入口,换句话说就是要做给蜘蛛创造些入口链接,可以做一些高质量的链接。第四个因素是某些内页给百度的第一次印象太差,需要吸引百度蜘蛛重新去爬行、抓取,搞清楚百度长期不收录的原因,接下来就可以着手解决了。
第一:给黑名单页面URL增加更多的蜘蛛入口
站内布局好内部链接,站外需要做更多的外链,两者方法去增加更多的百度蜘蛛入口,同时也是提升内页的权重,权重变高了,被收录的几率就越大,不过对于一些大型网站来说,要做到这点难度是非常大的。要多给那些黑名单页面一些内部链接,与这些页面相关的页面都可以互相链接,内部链接的作用对于权重来说,可能不太重要。毕竟内部链接不算是别人的投票,至于外部链接的作用应该是很明显的,这些黑名单页面不能靠自然的收录,例如可以给这些URL一些高质量的友情链接,或者其他类型的外部链接,吸引百度蜘蛛去爬行这些URL。这是我们常用的方法,除此之外将URL直接提交给百度也行,不过有时候感觉效果太慢了。
第二:修改黑名单页面的内容,包括HTML源文件
页面质量低不被百度收录是很正常的,黑名单页面都是一些质量不错的页面,不知道什么何原因这些页面给百度的第一印象太差,之后百度就弃之不顾了。想要百度重新认可这些页面,那最好还是改头换面一次吗,对这些内容进行修改或者干脆重写,当然还有页面的HTML源文件,其实也可以去尝试修改下。除此之外页面的标题、关键词、描述,这些信息也要去修改和完善,这样百度就会重新审核那些黑名单的页面,自然也有可能重新收录这些页面。或者可以先删除这些黑名单的页面,反正这些页面也没有被收录,然后再重新创建一个内容页面,这样其实就是自己重新删除黑名单页面。
第三:确保URL符合标准,降低整站页面相似度
URL不标准是导致页面不收录的一个重要因素,所以我们在做优化的时候必须注意这点,一般在中小企业站上常会碰到这样的情况,说实话不太容易修改,最好在做站的时候避免一下。尽量采用静态页面,即便是动态页面也不要有很长的参数,查看下自己的那些黑名单页面是不是URL不太规范。还有一点就是页面相似度的问题,通常可以通过调整页面显示的内容来避免页面相似度过高,不过很多情况下SEO人员没有权利去修改页面的模板,毕竟网站不能为SEO而生存,电商类站点更看重的页面用户体验和转化率。没办法只能去和其他部门协调一下了!以上笔者总结了几种方法,其实没有什么创新的东西,只是在操作的时候很难做到最完美的境界。