深圳易捷网络科技注册咨询网-jiujiuya.com.cn 返回首页

深圳seo教你玩转robots协议

信息来源:深圳市易捷网络科技有限公司
信息发布时间:2018-9-30 16:41:29

robots爬虫协议,相信很多SEOer或个人站长都不会感到陌生,即使刚入行的SEO小白也略有耳闻。对于SEO小白来说,只是听过robots爬虫协议并不了解robots协议真正意义和用法。今天深圳seo就来带大家一探究竟,并教你玩转robots协议。


什么是robots协议
robots(中文翻译为机器人),robots协议即搜索引擎爬虫协议,它是搜索引擎爬虫与网站站点沟通的“桥梁”。网站站点通过robots文件中的声明规则明确告知搜索引擎爬虫哪些文件/目录可以抓取,哪些文件/目录不可以抓取。
注意:如果网站站点存在不希望搜索引擎爬虫抓取收录的内容是,才有必要创建robots.txt文件;如果您希望搜索引擎收录网站上所有内容,则无需建立robots.txt文件。
robots.txt文件的存放位置
通常,网站的robots.txt文件放置在网站根目录下,便于搜索引擎爬虫****时间抓取该文件。
robots.txt文件格式
1、robots文件通常包含以一条或多条User-agent开始,后面加上若干条Disallow或Allow。
2、User-agent:用来描述搜索引擎robot的名字。
3、如果存在多条User-agent记录说明有多个robot会受到"robots.txt"的限制,至少要有一条User-agent记录。
4、如果User-agent的值设为*,则对任何robot均有效,且"User-agent:*"这样的记录只能有一条。
5、如果有"User-agent:SomeBot"和若干Disallow、Allow行,那么搜索引擎爬虫名为"SomeBot"只受到"User-agent:SomeBot"后面的Disallow和Allow行的限制。
6、Disallow:用来描述不希望被访问的一组URL。
7、这个值可以是一条完整的路径,也可以是路径的非****缀,以Disallow项的值开头的URL不会被robot访问。
8、比如:"Disallow:/help"这条规则表示的是禁止robot访问/help.html、/helpabc.html、/help/index.html等。
9、比如:"Disallow:/help/"这条规则表示的是允许robot访问/help.html、/helpabc.html,不能访问/help/index.html。
10、"Disallow:"说明允许robot访问该网站的所有url,robots.txt文件中,至少要有一条Disallow记录。
11、如果网站根目录下robots.txt不存在或者为空文件,则对于所有的搜索引擎爬虫来说,该网站都是开放的。
12、Allow:用来描述希望被访问的一组URL。
13、与Disallow项相似,这个值可以是一条完整的路径,也可以是路径的前缀,以Allow项的值开头的URL是允许robot访问的。
14、比如:"Allow:/hibaidu"这条规则表示的是允许robot访问/hibaidu.htm、/hibaiducom.html、/hibaidu/com.html。一个网站的所有URL默认是Allow的,所以Allow通常与Disallow搭配使用,实现允许访问一部分网页同时禁止访问其它所有URL的功能。
15、使用"*"and"$":Baiduspider支持使用通配符"*"和"$"来模糊匹配url("*"匹配0或多个任意字符,"$"匹配行结束符)。
深圳SEO如何玩转robots协议
1、禁止所有搜索引擎爬虫访问网站的任何内容
User-agent:*
Disallow:/

2、允许所有搜索引擎爬虫访问网站的任何内容
User-agent:*
Allow:/
3、仅禁止baidu搜索引擎爬虫访问网站的任何内容
User-agent:Baiduspider
Disallow:/
User-agent:*
Allow:/
4、仅允许baidu搜索引擎爬虫访问网站的任何内容
User-agent:Baiduspider
Allow:/
User-agent:*
Disallow:/
5、仅允许baidu及google爬虫访问网站的任何内容
User-agent:Baiduspider
Allow:/
User-agent:Googlebot
Allow:/
User-agent:*
Disallow:/
6、仅允许baidu及360搜索引擎爬虫访问网站内容,并且禁止抓取所有图片和php网页内容
User-agent:Baiduspider
Allow:/
Disallow:/*.jpg$
Disallow:/*.jpeg$
Disallow:/*.png$
Disallow:/*.gif$
Disallow:/*.bmp$
Disallow:/*.php$
User-agent:360Spider
Allow:/
Disallow:/*.jpg$
Disallow:/*.jpeg$
Disallow:/*.png$
Disallow:/*.gif$
Disallow:/*.bmp$
Disallow:/*.php$
User-agent:*
Disallow:/
其他的robots爬虫协议规则,深圳seo就不在这里给大家一一举例了。大家可以自己去练习并理解,robots爬虫协议也是很重要的。

相关行业资讯

1、HTML代码书写不要成为网站设计中短板
2、2898站长资源平台微博、微信广告业务上线
3、行业网站制作的常见问题
4、网站被降权应该怎么处理?
5、seo优化怎么做可以助力网站更快上首页?
6、网站内容更新的技巧和方法
7、手机网站建设销售模块
8、网站推广策划怎样做最好?
9、企业网站优化怎么从构造方面着手?
10、换个角度看网站建设的最终目的!
11、公司SEO优化提升应从什么视角出发?
12、养成习惯保证百度快照天天更新
13、企业第一回做网站需要了解些什么
14、网站建设的性能测试
15、阿里云如何备案
16、大学生创业:如何通过个人博客取得成功
17、搜索引擎优化必须具备的“4P”品质
18、几百元在深圳做网站之攻略篇
19、网站设计提高网页速度的技巧
20、网站制作怎样设计有利于优化
21、网站流量下降的原因
22、两手抓两手都要硬网站建设要走内外结合之路
23、新网站出现哪些情况网站不容易收录
24、搜索引擎的搜索机制
25、网站推广的时候怎么获得外部链接
26、教您如何做外贸SEO
27、个人博主如何避免运营博客的“7年之痒”
28、搜索引擎眼中的原创文章
29、网站建设中视觉设计的6大要素
30、内容重复度是导致网站降权的慢性病
31、网站关键词排名提升技巧
32、网站设计中潜在语义索引是什么意思
33、网站设计师如何在人群中脱颖而出
34、天猫应该如何运营和推广
35、优化网站究竟要注意什么?
36、谈一谈做SEO优化的核心是什么?
37、用户行为会影响SEO排名么
38、一个成功的推广专员应具备哪些能力
39、如何让网站流量暴涨
40、目前SEM投放有什么问题要注意
41、蜘蛛抓取网页过程的4步曲,及网站优化技巧
42、浅谈2018年GoogleSEO
43、网站运营我们需要足够的耐心
44、如何解决及避免网站上的图像版权侵权
45、整站优化教程
46、企业建网站冷暖色的对比
47、网络推广的误区有哪些?
48、如何寻找高质量的外链?
49、网站优化要避免那些不好因素
50、“善事先利器”选好竞品词网站排名升得快

相关视频推荐

自动化行业网站制作焊锡机/点胶机/螺丝机网站
企业网站制作新模式全部仅需800元/年
如何提高企叫网站打开速度
公司网站到期了该怎小续费
企业为什么必须要做一网站
企业网站的导航栏一般要规划哪些栏目
国际物流FBA物流网站建设深圳易捷网站公司公司
银制品金银器网站建设深圳易捷网站公司
包装印刷行业网站设计
膜结构公司网站设计
工商财务公司网站设计
购买一个域名需要多少钱
企业网站建设云虚拟主机需要多少钱
财务公言的网站怎么做才能显示在搜索引擎的首页
网站建设一站式服务
深圳网站建设公司网站排行榜
深圳市易捷网络科技有限公司版权所有     粤ICP备2022153140号
best smoke alarms australia |  vape detectors