Robots在SEO中的作用

分享时间:2020-11-20
      搜索引擎爬取之前都会遵循一个协议就是robots协议,其实很简单的理解就是网站有个管家,并不是搜索引擎随便就能抓取的,需要允许才能抓取。

    1.jpeg   

    搜索引擎在访问一个网站时,首先会检查该网站的根域名下是否有一个叫robots.txt的纯文本,这个文件用于指定搜索引擎在网站上的抓取范围。因为很多网站的部分页面是存在隐私或者是敏感内容的,所以需要告诉搜索引擎蜘蛛网站中的哪些页面不允许抓取。

  Robot指令有哪些?

  User-agent: 此指令定义了此指令下面的内容对哪些蜘蛛有效。默认所有蜘蛛都允许抓取,如果此指令指定了特定的蜘蛛,那么此指令下跟的内容就对特定蜘蛛有效。

  Disallow: 此指令定义了禁止蜘蛛抓取哪些页面,有些人可能认为,做网站当然都希望被抓取了。错,如果是后台或是隐私文件,相信谁都不愿意被抓取的。

  Allow: 此指令定义了允许蜘蛛抓些哪些内容,如果是某些内容允许,其它全部拒绝,则可以用这个指令,大多数网站只用到禁止指令。

  Sitemap:就是我们常说的网站地图了,把站点地图放在Robots下面,可以方便蜘蛛直接在访问Robots时就访问到你的地图位置。

  二、robots的作用

  1、屏蔽死链接

  许多时候,我们网站会产生死链接,那么这个时候我们就需要通过robots来屏蔽这些死链接。

  我们可以通过下载网站日志来查看我们的404页面,用txt打开网站日志,通过搜索“404”,如果你网站有404页面,并且被访问到了,那么这个时候就会被网站日志给记录。此外还可以通过百度站长平台来查找404页面。

  2、屏蔽无价值的页面

  许多网站都有一些没有价值的页面,比如说SEO指导中心的用户个人中心页面,这个个人中心页面不会对网站产生价值,在百度上面的展现也不会给网站带来权重。因此我们需要利用robots来屏蔽这样的页面。又比如说:一个企业网站的联系我们页面,这种页面不会给网站带来权重,用户也不会去搜索“联系我们”来找他想要的产品。因此我们需要把这种页面同时屏蔽。

  3、屏蔽重复路径

  当你网站出现重复路径的时候,百度将会对我们的网站进行直接降分,比如说:一个网站做了伪静态,同时他的动态页面也可以访问,这个时候就会出现重复路径。因此我们需要通过robots屏蔽这些重复路径。

  也许很多人都不知道,许多细节都很有可能是你网站排名不上的原因,而这些小小的细节往往被大家给忽略了。所以站长在做网站优化的时候要多多关注一些网站细节的问题。


本文地址:http://www.aizhanku.com/t55410

本文标签:

 
 
 
《手游变态盒子》破解版本下载
                     
手游公益服盒子
点击下载领取新版本礼包 高速下载获取更多活动福利

需优先下载游戏盒子

    返回顶部