搜索引擎優化優化中robots一般用于站長約束搜索引擎拜訪頁面,所以說robots是網站跟搜索引擎爬蟲間的協議,一般站長經過txt文本方法告訴搜索引擎爬蟲被答應的權限,一般只需在根域項目錄下,未設置目錄拜訪權限的文件爬蟲都可以抓取的到,假設網站跟搜索引擎之間沒有協議,將使不行預知的很多信息走漏到網上,這不是雙方愿意看到的。
robots作用是什么:
1.假設網站改版了,整個文件夾都沒有了的時分,這個情況下就要思索屏蔽掉整個文件夾。咱們可以運用robots來對這整個的文件夾中止屏蔽,例如網站里的ab文件夾因改版全都給刪掉了,這個時分就可以這姿態設置:
User-agent: *
Disallow: /ab/
2.可以使用各種通配符對網站中止相對應的分配,例如我不想網站抓取我的一切圖片,這個時分就可以運用$來中止設置。一般咱們常見的圖片的格局是BMP?.jpg-w600、GIF、JPEG等格局。這個時分設置便是:
User-agent: *
Disallow: /.bmp$
Disallow: /.jpg-w600$
Disallow: /.gif-w600$
Disallow: /.jpeg-w600$
3.假設你只想某一個搜索引擎抓取你的信息,這個時分就可以用robots中止設置,例如:我只想我的網站被百度這個錄入,而不想被別的搜索引擎錄入。就可以使用robots中止設置。
User-agent: Baiduspider
Allow:
User-agent: *
Disallow: /
4.還可以使用*來屏蔽掉相關的URL,有些網站不答應搜索引擎抓取動態地址的時分可以使用這個*通配符來中止匹配設置。一般情況下動態URL的有一個特性便是有“?”這個時分咱們就可以使用這個特性來中止匹配的屏蔽:
User-agent: *
Disallow: /*?*
5.屏蔽一切的搜索引擎抓取信息,假設你的網站僅僅你的私密性的網站,不想太多的人知道的話,可以使用robots屏蔽掉一切的搜索引擎,例如你寫的私家博客。你就可以把搜索引擎全都屏蔽掉。
robots與nofollow有哪些區別
robots文件是在根目錄中的一個txt文本文件,里面用代碼句子告訴蜘蛛什么可以抓取,什么不能抓取,從一初步就告訴了蜘蛛:“我有些東西不能讓你看,請你主動繞開。”而nofollow特點的鏈接,意義是告訴蜘蛛這個鏈接你可以看看,可是跟我網站無關,不要給這個鏈接權重,這是比較直觀的說法。
說得更粗淺點robots一初步就告訴蜘蛛咱們什么鏈接不要去抓取,而關于nofollow標簽來說,他無法儉省咱們的蜘蛛資源,銜接中加了nofollow標簽,蜘蛛還是會抓取這個鏈接,僅僅不傳送權重,也便是咱們的網站不對這個鏈接傳送權重。
業務咨詢微信
今日已有165人獲取方案