忘记密码?

一键登录

草根吧源码论坛

Discuz论坛robots爬虫协议正确写法与实操经验分享

查看: 154|回复: 0

Discuz论坛robots爬虫协议正确写法与实操经验分享

[复制链接]

1725

主题

2226

热度

692

贡献

民审

Rank: 8Rank: 8

发表于 2016-7-4 11:33:04 | 显示全部楼层 |阅读模式 | 百度  360  谷歌 
分享到:
想要网站健康收录,那一定离不开Robots协议的设置以及robots正确写法,如何设置robots协议,首先从了解robots协议开始。
草根吧 Discuz论坛robots爬虫协议正确写法与实操经验分享 英文输入法,搜索引擎,百度蜘蛛,机器人,谷歌 SEO优化
第一:认识Robots
Robots简单来说就是搜索引擎和我们网站之间的一个协议,用于定义搜索引擎抓取和禁止的协议。robots基本语法符号:/ 、* 、$
/ 在允许和禁止的文件和文件夹前写; * 通配符,能够匹配所有的英文字符包括数字0; $ 表示结束符,用于屏蔽图片时候用。
第二:Robots.txt正确写法注意事项
①要顶格写。不要前面空几格。
草根吧 Discuz论坛robots爬虫协议正确写法与实操经验分享 英文输入法,搜索引擎,百度蜘蛛,机器人,谷歌 SEO优化
②要在英文输入法下写语句。因为中文下的冒号和英文冒号不一样。
草根吧 Discuz论坛robots爬虫协议正确写法与实操经验分享 英文输入法,搜索引擎,百度蜘蛛,机器人,谷歌 SEO优化
③开头要大些。如:User-agent,Baiduspider草根吧 Discuz论坛robots爬虫协议正确写法与实操经验分享 英文输入法,搜索引擎,百度蜘蛛,机器人,谷歌 SEO优化 ④冒号后要空一格。User-agent: /Baiduspider
草根吧 Discuz论坛robots爬虫协议正确写法与实操经验分享 英文输入法,搜索引擎,百度蜘蛛,机器人,谷歌 SEO优化
第三:实操Robots写法
在写robots协议时,首先先要定义什么样的蜘蛛,如:User-agent: Baiduspider 指的就是定义百度蜘蛛,除了百度蜘蛛外还包括谷歌机器人、搜狗蜘蛛等等。
其次在下一行写上允许和禁止的语句,如:
如何屏蔽整站:Disallow: / 指的就是屏蔽整个网站(/单个符号搜索引擎认为是根目录);
如何屏蔽具体路径:Disallow: /toutiao.com/forum-53-1.html 指的是屏蔽具体某一个路径;
如何屏蔽文件和文件夹:Disallow: /uploads 指的是屏蔽uploads开头的文件和文件夹;
如何屏蔽文件夹:Disallow: /uploads/ 指的是只屏蔽uploads文件夹;
如何屏蔽动态路径:例如:toutiao.com/speedtest.aspx?host=bbs.moonseo.cn为动态路径,问号前toutiao.com/speedtest.aspx可以用通配符*代替,接着一个问号,然后问号后host=toutiao.com也可以用一个通配符*代替,所以其语句可以这样写:Disallow: /*?*
如何屏蔽图片:Disallow: /*.jpg$ 如果单纯的写Disallow: /*.jpg是屏蔽不了图片的,所以要在图片后面写上结束符$,指的是屏蔽所以jpg格式的图片;
那么相应的Allow语句写法也是如上所说。


帖子地址: 

本文来源于草根吧源码论坛 www.caogen8.co,欢迎大家下载。
如果您没有贡献需要充值,可以直接在线充值,点击充值
如果你需要加入本站赞助VIP会员,可以直接在线开通,点击开通
如果找不到您要的资源,请搜索一下,点击搜索
回复

举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册 新浪微博登陆 用百度帐号登录 一键登录:

本版积分规则

收藏帖子 返回列表 搜索
快速回复 返回顶部 返回列表