robots协议禁止收录网站某一篇文章地址
发布时间:2021-10-20 15:57:42 本站作者 【 字体:大 中 小 】 浏览:169 次
网站 robots.txt 文件配置方法,如何禁止搜索引擎收录指定网站某一篇超链接地址呢,今天跟着麦站一起学学吧。
搜索引擎通过网络蜘蛛抓取网页的内容,并展示在相关的搜索结果中。但是有些网页内容我们可能并不想被搜索引擎收录和索引,如管理员后台等。
我们就可以通过 robots.txt 文件来声明允许/禁止搜索引擎的蜘蛛抓取某些目录或网页,从而限制搜索引擎的收录范围。
什么是 robots.txt
Robots是站点与spider沟通的重要渠道,站点通过robots文件声明本网站中不想被搜索引擎收录的部分或者指定搜索引擎只收录特定的部分。
Robots.txt用法:
User-agent:用于指定指令所作用于的目标抓取工具(网络蜘蛛),后接抓取工具名称;
Disallow:指定不允许抓取的目录或网页,后面为空则表示允许抓取一切页面;
Allow:指定允许抓取的目录或网页;
Sitemap:站点地图的位置,必须是绝对路径;
*:表示通配符;
$:表示网址结束;
/:匹配根目录以及任何下级网址。
禁止抓取某一个超链接:
Disallow: /news/hangyejishu/43.html
热门推荐
广告位-300PX*250PX
最新发布

什么的雷声填空答案

什么的雷声填空答案震耳的雷声,遥远的雷声,响亮的雷声,恐怖的雷声,轰隆隆的雷声,沉闷的雷声等。雷击,指打雷时电流通过人、畜、树木、建筑物等而造成杀伤或破坏。云层之间的放电对飞行器有危害,对地面上的建筑物和人、畜影响不大,但云层对大地的放电,则对建筑物、电子电气设备和人、畜危害甚大。一但对万物造成危害...

什么叫双核

什么叫双核1.双核cpu也就是多了一个核心芯片组成的就是双核cpu处理器。2.cpu是电脑的核心,而cpu上面最重要的也是cpu芯片,在我们电脑在处理数据的计算、接受存储的时候就是通过cpu上面的芯片来执行的。CPU内部拥有的核心数量在很大程度上也决定了该处理器的处理器性能,所以多核心CPU可以同时处理器更多数据,在性能方面也...

胶东指的是什么

胶东指的是什么胶东地区是指胶莱谷地及其以东具有相同语言、文化、风俗、习惯的半岛地区。按语音、文化、风俗习惯细分为烟台、威海的丘陵地区,和青岛市区、潍坊市等胶莱河两岸平原地区。胶东以莱阳梨,烟台苹果,胶东馒头等著名于世。...

mac地址存在于哪里

mac地址存在于哪里网卡。mac地址通常存储在计算机的“网卡”上。网卡属于OSI模型的物理层,只传输信号,不分析高层数据;MAC地址是全球唯一的,是一个用来确认网络设备位置的位址,通常固化在计算机的网卡上。如果想查看mac地址可以在 开始运行cmd 然后在后面输入ipconfig/all其中 physical address所对应的就是。...