连续憋了N久的Google近期的一些表现的观察和新出台的政策,打算这几天连续进行报道。自从上次Google Page Rank Updating之后,一直静不下心来,也许是长期熬夜工作的缘故,本打算在2008年之前的这段时间好好休息休息,去四周走走,看来又要忙活一阵了,言归正传:
改进了站长中心的分析工具 能看懂Sitemap的相关语句和URL,当然生成的报告也多了很多内容,可以尝试看看。前不久Google新增加了unavailable_after元标签,该标签主要目的是增加网站和Google Bot之间的互动,你可以对特定页面指定确切的日期和时间,来阻止被抓取和索引。
标签的基本格式:unavailable_after+:+精确的时间
<META NAME="GOOGLEBOT"
CONTENT="unavailable_after: 31-Dec-2007 23:59:59 EST">
如果您想限制某个页面在某某时间以后就对于Google Bot失效,可以在这里做详细的设置了,注意这个标签仅是对整个页面的Index进行的操作,比如一些有时间限制的页面可以使用,例如:专题页面,促销页面,活动页面,也就是这样的页面有具体的结束时间或者失效日期。
同时,新出的X-Robots-Tag指令,该标签为非HTML网页提供支持!你终于可以控制对你的录像,电子表格,及其他索引文件类型的索引,就像控制对HTML页面的索引一样。
使用方法也Very Easy,你只需要在你要控制页面某一行加上形如:
X-Robots-Tag: unavailable_after: 31 Dec 2007 23:59:59 EST
这是一个Google基于对File Index的新指令,有兴趣的朋友可以尝试使用。
Robots.txt中,新增了选择性抓取的新特性,比如除了files文件夹不被索引其他的都要被索引,你可以在Robots.txt这样写:
disallow files
user-agent: *
Disallow:
如果您还想Google知道你的Sitemap的内容,可以在后面追加一句:
sitemap: http://blog.5ixb.com/sitemap.xml