WordPress 禁止蜘蛛抓取某日志
这几天一直在罢工,包括今天商场和我们还是没有达成共识,就一直僵持着。不过罢工的故事童鞋们肯定已经听厌了,所以今天我要讲的不是罢工,而是由罢工引发的对 WordPress 的思索。罢工和 WordPress 有什么关系呢?听我慢慢道来。我每晚都会翻看量子恒道统计的关键词分析,看看我的日志有哪些关键词是被关注的。昨晚在看统计数据时,眼前一亮,我看到了这么一个关键词通过百度来到本站。
那时我就有种不祥的预感……果然,今天私下里去和商场管理部经理谈判兼聊天的时候,被他识破了,原来就是这小样通过这个关键词搜到本站,居然还通过网站上留的QQ号把我人肉出来了。我擦!这时我才发现网站排名太高,收录太快也是一种烦恼啊。(嘿嘿~肯定又要被 showfom 小盆友说我自恋了)
说了这么多,只不过是给自己折腾 WordPress 找个理由罢了,呵呵。这次被人肉的事件让我感觉到 WordPress 的日志公开度分为公开、密码保护、私人这三类还不是很完善,应该还可以分出一类:半公开。也就是说某篇日志允许朋友通过友情链接、RSS 订阅或者其他搜索以外的方式访问,但是这篇日志将不被搜索引擎收录。我想到的第一个解决方案就是用 robots.txt,但是每次写半公开日志都要更新 robots.txt 有些麻烦,而且我不希望 robots.txt 文件特别冗长。于是第二个解决方案诞生了,那就是用强大的自定义域,方法和之前提到的首页缩略图有相似之处。
首先在 header.php 中的 <head></head> 之间加入以下代码:
if (!empty($private)) {
echo '<meta name="robots" content="noindex"/>';
}
?>
然后在日志编辑器中添加新自定义域,名称为 private,值可以是任意非空字符串,建议用 post id。禁止搜索引擎收录半公开的单篇日志就这么实现啦。
最后补充说明一下,noindex 标签是互联网 meta robots 协议的其中之一,Google 和 Yahoo 这类搜索引擎都会中规中矩地按这个协议执行,唯独百度不鸟 noindex 这个标签,接下来 BS 百度的话我就不多说了,留给童鞋们在评论中自由发挥咯。
-
浅谈 Wordpress 强大的自定义域2009年08月31日 -
Wordpress SEO 之 Meta 信息2009年07月10日 -
新年新气象,博客换新衣2012年01月20日 -
2011 年终总结2011年12月29日