网站文章的标题相似度导致不被收录

最近发现有一个网站文章不被收录了,而且所收录的条目中,点击进入的全是首页,而不是文章页。最后经过仔细的观察与讨论,得出的结果是和标题相似度有关。

之所以这么说也是有一定的道理的。该网站的文章页基本是原创的,可以排除掉文章质量的问题,另外蜘蛛爬行也是正常的,偏偏就是对文章不收录,对收录的标题进行点击,进入的不是文章页面而是首页,或者是栏目页。然后,我们也对网站的robots.txt进行了下检查,也没问题。

最后将眼光放在了文章标题上,之所以这样做,是因为所有的收录里面,没有一个是标题。通过对文章标题的观察,最后发现主要的原因是标题相似度太高了,通俗的来讲,就是有一种让蜘蛛觉得没什么内容更新一样,大家都知道,如果蜘蛛对一个页面进行爬行,大都会从标题开始。我们来看看该网站的标题:

通过对比,我们发现,所有的文章标题中都有一大截的重复内容。我相信,这种做法有很多人在做,包括我,我也相信大家之所以这么做,主要还是为了让网站目标关键词的权重更高一些。

这让我想起一本书《SEO魔法书》,书里面的大概意思是,如果你想让网站目标关键词的权重更高一些的话,你可以在代码里修改一下,将网站标题也加入到文章标题中去,久而久之,你的每次更新都会让蜘蛛对你的网站标题进行爬行,这样,你的目标关键词权重也会越来越高,排名也会越来越理想。

但是往往有的时候,理论真的能害死人,这书中完全没提到这个标题应该注意什么,那就是标题相似度,蜘蛛对标题进行爬行的时候,如果发现相似度很高的话,那么会怀疑这不是原创了,当然对收录也会造成影响了。

很多朋友会问,既然这样的话,那目标关键词权重更高了,排名更好了,不是符合SEO的要求了吗?试问,SEO优化的意义真的仅仅是几个目标关键词的排名吗?

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: