【源码商城】上午有人问润明SEO,说网站每天更新文章都收录,可是为什么收录的文章的标题和描述内容都与实际的不符呢?其他都正常,就百度不一样,笔者就去打开 它的网站一看,不看不知道,一看吓一跳。如此低级的SEO作弊居然还问我为何百度抓取的标签内容与实际的不符。我先把图放出来给大家看下
上图中的首页描述显然和下图的中的描述标签的内容不一样。
这是为什么呢?12月8号有篇文章举例说明了百度快照没抓到title、description标签的原因的是因为内容不对,但是没抓到的原因是说出来了,但是抓到了但是显出来的与实际的不符的原因还没说明,如上面2个图所示的现象。
这里再举一个百度快照抓取description等标签内容与实际一样的例子(其实有很多)
下面是描述标签内容
上面4个图就明显说明了百度快照抓取description等标签内容与实际不符的真正原因不是标签内容的不对。那是什么原因呢?
下面这张图证明这个上面的第一个图片里面的案例网站的代码都是框架组成,什么table等等
我们知道百度对table框架网站的爬取是不太兼容的,而且从搜索引擎的原理来讲,其抓取系统首先是将整个网页下载下来,然后将里面的文字内容提取出来,经过分析去除html格式,清除噪音,然后分词,最后存入索引库。
table框架的乱套直接导致搜索引擎蜘蛛的爬取效率和结果,那么取出代码剩下的文字有可能就与实际的文字有误差。那么这个时候百度对于爬取得来的文 字内容与页面description标签内容进行对比,如果符合,就会采用description标签内容,如果符合这个页面的内容,那么百度就会自动截 取一段文字作为这个页面最适合的描述。(百度这个原理是为了提高搜索用户的体验)
如下图
再看他的description标签内容“”明显是不符合上图中的蜘蛛抓取内容。
而且百度蜘蛛爬取网页内容的习惯是从上往下,从左往右的,再看笔者网站的源代码都是才用DIV+CSS代码布局,而且结构布局如本站首页所示,也非常合理
模拟蜘蛛爬取的内容如图所示(用我的description内容与下图内容对比,明显看出我的description内容是最适合描述首页的内容,因此才显示出来)
我的description内容是:
而从下图中我们可以看出如果你的网站没有description及内容,百度自动去判断description标签显示内容以显示出来,不然排名出来的页面,如果描述没有,势必会影响搜索用户在百度搜索的体验。
而如何是一些知名的商业平台,如淘宝网
但是淘宝网的真实标题是:
如上图中的一些知名商城,如果出现多余的字,可能会影响用户的搜索体验,因为这里出现后面的字,可能会给用户造成是冒充的假站,因为大家已经习惯 仅仅只有“淘宝网“三个字才是官方网站的习惯。(个人理解,应该是这样)
最后一张图的淘宝案例属于特例,不在本文的范围之内。
综上所述,作为一般性的网站,才用DIV+CSS代码,摒弃table框架等代码,以及从上往下,从左往右的代码布局习惯才能让百度抓取正常,才能显示实际的与页面内容想符合的description内容。