曾几时,百度/google在收录规则里表明搜索引擎喜欢html静态页面时,站长们一片哗然。会点技术的马上把自己的网站改成生成html,碰见人就说,自己的网站做过优化,生成了html,设置了关键词,且生成html速度快。站长吹牛或者出售程序的时候,无不如此。 事实上真的是这样吗?
首先我们来谈论生成html速度快的问题。生成html静态页面,本意是解决动态文件读取数据库时请求返回过于慢的问题。其实,只要数据库不是非常大,从请求速度来说,这个基本上不受什么影响。但是更新页面很麻烦,之前google adsense还不可以框架调用的时候,很多生成html的网站主深受其害,有人甚至让电脑不关机,通宵生成html。虽然现在可以js调用了,但有时候改版或更新时,都只能等半夜挂机生成。而且,生成html会占用大量空间以及服务器资源,有的用虚拟主机的站长,估计删除页面都得花上几个小时。有的网站没几个流量,采集了一堆数据,没日没夜地生成,实在辛苦。所以说,生成html在速度上有时适得其反。
有的人为了所谓的搜索引擎优化效果,进行伪静态处理,在服务器上做镜像,让html可以执行动态脚本。这样一来,所谓html速度快就无法实现了,还是一样需要读取数据库。而且,做伪静态处理还会造成程序累赘,有些功能还需要手动操作。
其实我们稍微分析一下就可以明白,之前搜索引擎之所以喜欢html页面,是因为每个单独的html页面都是一个全新文件,那个时候还没有所谓的模板生成,html都是纯手工制作的。而动态页面都是在一个文件上引用,与其说搜索引擎喜欢html页面,还不如说搜索引擎更喜欢原创内容更为恰当。所以,真正的原因不是html和动态的问题,而是网站模板化的问题。当网站生成的html全部格式化了,和动态文件用模块文件引用又有什么区别呢?
不过话又说回来,html比动态文件的排名权重稍微高些是有一定理由的,但不是因为它是html页面,而是因为它是一个单独的文件名。我们也可以做1.asp、2.asp,但这样会让程序编写增加一道工序,所以不要去做一些所谓的伪静态处理。
从域名角度来讲优化:【一级域名】-----【二级域名】------【一级域名更根目录】----【一级域名子目录】-------【一级域名子目录文件】。当一个动态文件调用如post.php?id=1,和1.html/2.html比较权重时,明显后者比前者更有优势。这也就可以解释,目前一些主流网站都喜欢生成目录的原因。其实我不知道目录权重较高这一说法是不是我原创,反正2004年我所有的网站就开始全部这样做,之前没看到有类似做法。后来,慢慢这样做的人也就多起来了。
还有一点就是关于百度收录的页面问题。有的人会问,自己网站页面其实只有1000个,但是百度收录了10000个,这是什么原因?其实这是由于网站模板化的原因,百度在抓取1.html的时候,这个页面有1、2、3、4、5、6这几个站内链接,抓取2.html页面的时候,同样也有1、2、3、4、5、6这几个站内链接,所以就重复抓取,而百度没有替换,导致有些收录重复了。
百度收录的时间问题,这几天有人问百度的收录时间是1970年,其实这个不需要大惊小怪。我的服务器设置时间是1970年,生成网站的时候,页面的修改时间也是1970年,所以百度是根据网站在服务器的页面修改时间来确定收录时间的。
百度的收录问题,其实百度现在收录有一个观察期,观察期内它照常会来网站上抓取。当它确定网站内容适合收录,而不是网络上随处可见的内容时,就会收录。而google的收录原则是,新站权重比较高,如果满分是10分的话,每个网站的初始积分是10分,除了那些原来就有pr页面,然后观察一段时间后会给网站降低分数。
其实大家不要迷信所谓的seo。seo是什么?是搜索引擎优化。什么叫优化?到互联网上看来看去,也就是教你做好外部链接,title标题放什么关键词,meta标签放什么关键词。其实最重要的优化就是服务质量,在现在形形色色的网站面前,把网站用户体验做好。哪怕内容是收集的,虽然短时间排名没有人家高,但是回头客一定会比人家多,而搜索引擎却非常喜欢回头客多的网站。