网站编码Gb2312和Utf8对SEO的影响

时间:12-10-26 栏目:SEO优化 作者:kyle 评论:0 点击: 3,698 次

转自一个兄弟的文章,写得不错。学习一下。

如果网站是面向国人的,建议使用gbk,理由如下:

1、gbk采用双字节表示汉字,utf-8采用三个字节表示汉字,从表示一个汉字所占的字节数来说,gbk相对于utf-8可以节约50%的空间。

2、目前开源的程序gbk编码相对成熟一些。

3、蜘蛛在爬行某个页面的过程中识别的charset属性值如果为gbk的话基本上可以确实为中文类型的网站(无需对后面的内容进行判断),如果为utf-8的话还需要进一步判断(例如检索全文中的字符有多少属于utf-8中文字符的范围)。

如果网站是外文的话果断utf-8吧。

还有一点需要注意的是由于gbk和utf-8的编码不同,如果网站在被收录之后更改charset的话,蜘蛛在抓取过程中如果不能及时的发现charset变动的话就会判定网页内容发生异常导致页面被K。

以我自己的论坛为例(以下例子与实际情况还有点出入,仅用来说明大概意思),如图1所示,论坛采用的编码为gbk,浏览器正常显示。

图1:

charset示例1

如果强制浏览器以utf-8编码解释的话就会是图2的样子。

图2:

charset示例图2

同样的道理,如果之前采用的是utf-8编码,而且页面已经被搜索引擎收录,如果中途换成gbk编码的话,在蜘蛛爬行过程中如果蜘蛛不能及时发现charset属性值改变的话还会按照之前的编码进行解析,结果就是与之前正常的页面相比产生了很大的变动,进而导致页面被K的可能。

理论需要去实践,我用自己的一个页面进行了这个实验,之前采用的是utf-8编码,之后改成gbk。在5月5日时这个页面搜索关键词“收录批量查询”位于第一,今天在百度中已经失去了踪影,至于中途改变编码会不会影响之前积累到的权重,还需要进一步观察。

成都SEO小五点评:未经测试,个人认为编码有一定的影响,但是非常非常小,百度识别编码之后,会把对应的字符串流做解密,解开之后的文字是一样的话,对网站的影响应该是比较小的。但是还是尽量在前期选择程序的时候定好网站使用的编码。中文GBK,英文UTF8,这个当然是最好的。

成都SEO小五嚎2句: 本文是(成都SEO小五)辛苦弄出来的,转载成都SEO小五原创的请保留链接: 网站编码Gb2312和Utf8对SEO的影响,3Q

网站编码Gb2312和Utf8对SEO的影响:等您坐沙发呢!

来给哥评论评论


------====== 小五公告 ======------
成都SEO小五,专注成都搜索引擎优化。
小五善长站内外优化,C#、PHP开发,中英文SEO,Google中英文和百度优化技术。欢迎群内交流。伸手党请绕路,求资源的请绕开,求问题解答的请进群内交流。开放了一个QQ交流群:160750032。加入验证时请标注任何SEO相交字眼。友情链接直接Q我,收录正常,内容大部份原创、SEO或者程序开发、网络营销、线上推广等相关行业即可。

常用工具

赞助广告

来看过哥的人