Step1数据系统技术(6.汉字URL路径的处理和编码)


其实我挺不想写这一章的,因为直到现在,我还经常为编码的事情弄得云里雾里,不过考虑到我在之前的这个文章系列的目录里面已经列出了这个主题,如果不写有欺骗的嫌疑,想想还是写吧,反正没有谁把我当作一个权威的。

  编码问题向来很复杂,我却不愿意向复杂了讲,我只从比较常见的讲。

  编码,实际上是一个字符串的表达方式,通常从URL编码来讲,我们最常见到的编码有两种:第一种是GB2312编码,这是百度搜索使用的一种编码形式,例如你在百度搜索一个"你好",你会看到搜索结果网址是http://www.baidu.com/s?wd=%C4%E3%BA%C3,其中的蓝色部分就是“你好”的GB2312编码后的URL形式;第二种是UTF-8编码,例如我们在Google搜索"你好",搜索结果的网址是http://www.google.cn/search?hl=zh-CN&q=%E4%BD%A0%E5%A5%BD&meta=&aq=f,其中的蓝色部分是“你好”的UTF-8编码后的URL形式,想查询一个汉字的编码,可以使用这个方法来快捷查询。

  使用什么编码可能很多时候我们并不在意,用什么编码都应该问题不大,可是当我们要对中文的内容进行URL重写的时候,可能就要注意这一点了,大家都知道,URL之中直接使用中文会对搜索引擎理解你的页面内容有很大的帮助,这个时候使用哪种编码是需要考虑的内容。

  我个人建议使用GB2312编码,这其实是一个无赖的选择,我的网站原先是使用utf-8编码的,可是后来我发现,baidu检索我的页面的robot好像有问题,似乎是不支持还是怎么的,用一些不知道是什么编码的路径来访问我的服务器,结果都显示为404,让我很郁闷,后来我就改成gb2312了,有时候你就会遇到这样的问题,必须特殊照顾那些技术有缺陷的角色。

  最终我得到的效果就是,我的地名信息系统在baidu的显示结果之中会直接显示为汉字,例如大家访问http://www.baidu.com/s?wd=%D1%EE%E8%CF%B4%E5,可以看到效果(不过这个对SEO有没有好处不好说),不过因为使用了这个gb2312,所以在Google下就显示不出这个了。

  这一篇文章我也不知道讲了一些什么,不过反正我也不打算在编码问题上讲多少,一想到编码,我就有一些头疼


« 
» 
快速导航

Copyright © 2016 phpStudy | 豫ICP备2021030365号-3