PHP程序员站--PHP编程开发平台
 当前位置:主页 >> 新闻咨询 >> 业内新闻 >> 

Google:Unicode(UTF-8)征服ASCII 成互联网最常用编码

Google:Unicode(UTF-8)征服ASCII 成互联网最常用编码

来源:互联网  作者:未知  发布时间:2008-05-09
我是这样看的。在互联网上,罗马拼音字母正四处逃窜,因为网络

我是这样看的。在互联网上,罗马拼音字母正四处逃窜,因为网络上日益充斥着阿拉伯字元、中国方块字和欧洲的特殊字元符号。

换言之,诚如Google资深国际软件架构师Mark Davis在其博客发文所言,Unicode现在已超越ASCII,成为互联网上最常用的字元编码方式。几乎在同时,西欧编码也被征服了。

Unicode是一种字元编码标准,能兼容数十种语文,以及标有读音识别符号的罗马字母。ASCII则是沿用数十年之久的标准,字元数目以128或256个字元为限,而且很难跨越原有的Remington打字机字元范围以外。

Davis指出,Unicode在去年12月上旬打败ASCII和西欧编码。

他说:不只是超越,更令人印象深刻的是,这么快就后来居上。他边说边指着一幅显示Unicode使用率扶摇直上的图表。

Google便非常喜爱Unicode网站,每当Google处理网站资料时,就会先转换成Unicode(如果该网站本来不是用Unicode的话),如此一来可加强国际搜索功能。

Davis说,目前Google只把资料转换成5.1版的Unicode,这样可让讲马来话等语言的人士,如今也可搜索内含这些新字元的文字。

不过,Unicode比ASCII差的一点是,所需的记忆空间至少比存储罗马拼音字元大一倍。

  

Tags: 互联网   编码   Google   网站   utf-8   C   as   Unicode   code    
最新文章
推荐阅读
月点击排行榜
PHP程序员站 Copyright © 2007-2010,PHPERZ.COM All Rights Reserved 粤ICP备07503606号