mysql中文乱码产生原因及解决方法 - PHP程序员站--PHP程序员之家 PHP新手教程 PHP高级技巧 PHP新闻 PHP源码下载 PHP专题 Zend产品

| 论坛登录 | 游客访问 | 免费注册 | 忘记密码

RSS订阅

高级搜索

收藏本站

当前位置：主页 >> 数据库 >> MySQL >> 文章内容

mysql中文乱码产生原因及解决方法

[收藏此页] [打印本页]

来源：互联网作者：未知发布时间：2008-03-05

php程序员站

www~phperz~com

php程序员站

| binary | Binary pseudo charset    | binary             | 1    |
| geostd8  | GEOSTD8 Georgian          | geostd8_general_ci  | 1    |
| cp932 | SJIS for Windows Japanese | cp932_japanese_ci | 2    |
| eucjpms  | UJIS for Windows Japanese | eucjpms_japanese_ci | 3    |
+----------+-----------------------------+---------------------+--------+
36 rows in set (0.02 sec)

MySQL 4.1的字符集支持(Character Set Support)有两个方面：字符集(Character set)和排序方式(Collation)。对于字符集的支持细化到四个层次: 服务器(server)，数据库(database)，数据表(table)和连接(connection)。
查看系统的字符集和排序方式的设定可以通过下面的两条命令：

mysql> SHOW VARIABLES LIKE 'character_set_%'; phperz~com
+--------------------------+-------------------------------------------+
| Variable_name          | Value                                  |
+--------------------------+-------------------------------------------+
| character_set_client    | latin1                                  |
| character_set_connection | latin1                                  |
| character_set_database | latin1                                  |
| character_set_filesystem | binary                                  | phperz.com
| character_set_results | latin1                                  |
| character_set_server    | latin1                                  |
| character_set_system    | utf8                                     |
| character_sets_dir    | D:\MySQL\MySQL Server 5.0\share\charsets\ |
+--------------------------+-------------------------------------------+
8 rows in set (0.06 sec)

mysql> SHOW VARIABLES LIKE 'collation_%';
+----------------------+-------------------+
| Variable_name       | Value          | phperz~com
+----------------------+-------------------+
| collation_connection | latin1_swedish_ci |
| collation_database | latin1_swedish_ci |
| collation_server    | latin1_swedish_ci |
+----------------------+-------------------+
3 rows in set (0.02 sec)

上面列出的值就是系统的默认值。latin1默认校对规则是latin1_swedish_ci，默认是latin1的瑞典语排序方式.
为什么呢默认会是latin1_swedish_ci呢,追溯一下mysql历史很容易发现

1979年，一家瑞典公司Tcx欲开发一个快速的多线程、多用户数据库系统。Tcx 公司起初想利用mSQL和他们自己的快速低级例程 (Indexed Sequential Access Method，ISAM)去连接数据库表，然而，在一些测试以后得出结论：mSQL对其需求来说不够快速和灵活。这就产生了一个连接器数据库的新SQL接口，它使用几乎和mSQL一样的API接口。这个API被设计成可以使那些由mSQL而写的第三方代码更容易地移植到MySQL。

相信如果mysql是中国开发的，那么汉语也是默认编码了

当然我们也可以自己需要修改mysql的默认字符集
在mysql配置文档my.ini，找到如下两句： www~phperz~com

[mysql]

default-character-set=latin1

和

# created and no character set is defined
default-character-set=latin1

修改后面的值就可以。

这里不建议改，仍保留默认值
也就是说启动 mysql时，如果没指定指定一个默认的的字符集，这个值继承自配置文件中的；
此时 character_set_server 被设定为这个默认的字符集；当创建一个新的数据库时，
除非明确指定，这个数据库的字符集被缺省设定为 character_set_server；当选定了一个数据库时，
character_set_database 被设定为这个数据库默认的字符集；在这个数据库里创建一张表时，
表默认的字符集被设定为 character_set_database，也就是这个数据库默认的字符集；
当在表内设置一栏时，除非明确指定，否则此栏缺省的字符集就是表默认的字符集。

这样问题就随之而来了，假如一数据库是gbk编码。如果访问数据库时没指定其的字符集是gbk。
那么这个值将继承系统的latin1，这样就做成mysql中文乱码。

乱码解决方法

要解决乱码问题，首先必须弄清楚自己数据库用什么编码。如果没有指明，将是默认的latin1。 phperz.com
我们用得最多的应该是这3种字符集 gb2312，gbk，utf8。

那么我们如何去指定数据库的字符集呢？下面也gbk为例

【在MySQL Command Line Client创建数据库】

mysql> CREATE TABLE `mysqlcode` (
-> `id` TINYINT( 255 ) UNSIGNED NOT NULL AUTO_INCREMENT PRIMARY KEY ,
-> `content` VARCHAR( 255 ) NOT NULL
-> ) TYPE = MYISAM CHARACTER SET gbk COLLATE gbk_chinese_ci;
Query OK, 0 rows affected, 1 warning (0.03 sec)

mysql> desc mysqlcode;
+---------+-----------------------+------+-----+---------+----------------+
| Field | Type                | Null | Key | Default | Extra       |
+---------+-----------------------+------+-----+---------+----------------+
| id    | tinyint(255) unsigned | NO | PRI |       | auto_increment | php程序员之家
| content | varchar(255)       | NO |    |       |             |
+---------+-----------------------+------+-----+---------+----------------+
2 rows in set (0.02 sec)

其中后面的TYPE = MYISAM CHARACTER SET gbk COLLATE gbk_chinese_ci;
就是指定数据库的字符集，COLLATE (校勘)，让mysql同时支持多种编码的数据库。

当然我们也可以通过如下指令修改数据库的字符集
alter database da_name default character set 'charset'.

客户端以 gbk格式发送，可以采用下述配置:

SET character_set_client='gbk'
SET character_set_connection='gbk'
SET character_set_results='gbk'

这个配置就等价于 SET NAMES 'gbk'。

现在对刚才创建的数据库操作

mysql> use test;
Database changed

mysql> insert into mysqlcode values(null,'php爱好者');
ERROR 1406 (22001): Data too long for column 'content' at row 1 www~phperz~com

没有指定字符集为gbk，插入时出错

mysql> set names 'gbk';
Query OK, 0 rows affected (0.02 sec)

指定字符集为 gbk

mysql> insert into mysqlcode values(null,'php爱好者');
Query OK, 1 row affected (0.00 sec)

插入成功

[收藏此页] [打印本页] [返回顶部]

上一篇：Mysql中校对集utf8_unicode_ci与utf8_general_ci的区别下一篇：php读取mysql数据库乱码解决方法

·MySQL中值得我们注意的SQL语句
·MySQL客户端命令行应用技巧
·MySQL大小写敏感问题
·教你如何编写高效的MySQL数据库应用
·透视MySQL数据库之更新语句
·mysql字段类型说明
·数据库设计经验谈 (5 终章)
·数据库设计经验谈 (4)
·数据库设计经验谈 (3)
·数据库设计经验谈(2)

发表评论

全部评论(0条)

站内搜索
热门搜索　基础　 mysql 　url 　adodb

高级搜索网站地图站长工具 IP查询收藏本站

热点文章

·php读取mysql数据库乱码解决方法
·windows下mysql 的启动和停止
·MySQL的中文全文索引,二元分词
·Mysql中校对集utf8_unicode_ci与utf8_gener
·MySQL平台数据库备份方案详细说明
·mysql中文乱码产生原因及解决方法
·MySQL 常用命令
·distinct去掉mysql中重复值
·提高MySQL 查询效率的三个技巧
·mysql字段类型说明
·php数据库备份参考
·怎样从Windows命令行启动MySQL？
·用phpmyadmin建立MYSQL数据库的过程详解
·MySql里记录货币字段类型
·MySQL中值得我们注意的SQL语句

网站首页 | 网站地图 | 高级搜索 | RSS订阅