视频1 视频21 视频41 视频61 视频文章1 视频文章21 视频文章41 视频文章61 推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37 推荐39 推荐41 推荐43 推荐45 推荐47 推荐49 关键词1 关键词101 关键词201 关键词301 关键词401 关键词501 关键词601 关键词701 关键词801 关键词901 关键词1001 关键词1101 关键词1201 关键词1301 关键词1401 关键词1501 关键词1601 关键词1701 关键词1801 关键词1901 视频扩展1 视频扩展6 视频扩展11 视频扩展16 文章1 文章201 文章401 文章601 文章801 文章1001 资讯1 资讯501 资讯1001 资讯1501 标签1 标签501 标签1001 关键词1 关键词501 关键词1001 关键词1501 专题2001
mysql保存微信昵称特殊字符的方法
2020-11-09 20:25:21 责编:小采
文档


我在用mysql 保存微信昵称,当插入昵称数据的时候,报错。于是做了如下工作:

    一、简介

   MySQL在5.5.3之后增加了这个utf8mb4的编码,mb4就是most bytes 4的意思,专门用来兼容四字节的unicode。好在utf8mb4是utf8的超集,除了将编码改为utf8mb4外不需要做其他转换。当然,为了节省空间,一般情况下使用utf8也就够了。   

   二、内容描述

   那上面说了既然utf8能够存下大部分中文汉字,那为什么还要使用utf8mb4呢? 原来mysql支持的 utf8 编码最大字符长度为 3 字节,如果遇到 4 字节的宽字符就会插入异常了。三个字节的 UTF-8 最大能编码的 Unicode 字符是 0xffff,也就是 Unicode 中的基本多文种平面(BMP)。也就是说,任何不在基本多文本平面的 Unicode字符,都无法使用 Mysql 的 utf8 字符集存储。包括 Emoji 表情(Emoji 是一种特殊的 Unicode 编码,常见于 ios 和 android 手机上),和很多不常用的汉字,以及任何新增的 Unicode 字符等等。   

   三、问题根源

   最初的 UTF-8 格式使用一至六个字节,最大能编码 31 位字符。最新的 UTF-8 规范只使用一到四个字节,最大能编码21位,正好能够表示所有的 17个 Unicode 平面。
   utf8 是 Mysql 中的一种字符集,只支持最长三个字节的 UTF-8字符,也就是 Unicode 中的基本多文本平面。
   Mysql 中的 utf8 为什么只支持持最长三个字节的 UTF-8字符呢?我想了一下,可能是因为 Mysql 刚开始开发那会,Unicode 还没有辅助平面这一说呢。那时候,Unicode 委员会还做着 “65535 个字符足够全世界用了”的美梦。Mysql 中的字符串长度算的是字符数而非字节数,对于 CHAR 数据类型来说,需要为字符串保留足够的长。当使用 utf8 字符集时,需要保留的长度就是 utf8 最长字符长度乘以字符串长度,所以这里理所当然的了 utf8 最大长度为 3,比如 CHAR(100)  Mysql 会保留 300字节长度。至于后续的版本为什么不对 4 字节长度的 UTF-8 字符提供支持,我想一个是为了向后兼容性的考虑,还有就是基本多文种平面之外的字符确实很少用到。

   要在 Mysql 中保存 4 字节长度的 UTF-8 字符,需要使用 utf8mb4 字符集,但只有 5.5.3 版本以后的才支持(查看版本: select version();)。我觉得,为了获取更好的兼容性,应该总是使用 utf8mb4 而非 utf8.  对于 CHAR 类型数据,utf8mb4 会多消耗一些空间,根据 Mysql 官方建议,使用 VARCHAR  替代 CHAR。

具体如何操作呢:

一、在MYSQL数据库中,将/usr/local/mysql/my.cnf修改为:

[client]
 #password = your_password
 port = 3306
 socket = /usr/local/mysql/data/mysql.sock
default-character-set=utf8mb4
 # Here follows entries for some specific programs
 # The MySQL server
 [mysqld]
 port = 3306
 socket = /usr/local/mysql/data/mysql.sock
character-set-server=utf8mb4
 collation-server=utf8_general_ci
 #no-auto-rehash
 datadir =/usr/local/mysql/data
 skip-external-locking
 key_buffer_size = 16K
 max_allowed_packet = 1M
 table_open_cache = 4
 sort_buffer_size = K
 read_buffer_size = 256K
 read_rnd_buffer_size = 256K
 net_buffer_length = 2K
 thread_stack = 128K
 log_error=/usr/local/mysql/data/mysql-error.log
 [mysql]
 no-auto-rehash
 socket = /usr/local/mysql/data/mysql.sock
default-character-set=utf8mb4

网上有人说 还要修改成如下:

[mysqld]
character-set-client-handshake=FALSE
character-set-server=utf8mb4
collation-server=utf8mb4_unicode_ci
 init-connect='SET NAMES utf8mb4'

我的没有就没修改了

二、修改表列的字符集

例如:alter table users change nickname nickname varchar(50) character set utf8mb4   collate utf8mb4_unicode_ci ;

三、修改连接字符串

JDBC连接串的问题,有些项目在jdbc连接串里指定了编码,例如:jdbc:mysql://localhost/mydb?characterEncoding=UTF-8

总结

以上所述是小编给大家介绍的mysql保存微信昵称特殊字符的方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对脚本之家网站的支持!

您可能感兴趣的文章:

  • 微信昵称带符号导致插入MySQL数据库时出错的解决方案
  • MySQL创建带特殊字符的数据库名称方法示例
  • Python连接MySQL并使用fetchall()方法过滤特殊字符
  • mysql如何处理varchar与nvarchar类型中的特殊字符
  • MySQL用户密码中的特殊字符叹号(!)的妙用
  • MySQL数据入库时特殊字符处理详解
  • 下载本文
    显示全文
    专题