教你如何让数据库支持emoji表情符存储

发布时间:2017-7-9 7:29:57编辑:www.fx114.net 分享查询网我要评论
本篇文章主要介绍了"教你如何让数据库支持emoji表情符存储",主要涉及到教你如何让数据库支持emoji表情符存储方面的内容,对于教你如何让数据库支持emoji表情符存储感兴趣的同学可以参考一下。

教你如何让数据库支持emoji表情符存储

From: http://www.cnblogs.com/janehoo/archive/2016/04/06/5359800.html

一、教你如何让数据库支持emoji表情符存储

解决方式:更换字符集utf8-->utf8mb4

 上周有开发人员反馈一个问题:前台应用抓取微博信息,每天总有几条数据插入不成功。应用日志显示:  

java.sql.SQLException: Incorrect string value: '\xF0\x9F\x92\xAA",...' for column 'raw_json' at row 1, 异常:org.springframework.jdbc.UncategorizedSQLException:  

其中raw_json字段显示如下:

  由上图可知,插入的字段里面包含emoji表情符。基本可以判定是字符编码的问题。我们的数据库里面使用的是utf8编码,普通的字符串或者表情都是占位3个字节,所以utf8足够用了,但是移动端的表情符号占位是4个字节,普通的utf8就不够用了,为了应对无线互联网的机遇和挑战、避免 emoji 表情符号带来的问题、涉及无线相关的 MySQL 数据库建议都提前采用utf8mb4 字符集,这必须要作为移动互联网行业的一个技术选型的要点。

utf8与utf8mb4说明:  

UTF- 8:Unicode Transformation Format-8bit,允许含BOM,但通常不含BOM。是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24为(三个字节)来编码。UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强。UTF-8编码的文字可以在各国支持UTF8字符集的浏览器上显示。如果是UTF8编码,则在外国人的英文IE上也能显示中文,他们无需下载IE的中文语言支持包。  

UTF8MB4:MySQL在5.5.3之后增加了utf8mb4的编码,mb4就是most bytes 4的意思,专门用来兼容四字节的unicode。   

既然找到了原因就来执行吧.既然只有raw_json列含表情符,就先尝试修改此列的字符集:  


上一篇:M​a​y​a​ ​2​0​1​2​ ​破​解​安​装​全​图​文​教​程
下一篇:spark复习总结01

相关文章

相关评论

本站评论功能暂时取消,后续此功能例行通知。

一、不得利用本站危害国家安全、泄露国家秘密,不得侵犯国家社会集体的和公民的合法权益,不得利用本站制作、复制和传播不法有害信息!

二、互相尊重,对自己的言论和行为负责。

好贷网好贷款