一切福田,不離方寸,從心而覓,感無不通。

异常处理:使用UTF-8编码Mysql仍然抛出Incorrect string value异常

之前还以为从上至下统一用上UTF-8就高枕无忧了,哪知道今天在抓取新浪微博的数据的时候还是遇到字符的异常。 从新浪微博抓到的数据在入库的时候抛出异常: Incorrect string value: '\xF0\x90\x8D\x83\xF0\x90…' 发现导致异常的字符不是繁体而是某种佛经文字。。。额滴神。。。但是按道理UTF-8应该能支持才对啊,他不是万能的么? 原来问题出在mysql上,mysql如果设置编码集为utf8那么它最多只能支持到3个字节的UTF-8编码,而4个字节的UTF-8字符还是存在的,这样一来如果你建表的时候用的utf8字符集出异常就理所当然了。 解决方法很简单,修改字段或者表的字符集为utf8mb4。 比较蛋疼的是,字符集utf8mb4在mysql 5.5.3之后才支持。。。 [2015.03.30]更新: 事实证明只做上面的步骤是无法解决问题的,如果需要解决请参考:http://info.michael-simons.eu/2013/01/21/java-mysql-and-multi-byte-utf-8-support/ 明天要研究如何升级mysql了。。。 参考: http://stackoverflow.com/questions/10957238/incorrect-string-value-when-trying-to-insert-utf-8-into-mysql-via-jdbc http://topic.csdn.net/u/20091107/17/c0eb2463-b4bb-4197-bd67-0459db8aa137.html   from:http://blog.csdn.net/shootyou/article/details/8236024

龙生   17 Jan 2016
View Details

Mysql [Err] 1366 – Incorrect string value: '\xE7\x80\x8D\xE6\xB2

Mysql数据库上,执行Sql语句: INSERT tn_Areas (AreaCode, ParentCode, Name, PostCode, DisplayOrder, Depth, ChildCount) VALUES ('41030400', '41030000', '瀍河回族区', ", 1557, 3, 0); 报错: [Err] 1366 – Incorrect string value: '\xE7\x80\x8D\xE6\xB2\xB3…' for column 'Name' at row 1   原因:数据库的字符集是gb2312,不能识别繁体字 解决办法:修改数据库字符集为utf8 from:http://c.jinhusns.com/u/lix/b-438

龙生   17 Jan 2016
View Details