当前位置:首页 > 经验

讲解汉字内码正确形式 中文编码格式有哪些

在码农的世界中除了Bug,还有一个比较头疼的事情,那就是中文编码格式,对于普通人,你现在看到的中文,或者说你看到的所有中文,其实都是中文,你可能根本就不关心它是什么编码格式,但是程序员却不得不关注中文的编码格式,或者代码的编码格式,不然就会出现下面这种:

中文字符编码格式的验证和证明

中文字符编码格式的验证和证明

中文字符编码格式的验证和证明

可能已经乱瞎你们的眼了,其实它们正常如下:

中文字符编码格式的验证和证明

中文字符编码格式的验证和证明

这就是编码格式导致的,乱到火星人也无法认识,编码不仅仅会导致显示出现短路,还会让程序无法正常运行,特别是在加解密或者验签中,如果不按规定的编码格式编码,经常会遇见:签名失败,验签不符这种的错误。今天分享的是如何证明编码的格式:

第一步:复制乱码的字符串(这个是还不要叫中文了,谁也不认识了),利用UE转16进制查看乱码处对应的16进制。如查看‘一个程序员’对应的16进制:

中文字符编码格式的验证和证明

第二步:在Java代码中查询‘一个程序员’对应的UTF-8和GBK 16进制表示;

中文字符编码格式的验证和证明

比较就可以发现UE中的‘一个程序员’的编码格式是GBK的,这样就可以证明对应中文的编码格式了。

获取字符串编码格式的16进制的Java代码如下:

中文字符编码格式的验证和证明

声明:此文信息来源于网络,登载此文只为提供信息参考,并不用于任何商业目的。如有侵权,请及时联系我们:fendou3451@163.com
标签:

  • 关注微信

相关文章