`
jiav_net
  • 浏览: 104330 次
文章分类
社区版块
存档分类
最新评论

字符集系列三之ISO8859_1、GBK、gb2312

 
阅读更多

String a = new String("碁");
String b = new String(a.getBytes(),"ISO8859_1");
String c = new String(a.getBytes(),"gb2312");
System.out.println("b="+b+" c="+c);
String b = new String(b.getBytes("ISO8859_1"),"GBK");
String c = new String(a.getBytes("gb2312"),"GBK");
System.out.println("b="+b+" c="+c);

虚拟机的内码是GBK:

输出结果是:

b=?? c=??

b=碁 c=??

这就是奇妙之处了。

当a被转化为gb2312时由于在编码表里找不到对应的编码,故而被替代为?的编码,再转回来就是?了

而被转化为ISO8859_1时,之间将编码平移过去虽然不能正常显示,但是保证了正常转化回来。

ISO8859_1是个比较特殊的字符集,它是一个8位的编码,这就让他成为一个非常好的中介机构,会忠实的将每个字节的数据记录下来而不改变,估计这是web传输和jdbc传输使用它为字符集的原因吧。

getBytes()

使用平台默认的字符集将此String解码为字节序列,并将结果存储到一个新的字节数组中。


getBytes(StringcharsetName)

使用指定的字符集将此String解码为字节序列,并将结果存储到一个新的字节数组中。


String(byte[] bytes,StringcharsetName)
构造一个新的String,方法是使用指定的字符集解码指定的字节数组。


String(byte[] bytes)
构造一个新的String,方法是使用平台的默认字符集解码字节的指定数组。

分享到:
评论

相关推荐

    各种字符集编码表,包括iso-8859-1,gbk,gb18030, unicode

    各种字符集编码表,包括iso-8859-1,gbk,gb18030, unicode,以及字符集的转换说明(主要是Java国际化的一些字符集转化说明)

    有关于当安装maven成功后javaweb会出现几个乱码问题,都会解决

    有关于当安装maven成功后javaweb会出现几个乱码问题,都会解决。 想解决java中文乱码问题也得了解一下...Linux系统默认使用的是ISO-8859-1编码,Win32系统默认使用的是GB2312编码。 Java的内核和class文件是基于unicode

    超详细的字符编码教程

    ISO/IEC 8859编码标准中的15种字符集 A.3. Code Page表格 A.3.1. 常见的ANSI和OEM的Code Page的表格 A.3.1.1. ANSI Code Page表 A.3.1.2. OEM Code Page表 A.3.1.3. ANSI和OEM共有的Code Page表 A.3.1.4. 其他一些...

    字符编码学习

    Unicode字符集(简称为UCS),国际标准组织于1984年4月成立ISO/IEC JTC1/SC2/WG2工作组,针对各国文字、符号进行统一性编码。1991年美国跨国公司成立Unicode Consortium,并于1991年10月与WG2达成协议,采用同一编码...

    计算机概论-平时作业.docx

    8>GB18030 字符集:GB18030 字符集标准解决汉字,日文假名,朝鲜语和中国少数民族文字组成 9>ISO8859-1:拉丁码表。欧洲码表。用一个字节的 8 位表示。 10>Unicode 字符集:国际标准码,融合了多种文字。 5、简述冯...

    iconv::rocket:纯正的Golang工具

    ISO-8859-1 EUC-JP Shift_JIS 更多即将推出 用法 import ( github . com / mushroomsir / iconv ) 转换字符串值 可以使用两种方法来转换字符串。 首先,有iconv.ConvertString(input,fromEncoding,to...

    Java I/O输入输出流详解

     ISO8859-1:拉丁码表,西欧标准字符集,用一个字节的8位表示  GB2312:中文编码表,用两个字节来表示中文编码  GBK:中文编码表的升级,融合了更多表示中文文字符号  GB18030:GBK的取代版本  BIG-5:...

    会计理论考试题

    26.在Windows98中,如果要输入GB2312-80规定以外的汉字,应当____C____。 A、从Windows98的CD盘上安装GBK汉字输入法 B、从软件厂商购买GBK汉字输入法 C、选择全拼输入法来输入汉字 D、在控制面板中选“输入法”,...

    LightGUI一个轻量级的GUI

    多字符集和多字体支持,目前支持 ISO8859-1~ISO8859-15、GB2312、GBK、GB18030、BIG5、EUC-JP、Shift-JIS、EUC-KR、UNICODE(UTF-8、UTF-16 编码)等字符集,支持灰度点阵、等宽点阵字体、变宽点阵字体,支持...

    PT80-NEAT开发指南v1.1

    适用于 PT80 系列 移动数据终端 版本记录 版本号 版本描述 发布日期 V 1.0 初始版本。 2012-04-12 V1.1 修改前三章内容 2012-09-25 目录 第一章 关于本手册..........................................................

Global site tag (gtag.js) - Google Analytics