java string乱码解决方法:(推荐:java视频教程)
System.out.println(str); String str1 = new String(str.getBytes("ISO-8859-1"), "utf-8"); System.out.println(str1); String str2 = new String(str.getBytes("gb2312"), "utf-8"); System.out.println(str2); String str3 = new String(str.getBytes("gbk"), "utf-8"); System.out.println(str3);
str.getBytes(charsetName);charsetName是原本字符的编码
"utf-8"是将str转换为utf-8编码。
new String(str.getBytes(“gbk”),“iso8859-1”)时
第一步:byte[] bytes=str.getBytes(“gbk”)
告诉java虚拟机将中文以“gbk”的方式转换为字节数组。一个汉字对应两个字节。
对应的第二步便是:
String s=new String(bytes,“iso8859-1”)时,此时是将每1字节组装成一个“?” 。此时的s是若干个“?”,我们可以把“?”看做是一种特殊的汉字,它代表的信息并没有损失是可以还原回来的。
java.lang.String.getBytes(String charsetName) 方法编码将此String使用指定的字符集的字节序列,并将结果存储到一个新的字节数组。
声明
以下是java.lang.String.getBytes()方法的声明
public byte[] getBytes(String charsetName) throws UnsupportedEncodingException
参数:charset — 这是一个支持的字符集的名称。
返回值:此方法返回得到的字节数组。
new String(byte[],decode)方法
与getBytes相对的,可以通过new String(byte[], decode)的方式来还原这个"中"字,
这个new String(byte[],decode)实际是使用指定的编码decode来将byte[]解析成字符串.
异常:UnsupportedEncodingException — 如果不支持指定的字符集。