JAVA编码(中文转码)问题总结_风过无痕1110的博客-程序员宅基地_java 转码问题

技术标签: java 编码解码 中文乱码  java 编码解码  

本章主要分析Java编码和解码的原理,以及中文转码存在的问题做个简单的总结

目录

1  编码基础知识

     ISO-8859-1编码

     GBK

     GB2312

     UTF-8 

2  WEB系统转换编码

      原理

     Servlet网络传输编码

     Struts2 控制编码

     Spring 控制编码

3 字符串转字节

4 字节转字符串


编码基础知识

ISO-8859-1编码

ISO-8859-1编码是单字节编码,向下兼容ASCII,其编码范围是0x00-0xFF,0x00-0x7F之间完全和ASCII一致,0x80-0x9F之间是控制字符,0xA0-0xFF之间是文字符号

单字节,即一个字节对应一个编码,不能编码汉字        

GB2312

能编码汉字,一个汉字用2个字节编码

GBK

1) 能编码汉字,一个汉字用2个字节编码

2) 编码的汉字比GB2312更多

UTF-8

1) 能编码汉字,一个汉字用3个字节编码

2) 范围包含汉字,字母,特殊符号,gbk和utf-8之间是可以相互转换的


2 WEB系统转换编码

原理

我们以服务端和客户端的模式来做分析,例如,浏览器是客户端,web服务器是服务端。

这里有个编码和解码的过程,客户端端需要将字符串编码成字节,可以是iso-8859-1,utf-8,gbk等,默认为iso-8859-1,

且转换成字节的过程中不能丢失编码。服务端需要用发送端同样的编码方式进行解码,否则将出现乱码。

一般由服务端确定一种编码和解码的方式,然后告知客户端编码和解码的方式。

Servlet 网络传输编码

接收浏览器POST请求

以JSP为例,服务端将JSP生成HTML发送给客户端。

设置浏览器编码和解码方式为UTF-8

例如:

<%@ page pageEncoding="utf-8" contentType="text/html; charset=utf-8" language="java"%>

服务端解码方式1:

String name = new String(request.getParameter("name").getBytes("ISO-8859-1"),"UTF-8");

服务端解码方式2:

request.setCharacterEncoding("UTF-8");

接收浏览器GET请求

如:http://localhost:8888/webtest/EncodeServlet?name=你好

浏览器将会对url进行urlEncode,编码方式为UTF-8

服务端解码方式:

String name = new String(request.getParameter("name").getBytes("ISO-8859-1"),"UTF-8");

此处用request.setCharacterEncoding("UTF-8");来设置解码,不能奏效,原因是get请求将参数拼在url后面进行url encode,而web容器对url的解码是在调用servlet之前,且默认解码方式是iso-8859-1

响应给浏览器

Response设置编码:

Response是指响应给客户端时,字节的编码方式,默认为ISO-8859-1

可用如下方法查看:

response.getCharacterEncoding();

设置响应流的编码方式:

response.setCharacterEncoding("UTF-8");

设置浏览器的编码和解码方式:

response.setContentType("text/html;charset=UTF-8");

jsp设置:

<%@ page pageEncoding="utf-8" contentType="text/html; charset=utf-8" language="java"%>

pageEncoding:设置jsp文件存储编码

contentType里面的charset:设置浏览器端传输的编码和解码

解析响应时解码,发送请求时编码

要保持响应流和编码和浏览器解码方式一致,才能不乱码


HTTPClient设置编码


Struts2控制编码

Struts.xml中做如下配置:

<constant name="struts.i18n.encoding" value="utf-8"></constant>

Spring控制编码

Web.xml中配置如下:

<filter>
<filter-name>encodingFilter</filter-name><filter-class>org.springframework.web.filter.CharacterEncodingFilter
</filter-class>
<init-param>
<param-name>encoding</param-name>
<param-value>UTF-8</param-value>
</init-param>
<init-param>
<param-name>forceEncoding</param-name>
<param-value>true</param-value>
</init-param>
</filter>

其中encoding设置服务端编码和解码的方式

forceEncoding表示强制编码的方式


3 字符串转字节转码

String s = "s汉";
byte[] bytes1 = s.getBytes("ISO-8859-1");//丢失字符
byte[] bytes2 = s.getBytes("GBK");
byte[] bytes3 = s.getBytes("UTF-8");


4 字节转字符串

String s1 = new String(bytes1,"utf-8");//丢失
String s2 = new String(bytes2,"GBK");
String s3 = new String(bytes3,"utf-8");
















版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/tangyanbo1110/article/details/40921313

智能推荐

光学efl_EFL投影式光固化生物3D打印四大亮点_祝峰的博客-程序员宅基地

投影式光固化生物3D打印分辨率高、打印速度快、可实现复杂结构精细打印,在水凝胶/细胞高精度批量制造上具有显著优势,适合于临床及动物实验中批量可重复需求,已逐渐成为主流生物3D打印方法。EFL团队持续攻关,推出了系列高精度投影式光固化生物3D打印机(EFL-BP-8600/8601)。l 点击文中出现的红色字体打开延伸阅读ll 欢迎在文后留言申请长期转载授权l▲EFL系列高精度投影...

使用Docker部署SpringBoot项目_情殇龙灵的博客-程序员宅基地

一、将jar包构建成docker镜像1.将jar包上传至linux目录2.创建Dockerfile文件[[email protected] jrkj-java]# vi Dockerfile文件内容如下:#JDK版本FROM java:8#挂载目录VOLUME /tmp#将jar包自定义镜像容器名称ADD jrkj-muck-0.0.1-SNAPSHOT.jar /jrkj-muck.jar#执行命令ENTRYPOINT ["java","-Djava.security.egd=fil

基于vue做一个禅道主页拖拽效果_weixin_33725515的博客-程序员宅基地

不bb先看效果源码地址bb两句最近在做一个基于vue的后台管理项目。平时项目进度统计就在上禅道上进行。so~ 然后领导就感觉这个拖拽效果还行,能不能加到咱们项目里面。 既然领导发话,那就开干。。所有技术:vue + vuedraggable拖动的实现基于 vuedraggable的插件开发。主页为两栏流式布局,每一个组件可以在上下拖动,也可以左右拖动。基本步骤布局这块布局为...

手册如何看运放的db_深入鉴别运放手册之噪声篇的内容分析_不教书的塞涅卡的博客-程序员宅基地

一个有趣的问题?2 个 1kΩ 电阻串联,与 1 个 2kΩ 电阻噪声一致吗?2 个 500Ω 电阻并联,与 1 个 2kΩ 电阻噪声一致吗?噪声的基本特性1) 它的波形在任意时刻都是不确定的,因此它是广谱的,有低频也有高频;2) 它的幅度又是有限制的,这与数学上的高斯分布近似但不完全一致;具有短时波形性以及长期稳定性。3) 它具有无限积分趋零性。怎么衡量噪声的大小?1) 有效值:有效值Urms是...

echarts.min.js_AS、SD的博客-程序员宅基地_echarts.min.js

/** Licensed to the Apache Software Foundation (ASF) under one* or more contributor license agreements. See the NOTICE file* distributed with this work for additional information* regarding copyright ownership. The ASF licenses this file* to you un.

2021-07-18_goodsapple1的博客-程序员宅基地

上锁的主要是两个步骤设备加密,这块主要是与android管理设备密码服务相关显示锁屏界面,即展开通知面板,同时加载密码界面的布局,但是会隐藏起来,等到向上划去锁屏界面才显示更新activity stack的状态,锁屏下的activity会被置为onstop执行上锁的流程是调用KeyguardViewMediator的doKeyguardLocked函数来完成的private void doKeyguardLocked(Bundle options) {if (!mExternallyEnable

随便推点

test editor_qhdxds的博客-程序员宅基地

namespace caffe {/** * @brief A wrapper around SyncedMemory holders serving as the basic *        computational unit through which Layer%s, Net%s, and Solver%s *        interact. * * T

Set Data Format in Excel Using POI 3.0(XSSF/HSSF)_caolaosanahnu的博客-程序员宅基地

http://www.roseindia.net/java/poi/setdataformat.shtmlIn this program we are setting data format in excel file using Java. POI version 3.0 provides a new feature for manipulating various file for

链路追踪(Tracing)的前世今生(上)_腾讯云开发者的博客-程序员宅基地_网络链路 trac

带着疑问看历史提起链路追踪,大部分人都会想起 Zipkin、Jaeger、Skywalking 这些已经比较成熟的链路追踪开源软件以及 Opentelemetry、OpenTracing、OpenCensus 这些开源标准。虽然实现各有差异,但是使用各种软件、标准和实现组合搭建出来的不同的链路追踪系统,却有着许多相类似的地方。例如这些链路追踪系统都需要在调用链路上传播元数据。他们对元数据内容的定义也大同小异,链路唯一的 trace id, 关联父链路的 parent id,标识自身的 span id .

那些web前端经典面试题大全及答案_weixin_33743703的博客-程序员宅基地

阅读目录JavaScript部分JQurey部分HTML/CSS部分正则表达式开发及性能优化部分本篇收录了一些面试中经常会遇到的经典面试题以及自己面试过程中遇到的一些问题,并且都给出了我在网上收集的答案。马上就要过春节了,开年就是崭新的一年,相信很多的前端开发者会有一些跳槽的悸动,通过对本篇知识的整理以及经验的总结,希望能帮到更多的前端面试者。(如有错误或更好的答案,欢迎指正,水平有限,望各位不吝...

判断两个vector是否相等_weixin_30809333的博客-程序员宅基地

转载:http://blog.chinaunix.net/xmlrpc.php?r=blog/article&amp;uid=26354188&amp;id=3198604 1 #include &lt;iostream&gt; 2 #include &lt;vector&gt; 3 4 using namespace std; 5 6 int ma...

cs231n笔记-dropout正则化_AG9GgG的博客-程序员宅基地

L1、L2正则化L2正则化在神经网络中可能意义并不是很明确,有时候我们会在神经网络中选择其他方案。一个在神经网络中非常常用的方法:dropoutdropout每次在网络中正向传递时,我们在每一层随机将一部分神经元置0,每次正向传递时,随机被置0的神经元都不是完全相同的,每次处理网络中的一层。下图左侧为全连接神经网络,右边为dropout的版本。dropout之后的网络规模变小,我们只...

推荐文章

热门文章

相关标签