java中文问题-浅析
2008-02-23 09:59:20来源:互联网 阅读 ()
JSP之中什么问题最难处理?小弟在几天前想安装jsp+Javabean论坛acjsPBbs,研究了3天之后,明白了答案就是java中处理中文的问题。
acjspbbs采用的字符编码是GBK,我采用的是WIN2k系统,正常来说应该是水到渠成的,但是,竟然被我发现,它的javabean中保存入数据库语句是使用的是ISO8859-1编码,直接导致所以从数据库取出的资料全部乱码,包括:论坛名等常量、用户发的帖子标题和内容等等。
其实,java系统内部会把全部的字符串统一使用UTF-8编码,而在内部转化之前会使用操作系统默认的编码,其中包括输入和输出。要想不乱码,只需要“统一java系统的输入、输出以及操作系统的字符集”,这也是处理java系统汉字的一个原则。原因是由于java的跨平台特性,字符集必须由具体的操作系统给出。
由此可以得到一个最简单的解决jsp乱码的办法,其中主要需要把握三个环节:
1、开发和编译代码时就指定一个字符集,比如ISO-8859-1(西方的系统多数使用这个)
2、确定操作系统的字符集跟1统一,比如也用ISO-8859-1,这样的OS有很多,Linux就是啦
3、如果开发jsp,每个页面都明确指定字符集:
<%@ page contentType="text/html;charSet=ISO8859-1" %>
这样就达到了前面的目标,统一了三者的字符编码。
这样的系统虽然很好,没有乱码问题,但是显然是以破坏跨平台特性为代价换取来的。想要根本解决问题,看来只有将java系统统一为UTF-8编码,这需要找到所有的出入口。
具体需要注意以下几个环节:
1、开发和编译时候指定字符集为UTF-8
2、用过滤器将所有请求转为UTF-8字符集编码
如果是用一个Servlet控制分配的就在servlet的filter中写
request.setCharacterEncoding("UTF-8")
如果是用jsp页面,就在头部定义
<%@ page contentType="text/html;charSet=UTF-8" %>
3、在所有的输出上包括数据库连接上都指定使用字符集UTF-8
另外:如果你在做二次开放,就需要重新编译包,指定使用UTF-8编码
附:在编译时指定字符集的语法是javac -encoding <encoding> <sourcefile>
说明:这里很多观点是引用他人的,但是我自己使用过,是绝对有效的解决办法。
上一篇: java日记:学习java一年体会4
下一篇: [原创] Eclipse 3.1M5a中创建RCP程序
标签:
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有
下一篇:WebWork2源码分析续一
IDC资讯: 主机资讯 注册资讯 托管资讯 vps资讯 网站建设
网站运营: 建站经验 策划盈利 搜索优化 网站推广 免费资源
网络编程: Asp.Net编程 Asp编程 Php编程 Xml编程 Access Mssql Mysql 其它
服务器技术: Web服务器 Ftp服务器 Mail服务器 Dns服务器 安全防护
软件技巧: 其它软件 Word Excel Powerpoint Ghost Vista QQ空间 QQ FlashGet 迅雷
网页制作: FrontPages Dreamweaver Javascript css photoshop fireworks Flash