java中文問題

duduwolf 2005-08-06

展開全文

Java中文問題一直是困饒著初學(xué)java的主要問題，而且即使接觸java有一段時(shí)間的“老手”也經(jīng)常會(huì)在java的中文問題上栽跟頭。下面就我個(gè)人理解，對Java中文問題進(jìn)行一些闡釋。

理解Java內(nèi)部關(guān)于編碼的原理：

Java內(nèi)部是Unicode編碼，所謂Unicode編碼即是：全世界所有符號(hào)進(jìn)行了統(tǒng)一編碼的結(jié)果。但是有一點(diǎn)值得提出一下，用它來處理漢字是合適的，但是英文卻吃虧了，要用多一倍的空間來存儲(chǔ)。所以程序員們寫的程序不支持UNICODE情況很常見。

其他相關(guān)編碼方式還有（說一些和中文相關(guān)的大家也許經(jīng)常見到的編碼方式）：GB2312和GBK。其中GB2312是對GBK的升級(jí)，GBK是GB2312的一個(gè)子集，例如GB2312可以支持繁體字。BIG5是臺(tái)灣編碼方式。ISO8859-1編碼：ISO8859_1，這個(gè)是英文系統(tǒng)缺省的8bit編碼，因?yàn)槭?/SPAN>8bit的，所以不會(huì)把漢字的高位刪去，所以用它也是可以處理漢字的。

理解Java的IO機(jī)制：

Java的IO基類分為：InputStream、OutputStream和Reader、Writer

在I/O時(shí)如果使用Reader/Writer就要發(fā)生編碼轉(zhuǎn)換，使用系統(tǒng)屬性file.encoding作為編碼方式。如果使用Stream就沒有轉(zhuǎn)換的事情了，那是Binary的數(shù)據(jù)。

1、在Reader/Writer上加encoding的選項(xiàng)時(shí)候，在Reader中的encoding表示把數(shù)據(jù)從encoding轉(zhuǎn)換成Unicode，writer就是把Unicode的字符轉(zhuǎn)換成encoding格式的。

2、用String.getByte()把字符串轉(zhuǎn)換成指定編碼。

JSP/Servlet問題：

JSP/Servlet的中文問題有兩種解決辦法：

1、不在程序中進(jìn)行編碼轉(zhuǎn)換，把這個(gè)工作交給瀏覽器，方法就是用javac –encoding GBK *.java來編譯所有的bean，然后在JSP頁面上加
<%@ page contentType="text/html;charset=gb2312" %>或者是在HTML中直接加： <meta http-equiv="Content-Type" content="text/html; charset=gb2312">
到底加那個(gè)，試試就知道了。

2、在程序中指定編碼，用javac –encoding ISO8859_1 *.java來編譯所有的bean，在涉及到中文顯示的程序上加
str=new String(str.getBytes("ISO8859_1"));

上面兩種方法不能混用，意思就是要么就是GBK，要么就是ISO8859_1，從里到外都一樣就好了。

另外一個(gè)好辦法就是采用filter：

import javax.servlet.*;

import java.io.*;

public class RequestEncodeFilter implements Filter {

String charset = null;

public void init(FilterConfig config) throws ServletException {

charset = config.getInitParameter("charset");

if (charset == null)

charset = "GBK";

}

public void doFilter(ServletRequest request, ServletResponse response,

FilterChain chain) throws IOException,

ServletException {

request.setCharacterEncoding(charset);

chain.doFilter(request, response);

}

public void destroy() {

}

在你的web.xml配置好fillter就可以了。這個(gè)方法是最便捷的，基本可以實(shí)現(xiàn)讓java程序員原理中文問題。

數(shù)據(jù)庫JDBC的中文問題：

一般只要按照數(shù)據(jù)庫指定的編碼進(jìn)行轉(zhuǎn)換，比如按照ISO8859_1讀，ISO8859_1寫，一般就沒什么問題了。我也碰到過一些例外情況，如：對于存儲(chǔ)的代碼不進(jìn)行轉(zhuǎn)碼機(jī)制，在數(shù)據(jù)庫中存儲(chǔ)的是亂碼。但是，讀取的時(shí)候卻是正常的中文。我想這正好是Unicodeà特定coding—>Unicode編碼，所以湊巧碰上了吧，我想數(shù)據(jù)庫內(nèi)部處理過程在起作用吧，當(dāng)然我們誰也不喜歡一打開數(shù)據(jù)庫看到的是一堆亂碼。那就還是按照自己指定的方式來進(jìn)行轉(zhuǎn)碼解碼吧。

另外一種辦法是：在JDBC連接數(shù)據(jù)庫過程就進(jìn)行字符編碼轉(zhuǎn)換：

如：ConnectionString="jdbc:mysql://localhost/dbname?user=root&password=dphw&useUnicode=true&characterEncoding=8859_1(mysql的例子)

java和javaw:

他們的區(qū)別就不多說了，主要是java會(huì)在黑窗口下進(jìn)行，而javaw不會(huì)，所以例如jb這樣的開發(fā)工具都是默認(rèn)采用javaw來進(jìn)行run這些java的class的。

但是有一點(diǎn)需要提出的是：

javaw會(huì)使用與java不同的Local配置進(jìn)行工作，導(dǎo)致了一些中文問題，而java就是好好的。JBuilder也是好好的，沒有問題，調(diào)用javaw也不是它的錯(cuò)，難道你想每次運(yùn)行或者調(diào)試的時(shí)候蹦出個(gè)DOS黑框么？

可以采用如下辦法解決jb中的javaw造成的中文問題。

在JBuilder中選擇Project->Project Properties->run->edit->VM Parameters，填上-Dfile.encoding=GBK -Ddefault.client.encoding=GBK -Duser.language=zh -Duser.region=CN 就行了！

原理也就是在javaw加上如上的配置參數(shù)。

其他配置方面：

在JDK低版本和UNIX下，需要改動(dòng)font.properties，讓JAVA VM能夠找到合適的字體來顯示漢字。

總結(jié)：

上面就我所接觸的幾個(gè)方面談?wù)?/SPAN>java的中文問題。其中包括理解Java內(nèi)部關(guān)于編碼的原理、理解Java的IO機(jī)制、JSP/Servlet問題、數(shù)據(jù)庫JDBC的中文問題、java和javaw、其他配置方面。

肯定會(huì)有許多疏漏的地方，希望各位給予補(bǔ)充。

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自： duduwolf > 《編程》

舉報(bào)/認(rèn)領(lǐng)