Java中文問題詳細說明(高手必讀） - 明輝手游網

<form id="hz9zz"></form>

<form id="hz9zz"></form>

<nobr id="hz9zz"></nobr>

<form id="hz9zz"></form>

明輝手游網中心：是一個免費提供流行視頻軟件教程、在線學習分享的學習平臺！

文章發布全站軟件文章熱門搜索：酷狗音樂最新 APP 評測沒聲音正常資訊首頁騰訊視頻愛奇藝暴風影音酷狗音樂酷我音樂影音大全軟件下載軟件教程電腦系統下載聊天工具辦公軟件殺毒教程系統工具圖形圖像電腦學習應用軟件網絡軟件蘋果應用注冊碼網站教程技術開發安卓教程其它教程您當前所在位置：網視手游站 -> 技術開發 -> Java中文問題詳細說明(高手必讀）
Java中文問題詳細說明(高手必讀）發表時間：2023-08-18 來源：明輝站整理相關軟件相關文章人氣： [摘要]我來說一下tomcat如何實現JSP的你就明白了。預備知識：　1.字節和unicode　　Java內核是unicode的，就連class文件也是，但是很多媒體，包括文件/流的保存方式　　是使用字節流... 我來說一下tomcat如何實現JSP的你就明白了。預備知識：　1.字節和unicode 　　Java內核是unicode的，就連class文件也是，但是很多媒體，包括文件/流的保存方式　　是使用字節流的。因此Java要對這些字節流經行轉化。char是unicode的，而byte是字節. 　　Java中byte/char互轉的函數在sun.io的包中間有。其中ByteToCharConverter類是中調度，　　可以用來告訴你，你用的Convertor。其中兩個很常用的靜態函數是　　 public static ByteToCharConverter getDefault() ; 　　 public static ByteToCharConverter getConverter(String encoding); 　　如果你不指定converter，則系統會自動使用當前的Encoding,GB平臺上用GBK,EN平臺上用　　8859_1 　　　　我們來就一個簡單的例子：　　　　　"你"的gb碼是：0xC4E3 ,unicode是0x4F60 　　　　　你用: 　　　　　--encoding="gb2312"; 　　　　　--byte b[]={(byte)'\u00c4',(byte)'\u00E3'}; 　　　　　--convertor=ByteToCharConverter.getConverter(encoding); 　　　　　--char [] c=converter.convertAll(b); 　　　　　--for(int i=0;i<c.length;c++) 　　　　　--{ 　　　　　-- System.out.println(Integer.toHexString(c[i])); 　　　　　--} 　　　　　--打印出來是0x4F60 　　　　　--但是如果使用8859_1的編碼，打印出來是　　　　　--0x00C4,0x00E3 　　　　　----例１　　　　反過來：　　　　 --encoding="gb2312"; 　　　　　　　char c[]={'\u4F60'}; 　　　　　　　 convertor=ByteToCharConverter.getConverter(encoding); 　　　　　--byte [] b=converter.convertAll(c); 　　　　　--for(int i=0;i<b.length;c++) 　　　　　--{ 　　　　　-- System.out.println(Integer.toHexString(b[i])); 　　　　　--} 　　　　　　--打印出來是：0xC4,0xE3 　　　　　　----例２　　　　　　--如果用8859_1就是0x3F，?號，表示無法轉化　　　　　　-- 　　　　　很多中文問題就是從這兩個最簡單的類派生出來的。而卻有很多類　　　　不直接支持把Encoding輸入，這給我們帶來諸多不便。很多程序難得用encoding 　　了，直接用default的encoding，這就給我們移植帶來了很多困難　　-- 　　2.UTF-8 　　--UTF-8是和Unicode一一對應的，其實現很簡單　　-- 　　 -- 7位的Unicode: 0 _ _ _ _ _ _ _ 　　--11位的Unicode: 1 1 0 _ _ _ _ _ 1 0 _ _ _ _ _ _ 　　--16位的Unicode: 1 1 1 0 _ _ _ _ 1 0 _ _ _ _ _ _ 1 0 _ _ _ _ _ _ 　　--21位的Unicode: 1 1 1 1 0 _ _ _ 1 0 _ _ _ _ _ _ 1 0 _ _ _ _ _ _ 1 0 _ _ _ _ _ _ 　　--大多數情況是只使用到16位以下的Unicode: 　　--"你"的gb碼是：0xC4E3 ,unicode是0x4F60 　　--我們還是用上面的例子　　--　　--例１：0xC4E3的二進制：　　--　　--　　　 1 1 0 0 0 1 0 0 1 1 1 0 0 0 1 1 　　--　　--　　　由于只有兩位我們按照兩位的編碼來排，但是我們發現這行不通，　　--　　--　　　因為第７位不是0因此，返回"?" 　　--　　--　　　　　--　　--例２：0x4F60的二進制：　　--　　--　　　 0 1 0 0 1 1 1 1 0 1 1 0 0 0 0 0 　　--　　--　　　我們用UTF-8補齊，變成：　　--　　--　　　 11100100 10111101 10100000 　　--　　--　　　 E4--BD-- A0 　　--　　--　　　于是返回0xE4,0xBD,0xA0 　　--　　-- 　　3.String和byte[] 　　--String其實核心是char[],然而要把byte轉化成String，必須經過編碼。　　--String.length()其實就是char數組的長度，如果使用不同的編碼，很可　　--能會錯分，造成散字和亂碼。　　--例：　　----byte [] b={(byte)'\u00c4',(byte)'\u00e3'}; 　　----String str=new String(b,encoding);　　---- 　　----如果encoding=8859_1，會有兩個字，但是encoding=gb2312只有一個字　　---- 　　--這個問題在處理分頁是經常發生　　4.Reader,Writer/InputStream,OutputStream 　　--Reader和Writer核心是char，InputStream和OutputStream核心是byte。　　--但是Reader和Writer的主要目的是要把Char讀/寫InputStream/OutputStream --一個reader的例子： --文件test.txt只有一個"你"字，0xC4,0xE3-- --String encoding=; --InputStreamReader reader=new InputStreamReader( ----new FileInputStream("text.txt"),encoding); --char []c=new char[10]; --int length=reader.read(c); --for(int i=0;i<c.length;i++) ----System.out.println(c[i]); 　　--如果encoding是gb2312，則只有一個字符，如果encoding=8859_1，則有兩個字符　　-------- -- -- 　　　　 ---- 　2.我們要對Java的編譯器有所了解：　--javac -encoding 　我們常常沒有用到ENCODING這個參數。其實Encoding這個參數對于跨平臺的操作是很重要的。　如果沒有指定Encoding，則按照系統的默認Encoding,gb平臺上是gb2312，英文平臺上是ISO8859_1�！� 　--Java的編譯器實際上是調用sun.tools.javac.Main的類，對文件進行編譯，這個類　-- 　有compile函數中間有一個encoding的變量,-encoding的參數其實直接傳給encoding變量。　編譯器就是根據這個變量來讀取java文件的，然后把用UTF-8形式編譯成class文件。　一個例子：　--public void test() 　--{ 　----String str="你"; 　----FileWriter write=new FileWriter("test.txt"); 　----write.write(str); 　----write.close(); 　--} 　----例３ --如果用gb2312編譯，你會找到E4 BD A0的字段 -- --如果用8859_1編譯， --00C4 00E3的二進制： --00000000 11000100 00000000 11100011-- --因為每個字符都大于7位，因此用11位編碼： --11000001 10000100 11000011 10100011 --C1-- 84--　C3--　 A3 --你會找到C1 84 C3 A3 -- 　　　　　　但是我們往往忽略掉這個參數，因此這樣往往會有跨平臺的問題：　　--　　例３在中文平臺上編譯，生成ZhClass 　　--　　例３在英文平臺上編譯，輸出EnClass 　　--1.　 ZhClass在中文平臺上執行OK,但是在英文平臺上不行　　--2.　 EnClass在英文平臺上執行OK,但是在中文平臺上不行　　原因：　--1.在中文平臺上編譯后，其實str在運行態的char[]是0x4F60,　---- 　--在中文平臺上運行，FileWriter的缺省編碼是gb2312,因此　--CharToByteConverter會自動用調用gb2312的converter,把str轉化　--成byte輸入到FileOutputStream中，于是0xC4,0xE3放進了文件。　--但是如果是在英文平臺下，CharToByteConverter的缺省值是8859_1, 　--FileWriter會自動調用8859_1去轉化str,但是他無法解釋，因此他會　--輸出"?"　---- 　--2.　在英文平臺上編譯后，其實str在運行態的char[]是0x00C4 0x00E3,　---- 　--在中文平臺上運行，中文無法識別，因此會出現?? 　--　　在英文平臺上，0x00C4-->0xC4,0x00E3->0xE3，因此0xC4,0xE3被放進了　--文件 ---- 1.對于JSP正文的解釋： --Tomcat首先看一下你的葉面中有沒有"<%@page include的符號。有，則在相同 --地方設定response.setContentType(..);按照encoding的來讀，沒有他按照8859_1 --讀取文件，然后用UTF-8寫成.java文件，然后用sun.tools.Main去讀取這個文件， --（當然它使用UTF-8去讀），然后編譯成class文件 --setContentType改變的是out的屬性，out變量缺省的encoding是8859_1 2.對Parameter的解釋 --很不幸Parameter只有ISO8859_1的解釋，這個質料可以在servlet的實現代碼中找到。 3.對include的解釋格式的，但是很不幸，由于那個寫"org.apache.jasper.compiler.Parser"的人在數組JspUtil.ValidAttribute[]忘記加了一個參數：encoding,因此導致不支持這種方式。你完全可以編譯源代碼，加上對encoding的支持總結：如果你在NT底下，最簡單的方法就是欺騙java,不加任何Encoding變量： <html> 你好<%=request.getParameter("value")%> </html> http://localhost/test/test.jsp?value=你結果:你好你但這種方法局限性較大，比如對上傳的文章分段，這樣的做法是死定的，最好的解決方案是用這種方案： <%@ page contentType="text/html;charset=gb2312" %> <html> 你好<%=new String(request.getParameter("value").getBytes("8859_1"),"gb2312")%> </html> 標簽：Java中文問題詳細說明(高手必讀）上一篇：RFC821-容易郵件傳輸協議（SMTP）中文版 - 0 下一篇：Linux簡明系統維護手冊(5)	推薦資訊總人氣榜 1PS提示：因為圖層已鎖定，無法編輯圖層的處理方法 2picacg蘋果版怎么找不到\|picacg ios版是不是下架了介紹 3Adobe Illustrator CS5 序列號大全 4ACDsee注冊碼免費分享（含ACDsee18、ACDsee10等版本） 5Potato(土豆聊天)怎么換頭像\|Potato app更改頭像方法介紹 6PDF瀏覽器能看3D文件嗎？PDF瀏覽器看3D文件圖文詳細教程 7Potato(馬鈴薯聊天)怎么注冊不了\|Potato不能注冊處理方法介紹 8最新的Adobe Illustrator CS4序列號大全 9Intel i7-9700K性能跑分曝光：同代提升約12% 10qq郵件是否已讀怎么看 QQ郵箱已經發出去的郵件怎么知道對方是否已經查看 11XP系統怎么清除緩存？ 12Intel Z390主板有望10月8日公布：8核9代酷睿隨后登場 1PHP 留言簿（帶Oracle數據庫分頁的顯示技巧） 2php.ini 設置詳細選項 3轉：Java技術版主Jeru在IBM的DevelopWorks發表的對于設模的文章 4Visual C++剪貼板設置不完全攻略 5基于ACCESS數據庫的純asp論壇制作心得 610天學會php之首天 7PHP新手上路--6. 網絡資源 8Csharp+Asp.net系列圖文詳細教程（二） 9用PHP開發GUI（一個容易的例子） 10一個技巧完善的專欄管理的程序->這是asp.net的第二個應用(4) 113天學好ADO之首天 12讓動態創建的ActiveX控件響應Windows消息最新教程本月人氣 1劉徽《9章算術》中的勾股數 2JDBC 處理方案 3實時曲線的繪制與保存 4Resin服務器平臺介紹 5SMS中用Unicode編碼發送中文 6PHP中使用GD輸出漢字案例 76種迅速修理C# Bug的方法 8編程書寫規則 9在 WIN 平臺上讓你的 Apache 2.0.45 支持 PHP 108皇后問題的java完成 11使用ASP經常見問題回答 12MVC設計模式帶來更好的軟件結構與代碼重用 1獵豹瀏覽器搶票不受12306新版驗證碼影響 2ios9不越獄怎么恢復短信與照片 ios9不越獄恢復短信與照片圖文說明教程 310天學會php之首天 4抱抱app怎么玩抱抱app使用圖文說明教程圖 5360手機助手紅包怎么提現 360手機助手紅包提現設置流程 6160wifi遠程桌面怎么連接 160wifi遠程桌面連接設置方法 7微信PC版1.0.7.33官方下載公布修好bug優化軟件 8手機登12306驗證碼總是出錯處理方法介紹 9Linux內核4.2優化了哪一些地方？ 10linux系統使用命令維護RHCS的方法 113天學好ADO之首天 12小米note公布會視頻完整版 2015小米note公布會視頻直播
相關文章劉徽《9章算術》中的勾股數 JDBC 處理方案實時曲線的繪制與保存 Resin服務器平臺介紹 SMS中用Unicode編碼發送中文 PHP中使用GD輸出漢字案例 6種迅速修理C# Bug的方法編程書寫規則在 WIN 平臺上讓你的 Apache 2.0.45 支持 PHP 8皇后問題的java完成使用ASP經常見問題回答 MVC設計模式帶來更好的軟件結構與代碼重用

日韩精品一区二区三区高清