java - 關(guān)于字符串編碼。
問題描述
public static void main(String[] args) throws Exception { String str = 'resource'; System.out.println(Arrays.toString(getHash(str,'MD5').getBytes()));//使用默認解碼后輸出}public static String getHash(String str, String hashType) { try {MessageDigest digest = MessageDigest.getInstance(hashType);digest.reset();byte[] b = digest.digest(str.getBytes());System.out.println(Arrays.toString(b)); //編碼前輸出return new String(b); //使用默認編碼 } catch (NoSuchAlgorithmException e) {e.printStackTrace(); } return str;}
輸出:[-106, -85, 78, 22, 63, 78, -32, 58, -86, 77, 16, 81, -86, 81, -46, 4]
[-17, -65, -67, -17, -65, -67, 78, 22, 63, 78, -17, -65, -67, 58, -17, -65, -67, 77, 16, 81, -17, -65, -67, 81, -17, -65, -67, 4]
為什么編碼前和編碼后再解碼所輸出的不一樣?
問題解答
回答1:你可能認為(new String(b)).getBytes().equals(b),實際上并非如此。(盡管new String(s.getBytes()).equals(s)一定是。)
因為byte[]轉(zhuǎn)換成String時,有些字節(jié)是未必能轉(zhuǎn)換成字符的,比如第一個-106、第二個-85就是,所以轉(zhuǎn)換成String時前兩個就變成了未知字符(表面上會顯示?,但實際上是一個Unicode字符),再轉(zhuǎn)成byte[](你這邊defaultCharset應該是UTF-8吧),每個未知字符就變成3個字節(jié)了。
如果用GBK的話,情況還算好,但還是略有不同:
[-106, -85, 78, 22, 63, 78, -32, 58, -86, 77, 16, 81, -86, 81, -46, 4][-106, -85, 78, 22, 63, 78, 63, 58, -86, 77, 16, 81, -86, 81, 63, 4]
所以結(jié)論是:如果用String表示一個Hash值,不能把byte[]強轉(zhuǎn)換成String,而是按慣例轉(zhuǎn)換成16進制表示。
相關(guān)文章:
1. javascript - 請問有辦法透過 API 產(chǎn)生剖切面嗎?2. 在mac下出現(xiàn)了兩個docker環(huán)境3. node.js - win7 grunt不是內(nèi)部或外部命令。4. ios - Crash Log 里關(guān)于微信SDK的問題5. javascript - 如何獲取點擊事件點擊后前一個后一個的值。6. node.js - 微信小程序服務端websocket配置7. Ruby:無法抓取百度搜索結(jié)果8. angular.js - 百度爬蟲如何處理“#”符號?9. 微信端電子書翻頁效果10. mysql money 插入數(shù)據(jù)為什么報錯?
