漢字機內碼占幾個字節

【漢字機內碼占幾個字節】一個漢字的機內碼占2個字節!

漢字機內碼占幾個字節


一個漢字的機內碼占2個字節 。因為漢字處理系統要保證中西文的兼容 , 當系統中同時存在ASCII碼和漢字國標碼時 , 將會產生二義性 。
計算機只識別由0、1組成的代碼 , ASCII碼是英文信息處理的標準編碼 , 漢字信息處理也必須有一個統一的標準編碼 。漢字交換碼(國標碼)主要用于漢字信息交換 , 我國國家標準局于1981年5月頒布了《信息交換用漢字編碼字符集——基本集》 , 代號為GB2312-80 , 共對6763個漢字和682個圖形字符進行了編碼 , 其編碼原則為:漢字用兩個字節表示 , 原則上 , 兩個字節可以表示256×256=65536種不同的符號 , 作為漢字編碼表示的基礎是可行的 。但考慮到漢字編碼與其它國際通用編碼 , 如ASCII西文字符編碼的關系 , 我國國家標準局采用了加以修正的兩字節漢字編碼方案 , 只用了兩個字節的低7位 。這個方案可以容納128×128=16384種不同的漢字 , 但為了與標準ASCII碼兼容 , 每個字節中都不能再用32個控制功能碼和碼值為32的空格以及127的操作碼 。所以每個字節只能有94個編碼 。這樣 , 雙七位實際能夠表示的字數是:94×94=8836個 。

    猜你喜歡