漢字編碼方法
發(fā)布時(shí)間:2025-09-03 | 來(lái)源:互聯(lián)網(wǎng)轉(zhuǎn)載和整理
計(jì)算機(jī)中漢字的表示也是用二進(jìn)制編碼,同樣是人為編碼的。根據(jù)應(yīng)用目的的不同,漢字編碼分為外碼、交換碼、機(jī)內(nèi)碼和字形碼。
1.外碼(輸入碼)
外碼也叫輸入碼,是用來(lái)將漢字輸入到計(jì)算機(jī)中的一組鍵盤(pán)符號(hào)。常用的輸入碼有拼音碼、五筆字型碼、自然碼、表形碼、認(rèn)知碼、區(qū)位碼和電報(bào)碼等,一種好的編碼應(yīng)有編碼規(guī)則簡(jiǎn)單、易學(xué)好記、操作方便、重碼率低、輸入速度快等優(yōu)點(diǎn),每個(gè)人可根據(jù)自己的需要進(jìn)行選擇。
2.交換碼(國(guó)標(biāo)碼)
計(jì)算機(jī)內(nèi)部處理的信息,都是用二進(jìn)制代碼表示的,漢字也不例外。而二進(jìn)制代碼使用起來(lái)是不方便的,于是需要采用信息交換碼。中國(guó)標(biāo)準(zhǔn)總局1981年制定了中華人民共和國(guó)國(guó)家標(biāo)準(zhǔn)GB2312--80《信息交換用漢字編碼字符集--基本集》,即國(guó)標(biāo)碼。
區(qū)位碼是國(guó)標(biāo)碼的另一種表現(xiàn)形式,把國(guó)標(biāo)GB2312--80中的漢字、圖形符號(hào)組成一個(gè)94×94的方陣,分為94個(gè)“區(qū)”,每區(qū)包含94個(gè)“位”,其中“區(qū)”的序號(hào)由01至94,“位”的序號(hào)也是從01至94。94個(gè)區(qū)中位置總數(shù)=94×94=8836個(gè),其中7445個(gè)漢字和圖形字符中的每一個(gè)占一個(gè)位置后,還剩下1391個(gè)空位,這1391個(gè)位置空下來(lái)保留備用。
3.機(jī)內(nèi)碼
根據(jù)國(guó)標(biāo)碼的規(guī)定,每一個(gè)漢字都有了確定的二進(jìn)制代碼,在微機(jī)內(nèi)部漢字代碼都用機(jī)內(nèi)碼,在磁盤(pán)上記錄漢字代碼也使用機(jī)內(nèi)碼。
4.漢字的字形碼
字形碼是漢字的輸出碼,輸出漢字時(shí)都采用圖形方式,無(wú)論漢字的筆畫(huà)多少,每個(gè)漢字都可以寫(xiě)在同樣大小的方塊中。通常用16×16點(diǎn)陣來(lái)顯示漢字。
5.漢字地址碼
漢字地址碼是指漢字庫(kù)中存儲(chǔ)漢字字形信息的邏輯地址碼。它與漢字內(nèi)碼有著簡(jiǎn)單的對(duì)應(yīng)關(guān)系,以簡(jiǎn)化內(nèi)碼到地址碼的轉(zhuǎn)換