西文字符的編碼
西文是由拉丁字母、數字、標點符號及一些特殊符號所組成的,它們統稱為字符。所有字符的集合稱為字符集。字符集有多種,每一字符集的編碼方法也多種多樣。目前計算機中使用最廣泛的西文字符集及其編碼是ASCII碼,即美國標準信息交換碼。每個字符都由7個二進位表示。
ASCII碼是7位的編碼,但由于字節是計算機中的基本處理單位,故一般仍以一字節來存放一個ASCII字符。
GB 2312漢字編碼
1981年我國頒布了第一個漢字編碼的國家標準——《信息交換漢字編碼字符集·基本集》(GB 2312)。該標準選出6 763個常用漢字和682個非常用漢字字符,為每個字符規定了標準代碼,這個標準所收集的字符及其編碼為國標碼,又稱為國標交換碼。
GB 2312國標字符集由3部分組成。第一部分是字母、數字和各種符號,包括拉丁字母、俄文、日文平假名與片假名、希臘字母、漢語拼音等共682個;第二部分為一級常用漢字,共3 755個,按漢語拼音排列;第三部分為二級常用漢字,共3 008個,因不太常用,所以按偏旁部首列。
GB 2312的所有字符分布在一個94行×94列的二維平面內,行號稱為區號,列號稱為位號。區號和位號的組合就可以作為漢字字符的編碼,稱為漢字的區位碼。
區號和位號各用8個二進位表示,它們的最高位均設置為1。這樣得到的高位勻為1的雙字節漢字編碼就稱為GB 2312漢字的“機內碼”,又稱為內碼。PC中GB 2312漢字的表示都采用這種方式。
GBK漢字內碼擴充規范
GBK是我國1995年發布的又一個漢字編碼標準,全稱為《漢字內碼擴展規范》。
UCS/Unicode與GB 18030編碼標準
UCS/Unicode規定,全世界現代書面文字所使用的所有字符和符號都集中在一個字符集中統一進行編碼。目前的做法是采用雙字節編碼。
文稿的輸入
漢字輸入的編碼方法大體可分成以下4類:
1. 數字編碼。
2. 字音編碼。
3. 字形編碼。
4.音形混合編碼。
文本的編輯與排版
文本編輯就是對已輸入的文字內容進行增加、刪除或修改,直到滿意為止。使用文字處理軟件(如Word、WPS等)。
相關推薦:
北京 | 天津 | 上海 | 江蘇 | 山東 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內蒙古 |