ASCII码和汉字编码_新时代项目网

接触了计算机的一些人，不论其学习时间长短，经常会问我些问题：汉字和一些符号是如何输入的，有无规律可循，等等。今天开始，我慢慢道来。

ASCII（ Code for ，美国信息交换标准代码）是基于拉丁字母的一套电脑编码系统，主要用于显示现代英语和其他西欧语言。它是现今最通用的单字节编码系统，并等同于国际标准ISO/IEC 646。

计算机技术始于美国，创始人（国）大都具有制订标准的权力。

ASCII码是由美国国家标准学会( , ANSI )制定的，标准的单字节字符编码方案，用于基于文本的数据，共128个。起始于50年代后期，在1967年定案。

它最初是美国国家标准，供不同计算机在相互通信时用作共同遵守的西文字符编码标准，它已被国际标准化组织（ for , ISO）定为国际标准，称为ISO 646标准。适用于所有拉丁文字字母。

因十进制、十六进制使用得多，列于表上。2、8进制反之，未列上。

键盘和鼠标每次敲击，都有唯一编码代表具体符号或功能，这样才精准不乱。

ASCII 码，使用指定的7位或8位二进制数组合来表示128 或256 种可能的字符，还有8、10、16位几种表达方式。

标准ASCII 码，也叫基础ASCII码，使用7 位二进制数（剩下的1位二进制为0）来表示所有的大写和小写字母，数字0 到9、标点符号，以及在美式英语中使用的特殊控制字符。

其中：0～31及127(共33个)是控制字符或通信专用字符，显示不出来。如控制符：LF（换行）、CR（回车）、FF（换页）、DEL（删除）、BS（退格)、BEL（响铃）等；通信专用字符：SOH（文头）、EOT（文尾）、ACK（确认）等；ASCII值为8、9、10 和13 分别转换为退格、制表、换行和回车字符。

32～126(共95个)是字符(32是空格），其中48～57为0到9十个阿拉伯数字。

65～90为26个大写英文字母，97～122号为26个小写英文字母，其余为一些标点符号、运算符号等。

如：计算机上的DEL()键，十进制ASCII码为127，十六进制为7F。

扩展ASCII

1981年，美国IBM公司公布了IBM PC 个字符的字符集，即IBM扩展字符集。扩展ASCII 字符是从128 到255（0x80-0xff）的字符,但不再是国际标准。

1985年，美国MS公司公布字符集，被称作“ANSI字符集”，遵循了ANSI草案和ISO标准（ANSI/-1-1987，简“Latin 1”。)

1987年4月代码页437,字符的映像代码，在MS-DOS3.3出现。

汉字编码对照表_编码对应汉字_编码对照汉字表图片

ASCII拼图

问题提出

1、ASCII码是美国人制订的美国标准，不能良好满足其它讲英语国家的需要。例如英国的英镑符号（￡）在哪里？

2、拉丁语字母表重音符号，又如何表示？

3、使用斯拉夫字母表的希腊语、希伯来语、阿拉伯语和俄语，怎么办？

4、始于中国的象形文字汉字编码对照表，如中国汉字，日本和朝鲜文字，又怎么表示？

1967年，国际标准化组织（ISO：）推荐一个ASCII的变种，代码0x40、0x5B、0x5C、0x5D、0x7B、0x7C和0x7D“为国家使用保留”，而代码0x5E、0x60和0x7E标为“当国内要求的特殊字符需要8、9或10个空间位置时，可用于其它图形符号”。

DBCS（双字节字符集，-byte set）,解决中国、日本和韩国的象形文字符和ASCII的某种兼容性。

DBCS从256代码开始，就像ASCII一样。与任何行为良好的代码页一样，最初的128个代码是ASCII。

汉字编码

（1）汉字国标码和区位码

计算机中一个汉字用两个字节的编码表示，我国制定了“中华人民共和国国家标准信息交换汉字编码字符集(基本集—1980)”，简称国标码，是计算机进行汉字信息处理和汉字信息交换的标准编码。

在该编码中，共收录汉字和图形符号7445个，其中一级常用汉字3755个(按汉语拼音字母顺序排列)，二级常用汉字3008个(按部首顺序排列)，图形符号682个。

在-1980中规定，全部国标汉字及符号组成一个94×94的矩阵。在此矩阵中，每一行称为一个“区”，每一列称为一个“位”。于是构成了一个有94个区(01～94区)，每个区有94个位(01～94位)的汉字字符集。区码与位码组合在一起就形成了“区位码”，唯一地确定某一汉字或符号。

区位码的分布规则如下：

1)01～09区：图形符号区。

2)10～15区：自定义符号区。

3)16～55区：一级汉字区，按汉字拼音排序，同音字按笔画顺序。

4)56～87区：二级汉字区，按偏旁部首、笔画排序。

5)88～94区：自定义汉字区。

汉字输入码

汉字输入码，就是用于使用西文键盘输入汉字的编码。每个汉字对应一组由键盘符号组成的编码，不同的汉字输入法其输入码不同。汉字输入码也称外码。

常见的汉字输入编码方案可分为如下4类：

1)数码：用数字组成的等长编码，典型代表有区位码、电报码。

2)音码：根据汉字的读音组成的编码，典型代表有全拼码和双拼码。

3)形码：根据汉字的形状、结构特征组成的编码，典型代表有五笔字型、表形码。

4)音形码：将汉字读音与其结构特征综合考虑的编码，典型代表有自然码、首尾拼音码。

汉字内码

无论用户用哪种输入法，汉字输入到计算机后都转换成汉字内码进行存储，以方便机内的汉字处理。汉字内码是采用双字节的变形国标码，在每个字节的低7位与国标码相同，每个字节的最高位为1，以与ASCII码字符编码区别。

汉字字形码

汉字字形码(汉字输出码),是将点阵组成的汉字模型数字化，形成一串二进制数称为汉字字形码，其主要用于输出汉字。输出汉字时，将汉字字形码再还原为由点阵构成的汉字，所以汉字字形码又被称为汉字输出码。

汉字是一种象形文字，每一个汉字可以看成是一个特定的图形，这种图形可以用点阵、轮廓向量、骨架向量等多种方法表示，而最基本的是用点阵表示。如果用16×16点阵来表示一个汉字，则一个汉字占16行，每一行有16个点，其中每一个点用一个二进制位表示，值“0” 表示暗，值“1”表示亮。由于计算机存储器的每个字节有8个二进制位，因此，16个点要用两个字节来存放，16×16点阵的一个汉字字形需要用32个字节来存放，这32个字节中的信息就构成了一个16×16点阵汉字的字模。

以上只是简单介绍，让大家对计算机字符编码有个基本印象，下回给大家介绍万国码，包括世界上所有语言文字。好东西等着吧！

会员全站资源免费获取，点击查看会员权益

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

ASCII码国标码汉字信息处理汉字编码计算机编码

发表回复取消回复

联系站长

相关文章

发表回复 取消回复

发表回复取消回复