ASCII 码表
回忆上次内容
- ord(c)和chr(i)
- 这是俩函数
- 这俩函数是一对,相反相成的??
- ord 通过 字符 找到对应的 数字
- chr 通过 数字 找到对应的 字符
- 字符 的本质是 数字
- 字符都对应着一些数字
- 都连号好像应该是天经地义的?
- 为什么小写a从97开始?
- 但除了小写字母之外还有很多字符
- 他们都是如何分布的呢?
小写字母
#输出a,b,c
ord("a")
ord("b")
ord("c")
#输出a的相对序号
ord("a")-ord("a")
#输出z-a的数字差距,相对序号
ord("z")-ord("a")
- a、b、c 这些字符是挨着的
- 正好从0到25,总共26个
- 对应数字也是挨着的
编码规律
- 从 a-z 应该都是挨着的
- 为什么是从 97 开始?
- 低头看一下键盘
字符全排列
- 每一个字符都会对应一个序号
- 序号用二进制的方式存在字节(byte)中
- 一个字节(byte)总有8位(bit)
- 每一位(bit)是一个二进制(binary)数字(digit)
遍历范围
for i in range(2 ** 8):
print(i,end=",")
对应的字符
for n in range(255):
print(chr(n),end="")
if n % 16 == 0:
print()
- print(chr(n),end="")
- if n % 16 == 0:
结果
- 字母和数字还是挺完整的
- 这套对应关系有没有个名字呢?
ASCII 码表
- 当时美国的工程师定义了一套编码规则
- ASCII
- American Standard Code for Information Interchange
- 美国信息交换标准代码
- 这建立起了 字符 和 二进制01 的 映射关系
- 字符 和 二进制数 的 映射关系 如果不一致
- 面对同一个二进制数 01010101
- 就会映射到不同的字符
- 人们看到不同的字符就认为是乱码
- 这套ascii标准在各种计算机系统中需要统一
- 否则无法通信
- 这个 ASCII 什么时候开始有的呢?
初现
- 1967 年的时候就有了最初这个 ASCII 码表
- 当时计算机
- 低电平表示 0
- 高电平表示 1
- 电子计算机中所有的数据都是 0 和 1
- 先是由美国国家标准学会制定
- (American National Standard Institute , ANSI )
- 最初是美国的国家标准
- 被称作美国信息交换标准代码
- 美国之外的国家如何编码基本字符呢?
国际化
- 后来是国际标准化组织定为国际标准ISO
- International Organization for Standardization a.k.a. ISO
- 称为 ISO 646 标准
- 最后一次更新则是在 1986 年
- 能否完整系统地看到整个ascii码表的对应关系呢?
ascii
sudo apt install ascii
使用ascii
- 每一字符有三个部分组成
- Dec 对应的是 10 进制数
- Hex 对应的是 16 进制数
- 最后一列 对应的是 具体字符或功能
- 字符包括
- 这样就把各种字符和一个二进制数字对应起来了
解码 ASCII
- 我们找到小写的a
- 到底是多少呢?
- 先沿着下图中1的方向
总结
- 这次我们了解了ASCII码表
- ASCII 码表就是
- American Standard Code for Information Interchange
- 美国信息交换标准代码
- ASCII 码表范围
- 0x30-0x39 这个范围是 数字
- 0x41-0x5A 这个范围是 大 写字母
- 0x61-0x7A 这个范围是 小 写字母
- 0x20-0x7F 之间各处零散排布着各种符号
- 字符在计算机当中是用二进制方式存储的
- 我们现在可以得到字符的序号
- 但是能通过字符序号
- 得到字符的二进制形态么?
- 我们下次再说
- 蓝桥->https://www.lanqiao.cn/teacher/3584
- github->https://github.com/overmind1980/oeasy-python-tutorial
- gitee->https://gitee.com/overmind1980/oeasypython
- 视频->https://www.bilibili.com/video/BV1CU4y1Z7gQ 作者:oeasy