还剩23页未读,
继续阅读
所属成套资源:华东师大版信息技术必修1课件PPT整套
成套系列资料,整套一键下载
华师大必修1 第1章第2节 数字化与编码课件PPT
展开
高中信息技术 必修一 数据与计算第 一 章 数据与大数据第二节 数字化与编码 信息技术的发展创造出一个全新的数字化环境,生活在其中的每 个人都能感受到数字化带来的变化。人们利用数字化设备可实时获 取自己的心率、血压等身体健康数据,通过分析这些数据,可以主动管理自己的健康;乘客可以通过移动智能终端查询车辆到站的实时信 息,避免了以往久等公交车而不知车何时到达的尴尬。移动通信、移动智能终端等新技术的广泛使用,使全球正在成为一个互联互通的数字化世界。 课 堂 导 入 同学们希望查阅学校图书馆馆藏校刊上刊载的往年诗词大会征文。由于馆藏的校刊数量较少,因此 图书馆只能满足少数同学的借阅需求。同时,同学们在借阅校刊的过程中,也令校刊产生了不同程度的污损,影响了校刊的收藏。因此,学校图书馆希望能够将历年的纸质校刊制作成电子校刊,供同学们 借阅。 思考:1. 纸质校刊的内容承载于墨迹和纸张之中,那么电子校刊的内容是以怎样的形式存储在计算机中的? 2. 分析纸质校刊和电子校刊在借阅过程中各自的优势和不足。 一、进位计数制及其转换 目前,计算机的硬件组成通常可以呈现两种状态,如电路的导通和断开。这样就决定了计算机内部采用二进制,即以“0”和“1”的组合 来表示信息,用“1”来表示一种状态(如电路的导通),用“0”来表示相 反的另一种状态(如电路的断开)。由于计算机采用二进制数进行运 算和存储,因此要使用计算机进行信息处理,首先要把待处理的信息用二进制数来表示。 二进制是一种常用于计算机中的进位计数制,它的基数为2,只有 0、1两个数码,整数位 的位权从右向左依次为20,21,22,…。例如: 二进制数(110)2 中,各个数位上的数字所代表的数值分别为1×22、 1×21、0×20。1. 进位计数 十六进制的基数是16,包含0,1,2,3,…,9,A, B,C,D,E,F,共16个数码。图 1.14 十进制数转 换为二进制数2. 不同进位计数制的相互转换 将十进制整数转换为二进制数的方法是除以2反向取余。例如, 将十进制数37转换为二进制数,即:(37)10=(100101)2,。 二进制数转换为十进制数,一般可以将每位二进制数和该位的位权相乘再求和,这种方法称为按权展开。例如: (1011)2=1×23+0×22+1×21+1×20=8+0+2+1=(11)10 二进制数转换为十六进制数时,把二进制数从低位到高位按4位 一组划分,每组用一位十六进制数表示,不足4位二进制数,高位用 “0”补齐。例如,(1011011)2=(5B)16。 十六进制数转换为二进制数时,将每一位十六进制数转换为4位 二进制数,不足4位二进制数,高位用“0”补齐。例如,(A3)16 = (10100011)2。3. 数据的存储单位 比特(bit)是计算机中最小的数据存储单位,即一个二进制位,一位的取值只能是0或1。 字节(Byte)是计算机中信息组织和存储的基本数据存储单位,1字节就是8比特。字节常用B表示,描述存储容量的常用单位还有 KB、 MB、GB、TB、PB、EB等,其换算规则如表1.3所示。 表 1.3 常用存储单位换算表 二、数字化 1. 模拟信号和数字信号模拟信号数字信号 现实世界中,我们将连续变化的物理量称为“模拟量”,如温度、速度等。数字化可将模拟量转换成数字量,数字量的变化在时间或数值上都是离散的。模拟量是连续的,数字量是离散的。 例如,水银温度计中的水银汞柱伸缩是连续变化的,反映的是模拟 量;数字温度计显示的数字是离散的,反映的是数字量。 在电子设备中,模拟量通常以模拟信号的形式进行传递,数字量则以数字信号的形式进行传递。在一定条件下,模拟信号和数字信号可以相互转换。2. 模拟信号的数字化过程图 1.18 采样 图 1.19 量化将模拟信号转换为数字信号在连续的模拟信号中,每隔一定时间 (或空间)取一个值的过程。对于同一模拟信号,采样的时间间隔设置越小,单位时间内采集的样本数量越多。每秒的采样次数称作采样频率,单位用赫兹(Hz)表示。把采样的值用二进制数值表示出来。其过程是按模拟信号变化的幅度将其划分为几个区 段,把落在某个区段的采样样本值归成一类,并赋予 相应的二进制数值来表示量化值,对这些二进制数值进行编码,就可以形成一 系列二进制代码。这样,计算机就可以对其进行 识别、存储和加工了。 项 目 实 践 电子校刊方便借阅和存放,而且还可以提供多媒体形式的内容,丰富了阅读资源。 1. 选用数字化工具,将纸质校刊中的文字制作成电子文本或音频文件。 2. 选用数字化工具,将纸质校刊中的插图制作成图像文件。 3. 尝试利用数字化工具制作电子校刊,体验电子校刊的制作过程。三、编码1. 字符编码 (1) ASCII码 国际上广泛使用的英文字符编码是 ASCII码。 ASCII码诞生于1963年,用于计算机内部字符的存储和计算机与外部设备的通信。标准的 ASCII码为7位二进制编码(即D6~D0位), 存储时占用一个字节,最高位为0。 例如,字符“A”的 ASCII码编码为 1000001。标准的 ASCII字符集定义了128个 字符,其中包括10个阿拉伯数字(“0”~“9”)、26个大写英文字母 (“A”~“Z”)、26个小写英文字母(“a”~“z”)和33个符号共95个可 打印字符,以及33个控制字符。 图 1.20 字符“A”的 ASCII码的存储(2) 汉字编码 汉字也是字符。用计算机处理汉字时也要采用二进制表示的编 码。目前,我国主要使用的汉字编码标准是 GB18030—2005,它支持 多种字节的汉字编码,如单字节、双字节和四字节编码等。 由于不同语言的编码各不相同,为了统一所有文字的编码,Unicode 应运而生。Unicode是计算机科学领域里的一项业界标准。它对世界上大部分的文字系统进行了整理、编码,避免由于编码冲突而产生的乱码问题,使得计算机可以用更为简单的方式来处理和呈现文字。 Unicode字符集分为17组(平面),每组含有65536个码位,共 1114112个。它就像一本“大字典”,每一个码位都唯一对应一个字 符。其中,汉字位于0号平面和2号平面。 要将这本“大字典”里的 Unicode字符转换成可用于传输、存储 的二进制代码,则需要使用字符编码方案。目前,主要使用的是 UTF 8、UTF 16、UTF 32三种编码方案。 (3) Unicode字符集和编码方案 2. 声音编码 声音是振动产生的波,由不同频率的正弦波合成。声波的振幅反映了声音的强弱,声波的频率反映了音调的高低。它是一种连续变化的模拟信号,需要通过采样、量化和编码后实现数字化。 声音的量化是用二进制数值表示采样所得到的幅度值的过程。首先将幅度值范围划分为2n个等级,每个等级对应一个幅度值,然后将采样得到的各个幅度值按一定的规则近似到某个等 级,并用n位二进制数表示这些值。这里的n是量化位数。划分的等级越多,量化的位数就越多,量化精度也就越高,采样结果 近似到某个等级时产生的误差就越小,音质就越有保证。 一般情况下,未经压缩的音频文件的数据存储量可以按如下方法进行计算: 数据存储量=采样频率×量化位数×声道数÷8×持续秒数(字节) 例如,一组1小时的数字音乐(未经压缩)的采样频率为44.1kHz, 量化位数为16位,声道数为双声道。则其数据存储量可按以下方法 进行计算: 数据存储量=44100×16×2÷8×3600(字节) 通常,未经压缩的数字音乐会被保存为WAV文件格式。 3. 图像编码图 1.22 同一图像的不同分辨率对比 图 1.23 同一图像的 不同颜色深度对比 图像的采样是按一定的空间间隔从左到右、自上而下提取画面信息,将图像在空间上转换成若干个像素点,每个像素点呈现不同的颜色。 水平方向上的像素数量乘以垂直方向上的像素数 量称为图像分辨率。例如,一幅图像的分辨率为640× 480像素,表示该图像由水平方向上640个像素点、垂直 方向上480个像素点,共640×480=307200个像素点组成。如果不考虑其他因素的影响,图像分辨率越高,采样的精度就越高,数字化后的图像越清晰,同时图像所占的存储空间也越大。 图像的量化是用若干位二进制数表示采样得到的每个像素点的颜色。首先确定颜色的取值范围,然后将近似的颜色划分成同一种颜色,每种颜色用一个二进制数来表示。 记录每个像素点的颜色所需的二进制数的位数,称为颜色深度 (位深度)。对于一幅图像来说,颜色深度决定了该图像中的像素可 以使用的最多颜色数量。 例如,颜色深度为8比特时,可以表示256 种颜色;颜色深度为16比特时,则可以表示65536种颜色。颜色深度越大,显示的图像色彩越丰富,画面越自然、逼真,如图1.23所 示。 在图像分辨率相同的情况下,颜色深度越大,图像所占的存储空间也越大。可以采用RGB颜色模型来描述。 RGB颜色模型又称为三原色光模式,将红(red)、绿(green)、蓝(blue)三原色以不同的比例相加,可以产生不同的颜色。 例如,纯红色用 RGB颜色模型表示为(255,0, 0),纯绿色用RGB颜色模型表示为(0,255,0)。 这种由纵横排列的像素点组成的图像称为位图。 位图的质量主要由图像分辨率和颜色深度决定。未经压缩的位图图像的数据存储量可以按如下方法进行计算: 未经压缩的位图图像的数据存储量= 图像分辨率×颜色深度÷8(字节) 例如,一幅分辨率为1920×1080像素的图像,保存格式为“24位 位图”,则其数据存储量可按以下方法进行计算: 数据存储量=1920×1080×24÷8(字节) 通常,未经压缩的位图图像会被保存为BMP文件格式。 数据压缩就是采用特殊的编码方式处理数据,使数据占用的存储空间相对减少,以便存储和传输。 数据之所以能够被压缩并保证压缩后可用,主要是因为数据存在如下几种现象: 无损压缩 无损压缩是指对压缩后的数据进行还原后,得到的数据与压缩前完全相同。有损压缩通常应用于图像、声音等 数字化后存在大量冗余信息的文件。有损压缩过程中会损失一定的信息,压缩后的数据无法还原到与压缩前一 致,但不会导致人们对原始数据表达的信息产生误解。 以图像的有损压缩为例,图像的有损压缩是在较小地损失图像质量的情况下,对图像文件中相同或相似的数据进行大量压缩,使得生成的文件更小,如图1.24所示。这种技术在一定程度上损害了图像的原始质量,也就是丢掉了一些数据的信息。同一张图像,保存为不同的格式时,其数据量的差别可能会非常大。 例如,分别使用 TIF和JPEG格 式生成的文件,大小有时会相差几十倍。常见的图像、音 频、视频有损压缩格式分别是JPEG(图像数据压缩格式)、 MP3(音 频 数 据 压 缩 格 式)、MPEG(视 频 数 据 压 缩 格 式)等。 作业练习一个 7位二进制数,如果其最高位和最低位都为 1,则用十进制 表示该二进制数,其最大值可能是 ,最小值可能是 。 2. 小申同学录制了一个时长 1分钟的音频文件,他准备将这个文件 传输至个人在线学习空间。该文件采用的是 WAV格式,文件采样频率 是 44.1kHz,量化位数为 16位,双声道。请计算该文件在个人在线学习空间中占用的存储容量。 3. 小申和同学们在小组活动中设计了本小组的 LOGO,如图 1.25 所示。他们用 2位二进制数来表示图中的颜色,并对图中的颜色进行了 编码,从而将本小组的 LOGO表示为一串二进制数,其中第 4行的编码 为 0101010110000010。 (1)用 2位二进制数表示颜色,最多可以表示 种颜色。根 据上述编码,图中蓝色色块的二进制编码应表示为 ;红色色块 的二进制编码应表示为 ;第 6行的编码为 H。 (2)请在图 1.26中设计自己的 LOGO,并涂上相应的颜色。然后对 使用的颜色进行二进制编码,并说明编码规则。 End
相关资料
更多