湘电子版（2019）第5节体验语音合成与人脸识别技术教案设计

展开

这是一份湘电子版（2019）第5节体验语音合成与人脸识别技术教案设计，共9页。教案主要包含了体验并探究语音合成技术，体验并探究人脸识别技术等内容，欢迎下载使用。

课题
体验语音合成与人脸识别技术
单元
第二单元
学科
信息技术
年级
八年级
学习
目标
了解语音合成技术及人脸识别技术。
理解语音合成技术的主要过程及学会模拟自己的声音；理解常用的人脸识别技术及利用人工智能服务平台体验人脸识别技术。
重点
理解语音合成技术的主要过程及学会模拟自己的声音；理解常用的人脸识别技术及利用人工智能服务平台体验人脸识别技术。
难点
理解语音合成技术的主要过程及学会模拟自己的声音；理解常用的人脸识别技术及利用人工智能服务平台体验人脸识别技术。
教学过程
教学环节
教师活动
学生活动
设计意图
导入新课
随着人工智能的发展，越来越多的应用进入到我们的生活中。自然语言处理是人工智能应用的重要领域。人工智能应用服务的终端不仅能够识别我们的话语，还能够利用机器合成各种语音，与我们进行交流，提供服务与帮助。除了可以像人类一样拥有听觉和言语的能力，它们还拥有“视觉”能力，能够“看懂”客观世界的事物，认识周围的人、事、物。例如，我们可以通过智能平台，把文字输入，就可以用语音的形式读出来；新闻里说，现在可以刷脸吃饭，用的也是人工智能技术今天我们就来了解这方面的知识。
听老师讲解
调动学生学习的积极性，为以下的学习打下良好的基础
讲授新课
活动任务
本节我们就来体验一下智能应用是如何与人“沟通”和“看”世界的。
我的问题
(1)人工智能是如何“听懂”人类语言的？
(2)人工智能是如何“认识”人类的？
活动建议
随着技术的发展，语音合成的技术无处不在。朗读听声软件将文本转化成语音“读”给你听、智能助理通过语音和我们交流、客服机器人可以随时接听电话回答用户的问题、导航软件根据语音包以各种人的语气实时播报前方线路。在这些“交流”中，智能应用发出声音回应我们的行为采用的就是语音合成技术。
建议安装如“讯飞有声”等软件，来体验这种“交流”。
我们也许接触过公共场所的人脸识别系统，或者使用过网络平台的识图功能，以及利用手机的美颜拍摄软件对图片进行优化处理。建议选择一款美颜拍摄软件或者智能识图的网络平台来探究一下识图技术。
活动过程
体验并探究语音合成技术
语音合成和语音识别技术是实现人机语音通信，建立一个有听和讲能力的口语系统所必需的两项关键技术。
语音合成，能将任意文字信息实时转化为标准流畅的语音朗读出来，相当于给机器装上了人工嘴巴。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术，是中文信息处理领域的一项前沿技术，解决的主要问题就是如何将文字信息转化为可听的声音信息，也即让机器像人一样开口说话。
1.体验文本转换为语音的技术
以“讯飞有声”应用程序为例，请同学们下载并安装该软件，在文本框中输入需要播放的文字内容
文字内容可以直接录入，也可以从网站或者文档中复制并粘贴进来，如下图所示。
选择不同主播的声音进行播放。
想一想
思考并回答以下问题
(1)更换主播后，声音播放的具体内容是否发生了变化？
(2)更换主播操作究竟改变了什么？
(3)从文字的录入到语音播出，你认为经历了哪些过程？
2.了解语音合成技术的主要过程
将文字信息转换为流利的可听懂的口语输出技术，称为语音合成。
这是一项综合技术，不仅需要计算机理解信息含义，保证信息正常输出，还需要利用声学相关知识，使内容可以转换成恰当的声学模型进行语音输出。
(1)理解文本信息的含义
在语言学家和计算机科学家的共同努力下，将文本中的语法规则转化成相应的程序输入计算机中，系统根据相应算法，为文本进行断句，准确获取文本需要表达的内容，这是文本分析的过程。
(2)韵律处理
在理解文本的内容后，通常需要考虑在读取这段文本时使用的节奏、时长、频率等，从而使计算机的发音更接近于人类说话的声音。
(3)创建声学模型模拟发音
这个过程类似我们模仿他人声音，需要考虑语种、音色、响度、音调等。
计算机模拟的方法是在原始的语音库中提取相关的声音信息，采用单元合成与拼接技术将信息进行拼接，从而达到模拟发声的效果。
语音合成的基本过程
3.模拟自己的声音
(1)明确任务
利用“讯飞留声”复刻自己的声音，然后让机器模仿自己的声音，进行一段双语朗诵。
(2)解决问题要点分析
计算机完成对人类声音的模仿，有以下两个关键内容：
第一，形成个人的声音库，为计算机提供声学模型。
通过形成个人的音库，将具有个人特色的声学信息(音色、音调、响度等)存储在其中，使计算机能够提取出相关数据。
第二，通过和个人音库匹配，完成合成。
通过语音合成技术，在识别文本内容的前提下，通过与个人音库中的信息相匹配，从而使计算机可以模仿我们的声音进行输出。
(3)模拟声音的步骤
第一步，关注微信公众号“讯飞留声”，选择“复刻声音”，进入程序。单击“去复刻我的声音”按钮，开始进入工作状态。
第二步，根据要求，朗读10段文字，按“话筒键”开始，“停止键”结束。注意录制时声音要清晰，内容要准确。
在朗读文字过程中，采用的是语音识别技术，对我们读取的语音进行识别，并和提供的文字进行对比。录制声音完成后，系统会自动制作并生成个人音库。
第三步，在“讯飞留声”的“声音应用一玩转好声音”应用中，选择“我是歪果仁”选项卡，选定任意一条文本，选择个人音库进行双语朗诵，听取合成声音，也可以将声音分享到微信群中。
(4)效果评价
将生成的声音分享到微信群，同学们互相倾听、评价，填写下表。
体验并探究人脸识别技术
人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。
人脸识别利用摄像机或摄像头采集含有人脸的图像或视频流，并自动在图像中检测和跟踪人脸，进而对检测到的人脸图像进行一系列的相关应用操作。技术上包括图像采集、特征定位、身份的确认和查找等。
1.体验身边的人脸识别技术
随着人工智能技术的发展，人脸识别技术得到了广泛的应用，如人脸解锁、人脸签到和人脸支付。
(1)体验人脸识别
①神奇的美颜拍摄功能
很多人在拍照时喜欢使用美颜功能，你能给大家介绍一款带有这类功能的智能相机应用吗？
请你当小老师指导大家一起体验，并思考应用程序是如何将相关装饰和特效放到人脸各个部位的。
②会分类的智能程序
带有分类功能的智能手机等设备，能自动识别照片中的面孔，根据不同的人像进行分类，使每个人都能得到一个单独的人物相册；如果是合影，还能自动生成“合影”标签。
分类功能是人脸识别的基础，我们熟悉的人脸识别、人脸解锁相关功能都是在此基础之上的应用。
2.了解常用的人脸识别技术
通过上面的体验可以看出，人脸识别是一个复杂的过程，涉及的技术也多种多样，达到的作用效果也不尽相同。
现在说到的人脸识别，大概涉及以下几种主要的技术：
(1)人脸检测
检测出图像的人脸所在位置。
计算机通过对图像的完整扫描，最终标记出人脸的相关信息，如图所示。
(2)人脸配准
脸配准是指在人像中准确定位五官的技术。通过人脸配准，计算机可以清晰地识别人脸图像五官的位置。
在计算机中，是通过标记一些固定的关键点来描绘人物的眼鼻口耳，如图所示。
(3)人脸特征提取
人脸特征提取是指将一张人脸图像转化为一串固定长度的数值的过程。这些数值用来表示人脸的特征，这些特征包含大量的人脸信息。
信息包含人脸的固有属性和动态属性，固有属性包括眼睛的大小、嘴巴的形状、鼻梁的状态、脸上是否有痣；动态属性包括“是頁在微笑、歪头”等信息。
这些数据是计算机人脸识别工作的基础，也是应用的基本保障。如图所示。
(4)人脸对比
人脸对比是指在特征提取的基础上，对比两张图片特征值的相似程度。通过相似程度，可以判定两张图片中是否包含了同一个人。
这种技术在人脸解锁、人脸签到中被频繁使用，如图所示。
3.利用人工智能服务平台体验人脸识别技术
人工智能服务平台中提供了各类人工智能相关的支持。
以百度人工智能服务平台为例，体验人脸识别技术执行的基本过程。
（1）体验百度人工智能服务平台的人脸识别功能
首先，注册百度平台的账号，然后登录该平台，通过网络版百度人工智能开放平台网址或者移动终端微信小程序“百度AI体验中心”两种途径来体验人工智能服务。
(2)人脸识别执行过程分析
平台是如何从图像检测人脸，并完成最终判定的呢？整个过程包括以下步骤：
第一步，人脸检测与定位。通过人脸检测技术识别图像的人脸区域，并对人的五官进行准确定位。
第二步，特征提取。通过特征提取技术，对图像信息进行数字化，并用复杂的数据代码对图像进行描述。
第三步，属性分类。在得到人脸客观数据的基础上，通过“分类器”(可以将分类器理解成一个标准库)中提供的大量模型对人的属性做出判断，如人物的年龄、表情、情绪等。
第四步，结果输出。将判断的答案进行公布。
人工智能平台对人脸的识别过程和人类对人脸的识别存在相似之处，同时也存在很大不同。具体差别如图所示。
想一想
在上传图片识别照片体验中，识别内容包括人物的性别、年龄、肤色等。通过你的体验和观察，哪些内容的结果和你预想的不一样？结合本节探究，大胆猜想，造成这些差别的原因有哪些？
声音的三要素：
音调、响度、音色
1.音调
声音的高低称为音调。音调取决于声源振动的频率。物体在1秒内振动的次数叫频率。频率越大，音调越高；频率越小，音调越低。
2.响度
人耳对声音强弱的主观感觉称为响度。响度和声源的振幅以及人距离声源的远近有关。
3.音色
声音的品质称为音色。音色主要与发声体的材料、结构、发声方式等因素有关。不同的发声体音色一般不同，如胡琴、钢琴、吉他、笛子等乐器发出的声音，即使音调、响度都相同，我们也可以轻松分辨。
人的音色也因人而异，所以我们闭着眼也能听出是哪位熟人在讲话。
课堂练习
(1)导航软件是如何模仿明星的声音为我们进行导航的，请分析其中的原理。
(2)为什么需要录制10段声音？影响效果的因素可能有哪些？
了解本节课的问题
通过教师的讲解，以小组合作的方式，开展探讨交流，完成任务。

学生小组间讨论，共同完成任务。
通过教师的讲解，以小组合作的方式，开展探讨交流，完成任务。
通过教师的讲解，以小组合作的方式，开展探讨交流，完成任务。
通过教师的讲解，以小组合作的方式，开展探讨交流，完成任务。
学生小组间讨论，共同完成任务。
通过教师的讲解，以小组合作的方式，开展探讨交流，完成任务。
通过教师的讲解，以小组合作的方式，开展探讨交流，完成任务。
通过教师的讲解，以小组合作的方式，开展探讨交流，完成任务。
通过教师的讲解，以小组合作的方式，开展探讨交流，完成任务。
学生小组间讨论，共同完成任务。
学生小组间讨论，共同完成任务，并分组汇报。
带着问题可更好的去解决问题
通过小组合作，加强学生组内团结、共同完成任务
锻炼学生的语言组织能力和表达的能力。
通过小组合作，加强学生组内团结、共同完成任务
通过小组合作，加强学生组内团结、共同完成任务
通过小组合作，加强学生组内团结、共同完成任务
锻炼学生的语言组织能力和表达的能力。
通过小组合作，加强学生组内团结、共同完成任务
通过小组合作，加强学生组内团结、共同完成任务
通过小组合作，加强学生组内团结、共同完成任务
通过小组合作，加强学生组内团结、共同完成任务
锻炼学生的语言组织能力和表达的能力。
培养学生独立完成练习的能力。
课堂小结
总结本节课所学内容
学生回答
梳理本节课的知识点，完成学习目标，培养学生总结概况能力
板书设计
一、体验并探究语音合成技术
1.体验文本转换为语音的技术
2.了解语音合成技术的主要过程
3.模拟自己的声音
二、体验并探究人脸识别技术
1.体验身边的人脸识别技术
2.了解常用的人脸识别技术
3.利用人工智能服务平台体验人脸识别技术