中图版 (2019)必修1 数据与计算2.4.3 算法与程序实现的综合应用公开课练习题习题ppt课件
展开某地区上半年舆情领域分布
学校开展经典诵读活动,小明在阅读《三国演义》时,为了分析该文学作品内容及其写作特色,想把小说中出现次数最多的20个词查找出来。如何通过编写程序来实现呢?
实践活动一:读取文本数据 阅读任务单活动一的学习材料; 输入并尝试理解相关语句。
f = pen(“d:/三国演义.txt", "r", encding='utf-8') txt = f.read()
#打开指定文件,创建返回一个文件对象
问题:运行代码,看不到效果。有什么办法可以观察和了解程序的进展呢?
调试方法: 函数print() / print(type()) 输出变量值或变量类型,观察程序的进展。
f = pen(" d:/三国演义.txt", "r", encding='utf-8') txt = f.read()
试一试:下面代码执行后的结果。
print(type(txt))
pen() read()
中文分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。如:小明是一名学生。 小明 是 一名 学生 。.
.jieba模块,对中文有着很强大的分词能力。 由于它是第三方模块,使用前需要下载安装。
实践活动二:请同学们参照任务单中说明完成jieba模块的安装。自学中文分词相关内容。
.imprt jieba
. wrds=jieba.lcut(txt)
#将txt中的中文拆分为词语保存到wrds中
。imprt jieba。f = pen("d:/三国演义.txt", "r", encding='utf-8') 。txt = f.read() 。wrds=jieba.lcut(txt)
试一试:利用前面用到的调试方法,观察程序的进展。
.jiebalcut()
实践活动三:如何统计词语的出现次数呢?
如何利用枚举算法来统计词频呢?提示:高频词应该是具有明确指向意义的词语,不包括单字的词。
统计表中添加该词,次数为1
想一想:如何记录词语内容及其出现次数呢?(假设词频为:汉朝15次,建宁6次,英雄60次)
这种记录方式,一旦词语顺序发生调整和变化,容易出现次数对应上的错误。
{ }
键值对(key-value)
字典中键与值是一一对应的,数据没有先后顺序关系。
活动: 参考任务单活动三的材料,学习字典的相关内容。尝试编写相关代码,实现词频统计。
#建立空字典,用于存储词和出现次数
fr wrd in wrds:
if len(wrd) == 1: cntinue
else: cunts[wrd] = cunts.get(wrd,0) + 1
实践活动四:如何实现按词频排序? 思考问题1:词频存储在字典中。字典中的元素能否进行排序呢? 思考问题2:如何实现按词语的出现次数进行排序? 参看任务单的学习材料。动手尝试编程实现。
items = list(cunts.items())
items.srt( )
#按出现次数进行降序排列
reverse = True
key = lambda x:x[1],
试一试: 运行调试程序,观察程序进展。
.jiebalcut( )
list ( ) srt ( )
实践:请同学们思考并自行完成显示输出功能。
#输出前20个元素的值fr i in range(20): print (items[i][0], items[i][1])
曹操 595孔明 534将军 508却说 446玄德 396丞相 323关公 320二人 307荆州 297玄德曰 275
不可 272不能 262如此 252孔明曰 247张飞 228主公 223商议 217刘备 196引兵 190军士 184
《三国演义》作品核心人物
蜀国主要人物在全书活动分布情况
高中信息技术第3章 数据处理与应用3.2 数据采集与整理3.2.2 数据整理完美版ppt课件: 这是一份高中信息技术第3章 数据处理与应用3.2 数据采集与整理3.2.2 数据整理完美版ppt课件,文件包含数据整理第二十三课时-课件pptx、数据整理第二十三课时-教学设计doc、数据整理第二十三课时-课后练习docx、数据整理第二十三课时-课堂任务单docx等4份课件配套教学资源,其中PPT共45页, 欢迎下载使用。
高中信息技术中图版 (2019)必修1 数据与计算第2章 算法与程序实现2.4 常见算法的程序实现2.4.3 算法与程序实现的综合应用优秀练习题习题ppt课件: 这是一份高中信息技术中图版 (2019)必修1 数据与计算第2章 算法与程序实现2.4 常见算法的程序实现2.4.3 算法与程序实现的综合应用优秀练习题习题ppt课件,文件包含算法与程序综合应用1第十九课时-课件pptx、算法与程序综合应用1第十九课时-任务单docx、算法与程序综合应用1第十九课时-教学设计docx、算法与程序综合应用1第十九课时-练习题docx等4份课件配套教学资源,其中PPT共50页, 欢迎下载使用。
高中信息技术中图版 (2019)必修1 数据与计算2.4.1 基于解析算法的问题解决精品练习题习题课件ppt: 这是一份高中信息技术中图版 (2019)必修1 数据与计算2.4.1 基于解析算法的问题解决精品练习题习题课件ppt,文件包含解析算法第十七课时-课件pptx、解析算法第十七课时-教学设计docx、解析算法第十七课时-学习任务单docx、解析算法第十七课时-课后练习docx等4份课件配套教学资源,其中PPT共60页, 欢迎下载使用。