还剩2页未读,
继续阅读
第四章 数据处理与应用&人工智能 晚读检测 浙教版(2019)高中信息技术必修1
展开
这是一份第四章 数据处理与应用&人工智能 晚读检测 浙教版(2019)高中信息技术必修1,共3页。
数据处理与应用&人工智能 晚读过关检测一、选择题( )1. 下列关于大数据处理的描述中,不正确的是A.处理大数据时,一般采用分治思想 B.Hadoop是一个可运行于大规模计算机集群上的分布式系统基础架构,适用于处理实时数据 C.HDFS是一个高度容错性的系统,适合部署在廉价的机器上,云盘、网盘的底层一般采用HDFS实现D.MapReduce是一种分布式并行编程模型,主要由Map(映射)和Reduce(归纳)2个函数构成( )2. 文本数据处理的主要步骤由以下部分选项组成,正确的顺序是 ①特征抽取 ②数据分析 ③分词 ④文本获取 ⑤结果呈现 A.④①③②⑤ B.④②③①⑤ C.④③②①⑤ D.④③①②⑤( )3. 在Excel工作表中,单元格C4中有公式“=A3+$C$5”,在第3行之前插入一行之后,单元格C5中的公式为A.=A4十$C$6 B.=A4十$C$5 C.=A3十$C$6 D.=A3十$C$5( )4. 下列对大数据的理解错误的是A.从互联网产生大数据的角度来看,大数据具有“4V”特征,分别是大量(Volume),多样(Variety),低价值密度(Value),高速(Velocity)。B.从互联网思维的角度来看,大数据具有三个特征:样本渐趋于总体,精确让位于模糊,相关性重于因果。C.从大数据存储与计算的角度来看,大数据具有两个特征:分布式存储和分布式并行计算。D.上述有两项或更多错误( )5.某公司把今年的生产业绩数据建立了一个Excel工作表,并用表的数据生成了统计图,但后来发现有个部门的业绩数据输入错误,于是在表中对该数据进行了修改。这时其对应的统计图A.原统计图处会显示错误提示 B.会随之自动改变C. 自动生成新统计图,且保留原统计图 D.不发生变化( )6. 以下实际生活场景中,涉及到人工智能技术的是 ①疫情期间,进入公共场合通过“人脸识别登录验证”申领健康码 ②通过手机 APP 远程打开家里的空调 ③拨打某客服电话,与语音助手沟通解决售后问题 ④驾驶搭载自动驾驶技术的汽车 ⑤利用扫描仪扫描文稿并自动通过 Email 进行发送A.①③④ B.①②④ C.①③⑤ D.③④⑤( )7.(多选)人工智能领域的关键技术目前主要包括A.机器学习、知识图谱 B.自然语言处理、计算机视觉C.人机交互、生物特征识别 D.虚拟现实与增强现实( )8.下列关于中文分词方法的描述中,属于基于统计的分词方法的是A.在分析句子时与词典中的词语进行对比,词典中出现的就划分为词 B.依据上下文中相邻字出现的频率统计,同时出现的次数越高就越可能组成一个词 C.让计算机模拟人的理解方式,根据大量的现有资料和规则进行学习,然后分词 D.依据词语与词语之间的空格进行分词( )9.下列关于人工智能的说法,正确的是A.人工智能处理数据都采用分治思想 B.神经网络解决分类问题不需要训练数据 C.图灵测试是测试机器是否具有智能的一种方法 D.“专家系统”是一种典型的基于数据驱动的人工智能方法二、判断题(√、×)( )1. AlphaGo Zero 不依赖人类棋手数据而在自我博弈中不断提升棋力是行为主义的体现。( )2.人工神经网络需要事先确定反映输入、输出之间映射关系的数学方程,它通过自身的训练,学习某种规则,最终在给定输入时得到最接近期望输出的结果。( )3.数据处理的一般过程是采集—分析—整理—可视化表达。( )4.人工智能的目的是让机器能够模拟、延伸和扩展人的智能,以实现某些脑力劳动的机械化。( )5.大数据处理系统Summingbird实现了批处理和图计算在一个平台架构的整合(Hadoop+Storm)。( )6.通过用户手机搜索记录位置移动的数据来感知城市中人群的流动,预测关键景点的拥堵情况是人和机器共同参与的混合增强智能应用。三、小林在制定出游计划前收集了省内各个 A 级景点数据,部分数据如图 a 所示。为了对比各个地市“AAAA 级”及以上景区的数量,编写 Python 程序如下。请回答下列问题:(1)从图 a 中“等级”一列数据看,该列数据存在的问题是( )(单选,填字母)A. 数据缺失 B. 数据重复 C. 逻辑错误 D. 格式不一致(2)小林先对数据进行整理,然后统计各个地市“AAAA 级”及以上景区的数量并按数量降序排序,程序如下,请补充完整。import pandas as pdimport matplotlib.pyplot as pltdf = pd.read_excel("浙江 A 级景区.xlsx")df = df.drop(["电话", "景区编码"], ① ) # 删除不必要的列for row in range(len(df)): # 整理“等级”列数据grade = df.at[row, "等级"] if '1' <= grade[0] <= '9': df.at[row, "等级"] = "A" * int(grade[0])df2 = df[ ② >= "AAAA"]dfg = df2.groupby("地市").count()dfg = dfg.rename(columns={'等级': "数量"}) # 重命名列名称dfg. ③ ("数量", ascending=False, inplace=True)(3)小林将排序后的结果绘制成柱形图,结果如图 b 所示,请完成代码填空:plt.figure(figsize=(8,4))plt.rcParams['font.sans-serif']=['SimHei','FangSong']plt.title("浙江 AAAA 级以上景区数量统计图") ④ # 绘图for i in range(len(dfg)): plt.text(i, dfg["数量"][i]+1, dfg["数量"][i])plt.xlabel("地市名称")plt.ylabel("数量")plt.legend()plt.show()答案:一、选择题1.B 2.D 3.A 4.D 5.B 6.A 7.ABCD 8. B 9C二、判断题√××√×√三、填空题1.D 2.①axis=1 ②df.等级 ③sort_values ④plt.bar(dfg.index,dfg.数量,label=’景区数量’)
数据处理与应用&人工智能 晚读过关检测一、选择题( )1. 下列关于大数据处理的描述中,不正确的是A.处理大数据时,一般采用分治思想 B.Hadoop是一个可运行于大规模计算机集群上的分布式系统基础架构,适用于处理实时数据 C.HDFS是一个高度容错性的系统,适合部署在廉价的机器上,云盘、网盘的底层一般采用HDFS实现D.MapReduce是一种分布式并行编程模型,主要由Map(映射)和Reduce(归纳)2个函数构成( )2. 文本数据处理的主要步骤由以下部分选项组成,正确的顺序是 ①特征抽取 ②数据分析 ③分词 ④文本获取 ⑤结果呈现 A.④①③②⑤ B.④②③①⑤ C.④③②①⑤ D.④③①②⑤( )3. 在Excel工作表中,单元格C4中有公式“=A3+$C$5”,在第3行之前插入一行之后,单元格C5中的公式为A.=A4十$C$6 B.=A4十$C$5 C.=A3十$C$6 D.=A3十$C$5( )4. 下列对大数据的理解错误的是A.从互联网产生大数据的角度来看,大数据具有“4V”特征,分别是大量(Volume),多样(Variety),低价值密度(Value),高速(Velocity)。B.从互联网思维的角度来看,大数据具有三个特征:样本渐趋于总体,精确让位于模糊,相关性重于因果。C.从大数据存储与计算的角度来看,大数据具有两个特征:分布式存储和分布式并行计算。D.上述有两项或更多错误( )5.某公司把今年的生产业绩数据建立了一个Excel工作表,并用表的数据生成了统计图,但后来发现有个部门的业绩数据输入错误,于是在表中对该数据进行了修改。这时其对应的统计图A.原统计图处会显示错误提示 B.会随之自动改变C. 自动生成新统计图,且保留原统计图 D.不发生变化( )6. 以下实际生活场景中,涉及到人工智能技术的是 ①疫情期间,进入公共场合通过“人脸识别登录验证”申领健康码 ②通过手机 APP 远程打开家里的空调 ③拨打某客服电话,与语音助手沟通解决售后问题 ④驾驶搭载自动驾驶技术的汽车 ⑤利用扫描仪扫描文稿并自动通过 Email 进行发送A.①③④ B.①②④ C.①③⑤ D.③④⑤( )7.(多选)人工智能领域的关键技术目前主要包括A.机器学习、知识图谱 B.自然语言处理、计算机视觉C.人机交互、生物特征识别 D.虚拟现实与增强现实( )8.下列关于中文分词方法的描述中,属于基于统计的分词方法的是A.在分析句子时与词典中的词语进行对比,词典中出现的就划分为词 B.依据上下文中相邻字出现的频率统计,同时出现的次数越高就越可能组成一个词 C.让计算机模拟人的理解方式,根据大量的现有资料和规则进行学习,然后分词 D.依据词语与词语之间的空格进行分词( )9.下列关于人工智能的说法,正确的是A.人工智能处理数据都采用分治思想 B.神经网络解决分类问题不需要训练数据 C.图灵测试是测试机器是否具有智能的一种方法 D.“专家系统”是一种典型的基于数据驱动的人工智能方法二、判断题(√、×)( )1. AlphaGo Zero 不依赖人类棋手数据而在自我博弈中不断提升棋力是行为主义的体现。( )2.人工神经网络需要事先确定反映输入、输出之间映射关系的数学方程,它通过自身的训练,学习某种规则,最终在给定输入时得到最接近期望输出的结果。( )3.数据处理的一般过程是采集—分析—整理—可视化表达。( )4.人工智能的目的是让机器能够模拟、延伸和扩展人的智能,以实现某些脑力劳动的机械化。( )5.大数据处理系统Summingbird实现了批处理和图计算在一个平台架构的整合(Hadoop+Storm)。( )6.通过用户手机搜索记录位置移动的数据来感知城市中人群的流动,预测关键景点的拥堵情况是人和机器共同参与的混合增强智能应用。三、小林在制定出游计划前收集了省内各个 A 级景点数据,部分数据如图 a 所示。为了对比各个地市“AAAA 级”及以上景区的数量,编写 Python 程序如下。请回答下列问题:(1)从图 a 中“等级”一列数据看,该列数据存在的问题是( )(单选,填字母)A. 数据缺失 B. 数据重复 C. 逻辑错误 D. 格式不一致(2)小林先对数据进行整理,然后统计各个地市“AAAA 级”及以上景区的数量并按数量降序排序,程序如下,请补充完整。import pandas as pdimport matplotlib.pyplot as pltdf = pd.read_excel("浙江 A 级景区.xlsx")df = df.drop(["电话", "景区编码"], ① ) # 删除不必要的列for row in range(len(df)): # 整理“等级”列数据grade = df.at[row, "等级"] if '1' <= grade[0] <= '9': df.at[row, "等级"] = "A" * int(grade[0])df2 = df[ ② >= "AAAA"]dfg = df2.groupby("地市").count()dfg = dfg.rename(columns={'等级': "数量"}) # 重命名列名称dfg. ③ ("数量", ascending=False, inplace=True)(3)小林将排序后的结果绘制成柱形图,结果如图 b 所示,请完成代码填空:plt.figure(figsize=(8,4))plt.rcParams['font.sans-serif']=['SimHei','FangSong']plt.title("浙江 AAAA 级以上景区数量统计图") ④ # 绘图for i in range(len(dfg)): plt.text(i, dfg["数量"][i]+1, dfg["数量"][i])plt.xlabel("地市名称")plt.ylabel("数量")plt.legend()plt.show()答案:一、选择题1.B 2.D 3.A 4.D 5.B 6.A 7.ABCD 8. B 9C二、判断题√××√×√三、填空题1.D 2.①axis=1 ②df.等级 ③sort_values ④plt.bar(dfg.index,dfg.数量,label=’景区数量’)
相关资料
更多