高中信息技术浙教版 (2019)必修1 数据与计算4.3 大数据典型应用图文课件ppt
展开1、了解Pythn常用扩展模块的功能。2、掌握pandas模块的调用方法、数据结构等基本知识。3、能使用pandas模块对数据进行编辑、计算和统计分析,并能从中提取有用信息形成结论。4、掌握matpltlib模块的调用方法和使用matpltlib模块对数据进行可视化的基本方法。
pythn模块的导入——imprt
一个程序中已出现的一个或多个函数或模块,引入到另一个pythn代码中,从而实现代码的复用。语法如下:imprt 模块名 模块名.函数名frm 模块名 imprt 函数名
pythn模块的小名儿
imprt 还有更多详细的用法,主要有以下两种:导入整个模块时,也可以为模块指定别名。 imprt 模块名1 [as 别名1]…例如:imprt sys as s print(s.argv[0]) frm 模块名 imprt 成员名1 [as 别名1],…例如:frm sys imprt argv as v print(v[0])
数据处理可以使用现成的软件或平台,也可以通过编写程序实现。Pythn语言丰富的标准模块和扩展库提供了许多高效灵活的函数,可以帮助我们较好地进行数据整理。
pandas数据结构
1. Series(序列)Series类似于一维数组,由一个数组的数据和一个与数据关联的索引(index),索引值默认是从0起递增的整数。
pandas数据结构
2. DataFrame(数据框) DataFrame是一种类似于关系表的表格型数据结构,DataFrame对象是一个二维表格,由1个索引列(index)和若干个数据列组成。其中,每列中的元素类型必须一致,而不同的列可以拥有不同的元素类型。
使用DataFrame前,需要导入pandas库中的DataFrame模块 frm pandas imprt DataFrame
DataFrame数据有列索引和行索引,行索引类似于关系表中每行的编号(未指定行索引的情况下,会使用0到N-1作为行索引),列索引类似于表格的列名(也称为字段)。
DataFrame模块提供了丰富的函数,这些函数可以用来进行行、列编辑和统计计算等。
1.增加行 增加行数据可以通过append()函数传入字典数据即可。
append_data = { "name":"朱八","sex":"男","aged":23,"scre":65}new_df = df.append(append_data)new_df
2.增加列 增加列可以直接通过标签索引方式进行,当新增的列中的数值不一样时,可以传入列表或者数组结构进行赋值。
3. 删除 使用drp()函数可以删除指定轴上的信息,原来的DataFrame数据不会删除。
4.修改标签 通过rename()函数完成行和列索引标签的修改,index参数指定要修改的行标签,clumns参数指定要修改的列标签。
Matpltlib——绘图
matpltlib中的快速绘图的函数库可以通过如下语句载入: 接下来调用figure创建一个绘图对象,并且使它成为当前的绘图对象。 通过figsize参数可以指定绘图对象的宽度和高度,单位为英寸;dpi参数指定绘图对象的分辨率,即每英寸多少个像素,缺省值为80。因此本例中所创建的图表窗口的宽度为8*80 = 640像素。
imprt matpltlib.pyplt as plt
plt.figure(figsize=(8,4))
接下来通过一系列函数设置绘图对象的各个属性:• xlabel / ylabel : 设置X轴/Y轴的文字• title : 设置图表的标题• ylim : 设置Y轴的范围• legend : 显示图示 最后调用plt.shw()显示出创建的所有绘图对象。
plt.xlabel("Time(s)")plt.ylabel("Vlt")plt.title("PyPlt First Example")plt.ylim(-1.2,1.2)plt.legend()
imprt numpy as npimprt matpltlib.pyplt as plt x = np.linspace(0, 10, 1000)y = np.sin(x)z = np.cs(x**2) plt.figure(figsize=(8,4))plt.plt(x,y,label="$sin(x)$",clr="red",linewidth=2) plt.plt(x,z,"b--",label="$cs(x^2)$") plt.xlabel("Time(s)") plt.ylabel("Vlt") plt.title("PyPlt First Example") plt.ylim(-1.2,1.2) plt.legend() plt.shw()
imprt 模块名1 [as 别名1]…frm 模块名 imprt 成员名1 [as 别名1],…pandas数据结构 Series(序列) DataFrame(数据框)Matpltlib——绘图
1. 下列Pythn的模块中,主要用于数据的处理和分析的是( )
2.有Pythn程序段如下: imprt pandas as pdser = pd.Series([1,3,5,7])print(ser.index) 该程序段运行后输出结果为( )
3. 某DataFrame对象df,其中包含18000数据行个和6个数据列,下列语句中能查看df对象中数据行的是( ) ()()
4.(开放题)采集你感兴趣的数据,使用Pythn编程语言调用pandas模块处理数据、调用matpltlib模块绘图呈现数据,并描述分析结果。
浙教版 (2019)必修1 数据与计算4.2 大数据处理优秀ppt课件: 这是一份浙教版 (2019)必修1 数据与计算4.2 大数据处理优秀ppt课件,文件包含4223《编程处理数据matplotlib》课件PPTpptx、4223《编程处理数据matplotlib》教案docx等2份课件配套教学资源,其中PPT共15页, 欢迎下载使用。
高中信息技术浙教版 (2019)必修1 数据与计算第四章 数据处理与应用4.2 大数据处理集体备课ppt课件: 这是一份高中信息技术浙教版 (2019)必修1 数据与计算第四章 数据处理与应用4.2 大数据处理集体备课ppt课件,共36页。PPT课件主要包含了Pandas模块,模块导入的两种方法,对象与属性,创建Series对象,以列表为数据对象创建,通过字典方式创建,通过循环访问值,索引访问下标,索引访问标签,索引访问切片等内容,欢迎下载使用。
高中信息技术浙教版 (2019)必修1 数据与计算4.2 大数据处理课文ppt课件: 这是一份高中信息技术浙教版 (2019)必修1 数据与计算4.2 大数据处理课文ppt课件,共18页。PPT课件主要包含了创建绘图对象,画一条直线,画两条正弦曲线,设置标题与坐标轴,增加图例,改变颜色和粗细,完整程序,项目练习选考数据等内容,欢迎下载使用。

