终身会员
搜索
    上传资料 赚现金
    粤教版 必修一  5.3  数据的分析 课件01
    粤教版 必修一  5.3  数据的分析 课件02
    粤教版 必修一  5.3  数据的分析 课件03
    粤教版 必修一  5.3  数据的分析 课件04
    粤教版 必修一  5.3  数据的分析 课件05
    粤教版 必修一  5.3  数据的分析 课件06
    粤教版 必修一  5.3  数据的分析 课件07
    粤教版 必修一  5.3  数据的分析 课件08
    还剩10页未读, 继续阅读
    下载需要30学贝 1学贝=0.1元
    使用下载券免费下载
    加入资料篮
    立即下载

    高中粤教版 (2019)5.3.1 特征探索优质课件ppt

    展开
    这是一份高中粤教版 (2019)5.3.1 特征探索优质课件ppt,共18页。PPT课件主要包含了学习目标,重难点,课堂导入,项目实施等内容,欢迎下载使用。

    重点:特征探索、关联分析
    数据分析就是在一大批杂乱无章的数据中,运用数字化工具和技术,探索数据内在的 结构和规律,构建数学模型,并进行可视化表达,通过验证将模型转化为知识,为诊断过 去、预测未来发挥作用。数据分析一般包括特征探索、关联分析、聚类与分类、建立模型 和模型评价等。
    5 . 3 . 1 特征探索
    数据特征探索的主要任务是对数据进行预处理,发现和处理缺失值、异常数据,绘制直方图,观察分析数据的分布特征,求最大、最小值、极差等描述性统计量。
    5 . 3 . 2 关联分析
    关联分析就是分析并发现存在于大量数据之间的关联性或相关性,从而描述一个事物中某些属性同时出现的规律和模式。算法如下: (1)扫描历史数据,并对每项数据进行频率次数统计。 (2)构建候选项集C1,并计算其支持度,即数据出现频率次数与总数的比。 (3)对候选项集的支持度进行筛选,筛选的数据项支持度应当不小于最小支持度, 从而形成频繁项集L1。 (4)对频繁项集L2进行连接生成候选项集C2,重复上述步骤,最终形成频繁K项集或者最大频繁项集。
    5 . 3 . 3 聚类分析
    聚类分析是一种探索性的分析,在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。 聚类分析的算法有很多,其中K-平均 (K-Means)算法是一种经典的自下而上的聚类分析方法。K-平均算法的基本思想就是在 空间N个点中,初始选择K个点作为中心聚类点,然后将N个点分别与K个点计算距离,选 择自己最近的点作为自己的中心点,再不断更新中心聚集点,以达到“物以类聚,人以群 分”的效果。
    图5-10  聚类分析K-平均算法
    聚类分析的基本算法如下: (1)从数据点集合中随机选择K个点作为初始的聚集中心,每个中心点代表着每个聚集中心的平均值。 (2)对其余的每个数据点,依次判断其与K个中心点的距离,距离最近的表明它属于这项聚类。 (3)重新计算新的聚簇集合的平均值即中心点。整个过程不断迭代计算,直到达到 预先设定的迭代次数或中心点不再频繁波动。
    打开并运行教科书配套学习资源包“第五章\课本素材\程序5-5聚类分析”文件,观察程序的运行结果。程序5-5直接调用了Pythn语言的sklearn机器学习模块,其对数据进行聚类分析的关键程序段如下:
    5 . 3 . 4 数据分类
    数据分类通常的做法是,基于样本数 据先训练构建分类函数或者分类模型(也称为分类器),该分类器具有将待分类数据 项映射到某一特点类别的功能。数据分类和回归分析都可用于预测,预测是指从基于样本数据记录,根据分类准则自动给出对未知数据的推广描述,从而实现对未知数据 进行预测。
    贝叶斯分类技术在众多分类技术中占有重要地位,也属于统计学分类的范畴,是一种非规则的分类方法。贝叶斯分类技术通过对已分类的样本子集进行训练,学习归纳出分类 函数(对离散变量的预测称作分类,对连续变量的分类称为回归),利用训练得到的分类器实现对未分类数据的分类。
    贝叶斯与概率分类 贝叶斯(Thmas Bayes, 1701—1761),英国数学家,发明了概率统计学原理,将归纳推理法用于概率论基础理论,创立了贝叶斯统计理论,对统计决策函数、统计推断、统计 的估算等做出了贡献。 在概率统计理论中,条件概率是指事件A在另外一个事件B已经发生条件下的发生概 率,表示为P(A|B),读作“在B的条件下A的概率”。贝叶斯发现在事件B出现的前提下 事件A出现的概率,等于事件A出现的前提下事件B出现的概率乘以事件A出现的概率再除 以事件B出现的概率。这就是著名的贝叶斯定理。
    运用贝叶斯定理对事物进行分类,是一种非常有效的思维方法,是贝叶斯决策理论方 法的基本思想。例如,假设有一个数据集,由两类组成,且已知每个样本的分类,数据分 布如图5-11所示。用p1(x,y)表示数据点(x,y)属于红色一类的概率,用p2(x,y)表示数据点(x,y) 属于蓝色一类的概率。
    图5-11  数据分布
    那么如何判断对于一个新的点C(x,y)属于红色还是蓝色类别呢?通常人们会按以下步骤解答: (1)求新的点C(x,y)属于红色一类的概率p1(x,y)。 (2)求新的点C(x,y)属于蓝色一类的概率p2(x,y)。 (3)选择概率高的一类作为新点C(x,y)的分类。
    各小组根据项目选题及拟订的项目方案,结合本节所学,完成相应的数据分析。 采用适当的方法完成相应项目选题的数据分析工作。 总结和归纳数据分析的方法和步骤。
    相关课件

    高中信息技术粤教版 (2019)必修1 数据与计算第五章 数据处理和可视化表达5.3 数据的分析5.3.1 特征探索完美版ppt课件: 这是一份高中信息技术粤教版 (2019)必修1 数据与计算<a href="/xx/tb_c4007099_t3/?tag_id=26" target="_blank">第五章 数据处理和可视化表达5.3 数据的分析5.3.1 特征探索完美版ppt课件</a>,共17页。PPT课件主要包含了数据的分析,特征探索,关联分析,聚类分析,聚类分析介绍,数据分类等内容,欢迎下载使用。

    高中粤教版 (2019)1.2.2 编码的基本方式背景图ppt课件: 这是一份高中粤教版 (2019)1.2.2 编码的基本方式背景图ppt课件,文件包含53数据的分析-新教材粤教版2019高中信息技术必修一课课件28pptx、53数据的分析-新教材粤教版2019高中信息技术必修一课练习docx等2份课件配套教学资源,其中PPT共28页, 欢迎下载使用。

    信息技术必修1 数据与计算5.3.1 特征探索教学演示ppt课件: 这是一份信息技术必修1 数据与计算5.3.1 特征探索教学演示ppt课件,共32页。PPT课件主要包含了3数据分析,什么是数据分析,李海青,数据分析,31特征探索,缺失值,异常值,数据清洗,数据特征探索程序,32关联分析等内容,欢迎下载使用。

    免费资料下载额度不足,请先充值

    每充值一元即可获得5份免费资料下载额度

    今日免费资料下载份数已用完,请明天再来。

    充值学贝或者加入云校通,全网资料任意下。

    提示

    您所在的“深圳市第一中学”云校通为试用账号,试用账号每位老师每日最多可下载 10 份资料 (今日还可下载 0 份),请取消部分资料后重试或选择从个人账户扣费下载。

    您所在的“深深圳市第一中学”云校通为试用账号,试用账号每位老师每日最多可下载10份资料,您的当日额度已用完,请明天再来,或选择从个人账户扣费下载。

    您所在的“深圳市第一中学”云校通余额已不足,请提醒校管理员续费或选择从个人账户扣费下载。

    重新选择
    明天再来
    个人账户下载
    下载确认
    您当前为教习网VIP用户,下载已享8.5折优惠
    您当前为云校通用户,下载免费
    下载需要:
    本次下载:免费
    账户余额:0 学贝
    首次下载后60天内可免费重复下载
    立即下载
    即将下载:资料
    资料售价:学贝 账户剩余:学贝
    选择教习网的4大理由
    • 更专业
      地区版本全覆盖, 同步最新教材, 公开课⾸选;1200+名校合作, 5600+⼀线名师供稿
    • 更丰富
      涵盖课件/教案/试卷/素材等各种教学资源;900万+优选资源 ⽇更新5000+
    • 更便捷
      课件/教案/试卷配套, 打包下载;手机/电脑随时随地浏览;⽆⽔印, 下载即可⽤
    • 真低价
      超⾼性价⽐, 让优质资源普惠更多师⽣
    VIP权益介绍
    • 充值学贝下载 本单免费 90%的用户选择
    • 扫码直接下载
    元开通VIP,立享充值加送10%学贝及全站85折下载
    您当前为VIP用户,已享全站下载85折优惠,充值学贝可获10%赠送
      充值到账1学贝=0.1元
      0学贝
      本次充值学贝
      0学贝
      VIP充值赠送
      0学贝
      下载消耗
      0学贝
      资料原价
      100学贝
      VIP下载优惠
      0学贝
      0学贝
      下载后剩余学贝永久有效
      0学贝
      • 微信
      • 支付宝
      支付:¥
      元开通VIP,立享充值加送10%学贝及全站85折下载
      您当前为VIP用户,已享全站下载85折优惠,充值学贝可获10%赠送
      扫码支付0直接下载
      • 微信
      • 支付宝
      微信扫码支付
      充值学贝下载,立省60% 充值学贝下载,本次下载免费
        下载成功

        Ctrl + Shift + J 查看文件保存位置

        若下载不成功,可重新下载,或查看 资料下载帮助

        本资源来自成套资源

        更多精品资料

        正在打包资料,请稍候…

        预计需要约10秒钟,请勿关闭页面

        服务器繁忙,打包失败

        请联系右侧的在线客服解决

        单次下载文件已超2GB,请分批下载

        请单份下载或分批下载

        支付后60天内可免费重复下载

        我知道了
        正在提交订单

        欢迎来到教习网

        • 900万优选资源,让备课更轻松
        • 600万优选试题,支持自由组卷
        • 高质量可编辑,日均更新2000+
        • 百万教师选择,专业更值得信赖
        微信扫码注册
        qrcode
        二维码已过期
        刷新

        微信扫码,快速注册

        手机号注册
        手机号码

        手机号格式错误

        手机验证码 获取验证码

        手机验证码已经成功发送,5分钟内有效

        设置密码

        6-20个字符,数字、字母或符号

        注册即视为同意教习网「注册协议」「隐私条款」
        QQ注册
        手机号注册
        微信注册

        注册成功

        下载确认

        下载需要:0 张下载券

        账户可用:0 张下载券

        立即下载
        使用学贝下载
        账户可用下载券不足,请取消部分资料或者使用学贝继续下载 学贝支付

        如何免费获得下载券?

        加入教习网教师福利群,群内会不定期免费赠送下载券及各种教学资源, 立即入群

        即将下载

        粤教版 必修一 5.3 数据的分析 课件
        该资料来自成套资源,打包下载更省心 该专辑正在参与特惠活动,低至4折起
        [共10份]
        浏览全套
          立即下载(共1份)
          返回
          顶部
          Baidu
          map