![高中信息技术必修1:《5.2数据的采集》课件01](http://m.enxinlong.com/img-preview/3/14/13834890/0/0.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![高中信息技术必修1:《5.2数据的采集》课件02](http://m.enxinlong.com/img-preview/3/14/13834890/0/1.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![高中信息技术必修1:《5.2数据的采集》课件03](http://m.enxinlong.com/img-preview/3/14/13834890/0/2.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![高中信息技术必修1:《5.2数据的采集》课件04](http://m.enxinlong.com/img-preview/3/14/13834890/0/3.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![高中信息技术必修1:《5.2数据的采集》课件05](http://m.enxinlong.com/img-preview/3/14/13834890/0/4.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![高中信息技术必修1:《5.2数据的采集》课件06](http://m.enxinlong.com/img-preview/3/14/13834890/0/5.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![高中信息技术必修1:《5.2数据的采集》课件07](http://m.enxinlong.com/img-preview/3/14/13834890/0/6.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![高中信息技术必修1:《5.2数据的采集》课件08](http://m.enxinlong.com/img-preview/3/14/13834890/0/7.jpg?x-oss-process=image/resize,w_794/sharpen,100)
信息技术必修1 数据与计算第五章 数据处理和可视化表达5.2 数据的采集5.2.1 数据采集的方法和工具多媒体教学ppt课件
展开常见的数据类型有哪些?
这数据类型用什么设备可以获取?
文本,图片,音频,视频等
键盘,数码相机,麦克风,数码DV等
高中信息技术必修1 数据与计算
1、了解数据采集的基本方法。
数据采集是利用一种装置,从系统外部采集数据并输入到系统内部的一个接口。(百度百科) 数据采集是指根据需求采用适当的方法和工具获取所需要的数据。(课本描述)
数据编码、现有数据获取
如何记录当前自己的精确位置?
手机APP+GPS传感器
淘宝购物平台上各种商品应有尽有,假如你在该平台开了一个零食网店,最近你要调整经营策略,以提高网店的盈利水平。 在调整经营策略之前你必须进行前期调研分析,比如通过分析淘宝网上各类零食的销量数据,去重新定位销售商品的种类和价格;通过分析网店销售数据订单,去了解客户的购物喜好,去判断哪些商品可以捆绑销售。从而下架一些销量不好商品和上架一些新的商品。 那么,你要完成前期调研工作,需要获取到哪些数据呢?完成下表中第2,3列。
各类零食销售数据:包括商品名称、店铺名称、商品价格、商品销量
客户购物喜好数据:包括商品价格、商品销量、商品评论
店铺销售订单数据:包括每个订单购买的商品名称、数量
利用数据采集设备,检测、采集物理信息,并将其转换为电信号形式表示的一种采集方法。
网络数据采集的工具——网络爬虫
1、又称为网页蜘蛛,网络机器人,是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。通常分为通用爬虫和聚焦爬虫。
又称全网爬虫,它将爬取对象从一些种子 URL扩充到整个Web上的网站,主要用途是为门户站点、搜索引擎和大型Web服务提供商采集数据。
又称主题网络爬虫,是指选择性地爬取那些与预先定义好的主题相关的页面的网络爬虫。
1、又称为网页蜘蛛,网络机器人,是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。2、网页:是一个包含HTML标签的纯文本文件。3、用户浏览网页:浏览器提交请求->下载网页代码->解析/渲染成页面。4、爬虫程序:模拟浏览器发送请求->下载网页代码->只提取有用的数据->存放于数据库或文件中。5、Rbts协议:用来告知爬虫哪些页面能被抓取,哪些页面不能被抓取。以此为爬虫使用规范。
搭建“网络商城”网站:安装、并运行XAMPP,启动Apache、MySQL;将文件“whlesale.html”复制到C:\xampp\htdcs目录下。
安装Pythn扩展库:通过pip安装bs4、requests、xlwt、datetime等库。
浏览抓取的数据:打开名如“nike*.xls”的excel文件。
网站测试:浏览器输入 whlesale.html ,访问网站,尝试查看网页源码。
运行Pythn IDLE调试:打开“程序5-3-2 爬取程序(教材范例).py”,阅读关键代码,调试运行。
第1步、第3步可下载微课学习
动手调试: 调试时,记录爬虫程序的关键语句,并说明作用,完成学习资源包中的记录表。思考: 如果将刚才爬虫程序中的” url = ‘’ ”,改成其它网络商城网址,能直接爬取数据吗?
淘宝购物平台上各种商品应有尽有,假如你在该平台开了一个零食网店,最近你要调整经营策略,以提高网店的盈利水平。 在调整经营策略之前你必须进行前期调研分析,比如通过分析淘宝网上各类零食的销量数据,去重新定位销售商品的种类和价格;通过分析网店销售数据订单,去了解客户的购物喜好,去判断哪些商品可以捆绑销售。从而下架一些销量不好商品和上架一些新的商品。 确定数据需求清单后,对比各种采集方法和工具,选择哪种更合适呢?
方法:网络数据采集法工具:爬虫程序
方法:网络数据采集法工具:系统导出、手工记录等
信息技术必修1 数据与计算第五章 数据处理和可视化表达5.2 数据的采集5.2.1 数据采集的方法和工具精品课件ppt: 这是一份信息技术必修1 数据与计算<a href="/xx/tb_c4007095_t3/?tag_id=26" target="_blank">第五章 数据处理和可视化表达5.2 数据的采集5.2.1 数据采集的方法和工具精品课件ppt</a>,共16页。PPT课件主要包含了基本方法等内容,欢迎下载使用。
2021学年5.2.1 数据采集的方法和工具评优课课件ppt: 这是一份2021学年5.2.1 数据采集的方法和工具评优课课件ppt,共21页。PPT课件主要包含了数据的存储与保护,学习目标,重难点,课堂导入,数据的保护等内容,欢迎下载使用。
高中信息技术粤教版 (2019)必修1 数据与计算第五章 数据处理和可视化表达5.2 数据的采集5.2.1 数据采集的方法和工具优质课件ppt: 这是一份高中信息技术粤教版 (2019)必修1 数据与计算第五章 数据处理和可视化表达5.2 数据的采集5.2.1 数据采集的方法和工具优质课件ppt,共28页。PPT课件主要包含了复习上节课内容,系统日志采集法,系统日志怎么查看,网络数据采集法,程序5-1,实践课本106页,运行结果等内容,欢迎下载使用。