我们常用的数据交换方式呈现整理数据结果方式有哪些

哪些问题是数据分析时常出现的_百度经验
&&&&&&生活常识哪些问题是数据分析时常出现的
百度经验:jingyan.baidu.com1 Data Mining 和统计分析有什么不同?  硬要去区分Data Mining和Statistics的差异其实是没有太大意义的。一般将之定义为Data Mining技术的CART、CHAID或模糊计算等等理论方法,也都是由统计学者根据统计理论所发展衍生,换另一个角度看,Data Mining有相当大的比重是由高等统计学中的多变量分析所支撑。但是为什么Data Mining的出现会引发各领域的广泛注意呢?主要原因在相较于传统统计分析而言,Data Mining有下列几项特性:  1.处理大量实际数据更强势,且无须太专业的统计背景去使用Data Mining的工具;  2.数据分析趋势为从大型数据库抓取所需数据并使用专属计算机分析软件,Data Mining的工具更符合企业需求;  3. 纯就理论的基础点来看,Data Mining和统计分析有应用上的差别,毕竟Data Mining目的是方便企业终端用户使用而非给统计学家检测用的。2 数据仓库和数据挖掘的关系为何?  若将Data Warehousing(数据仓库)比喻作矿坑,Data Mining就是深入矿坑采矿的工作。毕竟Data Mining不是一种无中生有的魔术,也不是点石成金的炼金术,若没有够丰富完整的数据,是很难期待Data Mining能挖掘出什么有意义的信息的。  要将庞大的数据转换成为有用的信息,必须先有效率地收集信息。随着科技的进步,功能完善的数据库系统就成了最好的收集数据的工具。数据仓库,简单地说,就是搜集来自其它系统的有用数据,存放在一整合的储存区内。所以其实就是一个经过处理整合,且容量特别大的关系型数据库,用以储存决策支持系统(Design Support System)所需的数据,供决策支持或数据分析使用。从信息技术的角度来看,数据仓库的目标是在组织中,在正确的时间,将正确的数据交给正确的人。  许多人对于Data Warehousing和Data Mining时常混淆,不知如何分辨。其实,数据仓库是数据库技术的一个新主题,利用计算机系统帮助我们操作、计算和思考,让作业方式改变,决策方式也跟着改变。  数据仓库本身是一个非常大的数据库,它储存着由组织作业数据库中整合而来的数据,特别是指事务处理系统OLTP(On-Line Transactional Processing)所得来的数据。将这些整合过的数据置放于数据昂哭中,而公司的决策者则利用这些数据作决策;但是,这个转换及整合数据的过程,是建立一个数据仓库最大的挑战。因为将作业中的数据转换成有用的的策略性信息是整个数据仓库的重点。综上所述,数据仓库应该具有这些数据:整合性数据(integrated data)、详细和汇总性的数据(detailed and summarized data)、历史数据、解释数据的数据。从数据仓库挖掘出对决策有用的信息与知识,是建立数据仓库与使用Data Mining的最大目的,两者的本质与过程是两回事。换句话说,数据仓库应先行建立完成,Data mining才能有效率的进行,因为数据仓库本身所含数据是干净(不会有错误的数据参杂其中)、完备,且经过整合的。因此两者关系或许可解读为Data Mining是从巨大数据仓库中找出有用信息的一种过程与技术。3 OLAP 能不能代替 Data Mining?  所谓OLAP(Online Analytical Process)意指由数据库所连结出来的在线分析处理程序。有些人会说:「我已经有OLAP的工具了,所以我不需要Data Mining。」事实上两者间是截然不同的,主要差异在于Data Mining用在产生假设,OLAP则用于查证假设。简单来说,OLAP是由使用者所主导,使用者先有一些假设,然后利用OLAP来查证假设是否成立;而Data Mining则是用来帮助使用者产生假设。所以在使用OLAP或其它Query的工具时,使用者是自己在做探索(Exploration),但Data Mining是用工具在帮助做探索。  举个例子来看,一市场分析师在为超市规划货品架柜摆设时,可能会先假设婴儿尿布和婴儿奶粉会是常被一起购买的产品,接着便可利用OLAP的工具去验证此假设是否为真,又成立的证据有多明显;但Data Mining则不然,执行Data Mining的人将庞大的结帐数据整理后,并不需要假设或期待可能的结果,透过Mining技术可找出存在于数据中的潜在规则,于是我们可能得到例如尿布和啤酒常被同时购买的意料外之发现,这是OLAP所做不到的。  Data Mining常能挖掘出超越归纳范围的关系,但OLAP仅能利用人工查询及可视化的报表来确认某些关系,是以Data Mining此种自动找出甚至不会被怀疑过的数据模型与关系的特性,事实上已超越了我们经验、教育、想象力的限制,OLAP可以和Data Mining互补,但这项特性是Data Mining无法被OLAP取代的。4 完整的Data Mining 包含哪些步骤?  以下提供一个Data Mining的进行步骤以为参考:  1. 理解业务与理解数据;  2. 获取相关技术与知识;  3. 整合与查询数据;  4. 去除错误或不一致及不完整的数据;  5. 由数据选取样本先行试验;  6. 建立数据模型  7. 实际Data Mining的分析工作;  8. 测试与检验;  9. 找出假设并提出解释;  10. 持续应用于企业流程中。  由上述步骤可看出,Data Mining牵涉了大量的准备工作与规划过程,事实上许多专家皆认为整套Data Mining的进行有80﹪的时间精力是花费在数据前置作业阶段,其中包含数据的净化与格式转换甚或表格的连结。由此可知Data Mining只是信息挖掘过程中的一个步骤而已,在进行此步骤前还有许多的工作要先完成。5 Data Mining 运用了哪些理论与技术?  Data Mining是近年来数据库应用技术中相当热门的议题,看似神奇、听来时髦,实际上却也不是什么新东西,因其所用之诸如预测模型、数据分割,连结分析(Link Analysis)、偏差侦测(Deviation Detection)等,美国早在二次世界大战前就已应用运用在人口普查及军事等方面。  随着信息科技超乎想象的进展,许多新的计算机分析工具问世,例如关系型数据库、模糊计算理论、基因算法则以及类神经网络等,使得从数据中发掘宝藏成为一种系统性且可实行的程序。  一般而言,Data Mining的理论技术可分为传统技术与改良技术两支。传统技术以统计分析为代表,统计学内所含序列统计、概率论、回归分析、类别数据分析等都属于传统数据挖掘技术,尤其 Data Mining 对象多为变量繁多且样本数庞大的数据,是以高等统计学里所含括之多变量分析中用来精简变量的因素分析(Factor Analysis)、用来分类的判别分析(Discriminant Analysis),以及用来区隔群体的分群分析(Cluster Analysis)等,在Data Mining过程中特别常用。  在改良技术方面,应用较普遍的有决策树理论(Decision Trees)、类神经网络(Neural Network)以及规则归纳法(Rules Induction)等。决策树是一种用树枝状展现数据受各变量的影响情形之预测模型,根据对目标变量产生之效应的不同而建构分类的规则,一般多运用在对客户数据的分析上,例如针对有回函与未回含的邮寄对象找出影响其分类结果的变量组合,常用分类方法为CART(Classification and Regression Trees)及CHAID(Chi-Square Automatic Interaction Detector)两种。  类神经网络是一种仿真人脑思考结构的数据分析模式,由输入之变量与数值中自我学习并根据学习经验所得之知识不断调整参数以期建构数据的型样(patterns)。类神经网络为非线性的设计,与传统回归分析相比,好处是在进行分析时无须限定模式,特别当数据变量间存有交互效应时可自动侦测出;缺点则在于其分析过程为一黑盒子,故常无法以可读之模型格式展现,每阶段的加权与转换亦不明确,是故类神经网络多利用于数据属于高度非线性且带有相当程度的变量交感效应时。  规则归纳法是知识发掘的领域中最常用的格式,这是一种由一连串的「如果…/则…(If / Then)」之逻辑规则对数据进行细分的技术,在实际运用时如何界定规则为有效是最大的问题,通常需先将数据中发生数太少的项目先剔除,以避免产生无意义的逻辑规则。6 Data Mining包含哪些主要功能?  Data Mining实际应用功能可分为三大类六分项来说明:Classification和Clustering属于分类区隔类;Regression和Time-series属于推算预测类;Association和Sequence则属于序列规则类。  Classification是根据一些变量的数值做计算,再依照结果作分类。(计算的结果最后会被分类为几个少数的离散数值,例如将一组数据分为 "可能会响应" 或是 "可能不会响应" 两类)。Classification常被用来处理如前所述之邮寄对象筛选的问题。我们会用一些根据历史经验已经分类好的数据来研究它们的特征,然后再根据这些特征对其他未经分类或是新的数据做预测。这些我们用来寻找特征的已分类数据可能是来自我们的现有的客户数据,或是将一个完整数据库做部份取样,再经由实际的运作来测试;譬如利用一个大型邮寄对象数据库的部份取样来建立一个Classification Model,再利用这个Model来对数据库的其它数据或是新的数据作分类预测。  Clustering用在将数据分群,其目的在于将群间的差异找出来,同时也将群内成员的相似性找出来。Clustering与Classification不同的是,在分析前并不知道会以何种方式或根据来分类。所以必须要配合专业领域知识来解读这些分群的意义。  Regression是使用一系列的现有数值来预测一个连续数值的可能值。若将范围扩大亦可利用Logistic Regression来预测类别变量,特别在广泛运用现代分析技术如类神经网络或决策树理论等分析工具,推估预测的模式已不在止于传统线性的局限,在预测的功能上大大增加了选择工具的弹性与应用范围的广度。  Time-Series Forecasting与Regression功能类似,只是它是用现有的数值来预测未来的数值。两者最大差异在于Time-Series所分析的数值都与时间有关。Time-Series Forecasting的工具可以处理有关时间的一些特性,譬如时间的周期性、阶层性、季节性以及其它的一些特别因素(如过去与未来的关连性)。  Association是要找出在某一事件或是数据中会同时出现的东西。举例而言,如果A是某一事件的一种选择,则B也出现在该事件中的机率有多少。(例如:如果顾客买了火腿和柳橙汁,那么这个顾客同时也会买牛奶的机率是85%。)  Sequence Discovery与Association关系很密切,所不同的是Sequence Discovery中事件的相关是以时间因素来作区隔(例如:如果A股票在某一天上涨12%,而且当天股市加权指数下降,则B股票在两天之内上涨的机率是 68%)。7 Data Mining在各领域的应用情形为何?  Data Mining在各领域的应用非常广泛,只要该产业拥有具分析价值与需求的数据仓储或数据库,皆可利用Mining工具进行有目的的挖掘分析。一般较常见的应用案例多发生在零售业、直效行销界、制造业、财务金融保险、通讯业以及医疗服务等。  于销售数据中发掘顾客的消费习性,并可藉由交易纪录找出顾客偏好的产品组合,其它包括找出流失顾客的特征与推出新产品的时机点等等都是零售业常见的实例;直效行销强调的分众概念与数据库行销方式在导入Data Mining的技术后,使直效行销的发展性更为强大,例如利用Data Mining分析顾客群之消费行为与交易纪录,结合基本数据,并依其对品牌价值等级的高低来区隔顾客,进而达到差异化行销的目的;制造业对Data Mining的需求多运用在品质控管方面,由制造过程中找出影响产品品质最重要的因素,以期提高作业流程的效率。  近来电话公司、信用卡公司、保险公司以及股票交易商对于诈欺行为的侦测(Fraud Detection)都很有兴趣,这些行业每年因为诈欺行为而造成的损失都非常可观,Data Mining可以从一些信用不良的客户数据中找出相似特征并预测可能的诈欺交易,达到减少损失的目的。财务金融业可以利用 Data Mining来分析市场动向,并预测个别公司的营运以及股价走向。Data Mining的另一个独特的用法是在医疗业,用来预测手术、用药、诊断、或是流程控制的效率。8 Web Mining 和数据挖掘有什么不同?  如果将Web视为CRM的一个新的Channel,则Web Mining便可单纯看做Data Mining应用在网络数据的泛称。  该如何测量一个网站是否成功?哪些内容、优惠、广告是人气最旺的?主要访客是哪些人?什么原因吸引他们前来?如何从堆积如山之大量由网络所得数据中找出让网站运作更有效率的操作因素?以上种种皆属Web Mining 分析之范畴。Web Mining 不仅只限于一般较为人所知的log file分析,除了计算网页浏览率以及访客人次外,举凡网络上的零售、财务服务、通讯服务、政府机关、医疗咨询、远距教学等等,只要由网络连结出的数据库够大够完整,所有Off-Line可进行的分析,Web Mining都可以做,甚或更可整合Off-Line及On-Line的数据库,实施更大规模的模型预测与推估,毕竟凭借网际网络的便利性与渗透力再配合网络行为的可追踪性与高互动特质,一对一行销的理念是最有机会在网络世界里完全落实的。  整体而言,Web Mining具有以下特性:1. 数据收集容易且不引人注意,所谓凡走过必留下痕迹,当访客进入网站后的一切浏览行为与历程都是可以立即被纪录的;2. 以交互式个人化服务为终极目标,除了因应不同访客呈现专属设计的网页之外,不同的访客也会有不同的服务;3. 可整合外部来源数据让分析功能发挥地更深更广,除了log file、cookies、会员填表数据、线上调查数据、线上交易数据等由网络直接取得的资源外,结合实体世界累积时间更久、范围更广的资源,将使分析的结果更准确也更深入。  利用Data Mining技术建立更深入的访客数据剖析,并赖以架构精准的预测模式,以期呈现真正智能型个人化的网络服务,是Web Mining努力的方向。9 数据挖掘在 CRM 中扮演的角色为何?  CRM(Customer Relationship Management)是近来引起热烈讨论与高度关切的议题,尤其在直效行销的崛起与网络的快速发展带动下,跟不上CRM的脚步如同跟不上时代。事实上CRM并不算新发明,奥美直效行销推动十数年的CO(Customer Ownership)就是现在大家谈的CRM—客户关系管理。  Data Mining应用在CRM的主要方式可对应在Gap Analysis之三个部分:  针对Acquisition Gap,可利用Customer Profiling找出客户的一些共同的特征,希望能藉此深入了解客户,藉由Cluster Analysis对客户进行分群后再透过Pattern Analysis预测哪些人可能成为我们的客户,以帮助行销人员找到正确的行销对象,进而降低成本,也提高行销的成功率。  针对Sales Gap,可利用Basket Analysis帮助了解客户的产品消费模式,找出哪些产品客户最容易一起购买,或是利用Sequence Discovery预测客户在买了某一样产品之后,在多久之内会买另一样产品等等。利用 Data Mining可以更有效的决定产品组合、产品推荐、进货量或库存量,甚或是在店里要如何摆设货品等,同时也可以用来评估促销活动的成效。  针对Retention Gap,可以由原客户后来却转成竞争对手的客户群中,分析其特征,再根据分析结果到现有客户数据中找出可能转向的客户,然后设计一些方法预防客户流失;更有系统的做法是藉由Neural Network根据客户的消费行为与交易纪录对客户忠诚度进行Scoring的排序,如此则可区隔流失率的等级进而配合不同的策略。  CRM不是设一个(080)客服专线就算了,更不仅只是把一堆客户基本数据输入计算机就够,完整的CRM运作机制在相关的硬软件系统能健全的支持之前,有太多的数据准备工作与分析需要推动。企业透过Data Mining可以分别针对策略、目标定位、操作效能与测量评估等四个切面之相关问题,有效率地从市场与顾客所搜集累积之大量数据中挖掘出对消费者而言最关键、最重要的答案,并赖以建立真正由客户需求点出发的客户关系管理。10 目前业界常用的数据挖掘分析工具?  Data Mining工具市场大致可分为三类:  1. 一般分析目的用的软件包  SAS Enterprise Miner  IBM Intelligent Miner  Unica PRW  SPSS Clementine  SGI MineSet  Oracle Darwin  Angoss KnowledgeSeeker  2. 针对特定功能或产业而研发的软件  KD1(针对零售业)  Options & Choices(针对保险业)  HNC(针对信用卡诈欺或呆帐侦测)  Unica Model 1(针对行销业)  3. 整合DSS(Decision Support Systems)/OLAP/Data Mining的大型分析系统  Cognos Scenario and Business Objects原作者:海洋数据博客经验内容仅供参考,如果您需解决具体问题(尤其法律、医学等领域),建议您详细咨询相关领域专业人士。投票(0)已投票(0)有得(0)我有疑问(0)◆◆说说为什么给这篇经验投票吧!我为什么投票...你还可以输入500字◆◆只有签约作者及以上等级才可发有得&你还可以输入1000字◆◆如对这篇经验有疑问,可反馈给作者,经验作者会尽力为您解决!你还可以输入500字相关经验00101热门杂志第1期房屋装修全攻略3332次分享第2期愚您同乐376次分享第9期实用房子装修攻略1568次分享第1期欢度春节 合家团圆276次分享第1期年货选购技巧588次分享◆请扫描分享到朋友圈统计里的关键词
今天教学《统计》第一课时,统计是数学大家庭中的一员,随着社会的飞速发展和计算机技术的广泛使用,统计的思想、方法、原理就越来越受到重视,学生的统计意识的培养和解读统计数据的要求有新的提高,统计教学中重要性就要求引起教师的重视。在统计里,有一些专用的统计术语成为统计教学中的关键词。
教学的例题有两个,一个是关于空气质量的统计,另一个是四年级一班18个男生的身高统计。刚上课,我就说:“中国的经济建设近些年取得了长足的发展,可是也出现了一些问题。”学生说环境污染了,也有学生说空气污染了。我说:“最近媒体报道说美国某地遭受了雾霾,说污染源是中国。我们不去追究是不是真的,但说明中国的空气污染极其严重。怎么办呢?”学生说治理。“要治理,我们得知道哪里需要治,这就需要对空气质量进行监测。对并监测的数据进行统计,说到统计,你知道哪些统计有关的知识呢?”小叮当说有分类整理。这是一种整理数据的方法,也是常见的方法。冬日阳光说可以做成统计表,有孩子补充说还可以做成统计图。统计表和统计图是呈现统计结果常用的方式。我把数据整理、方法、分类、方式、统计图、统计表等词语板书出来。进入例题1的学习,首先是认读统计表。表头是“某地4月份空气质量状况统计表”,它包含三个部分,一个是数据的采集地,第二个是数据反映的内容,第三是统计呈现的方式。接着填写表格中的数据,数据是优7天,良17天,轻度污染6天,合计30天。我在填写的时候故意把良17天写成16天。学生说错了,是17天。我问:“如果我填16行不行。”孩子们基本上说行。我让他们再想想,还是小数点先说。她说:“不行,如果是16天的话,合计起来就只有29天,可是题上是4月份,4月份是30天,这样就少了一天。”这一说,大家觉得还真不能少一天。我说:“合计在统计表里不仅是各个统计数据的和,同时还可以帮助我们确定统计是否正确。这里就要根据统计的月份和合计数进行比较确定每个数据是否正确。”合计是统计表中常见的一个词,它在统计里的意义不仅仅是一个统计数据的总和,同时也是统计结构的验证,各个统计数据的总和要和统计的基础数据的个数相等。
紧接着教学条形统计图,教材的统计图保留了网格,所以学生认读不难。我在板演的时候去掉了网格线,也没有讲横轴、纵轴等相关的东西,我的眼光停留在“直观”上。统计图的关键词是直观,直观怎样让孩子体会到呢?绘制完条形统计图后,我让学生看着统计表回答,那种天气状况最多。我听到一个孩子“嗯、嗯”的声音,显然要对比才能说。我说:“刚才我听见一个孩子嗯嗯的声音,他告诉我在表里不太好找,下面请在统计图里看看,那种天气最多?”学生几乎没有停顿就说是良。“这次怎么这么快呢?”“我们直接在图里就看到了。”“看到了也可以说是观察到了,统计图的优点就是可以直接观察到谁最多,谁最少。这种特点我们叫做……”我拿粉笔在统计图下划了一根线,写上“直观”。统计图的特点就是形象直观,便于比较。当然它也有缺点,没法看到合计是多少。
教学例题2,例题2呈现的是18个学生的身高,它的统计方式不是分类统计了,教材向孩子们表示出统计中整理数据的另一种方式——“分段统计”。分段就是这个例题的难点了,阅读信息后,我让孩子们说自己的想法,多数同学说让高的和高的在一起,矮的和矮的在一起;也有学生说可以让一样高的在一起。有统计的意识,但没有分段的意识。我说:“上次来给同学们量校服,131厘米的同学写的是135厘米,132厘米也写的是135厘米;136厘米的写的是140厘米。你发现了什么?”小可爱说发现都要多看一点。启发不了,直接看书上的提示“分段整理”。通过统计表的整理,体会分段整理的方法。具体的整理数据的方法,我没有更多的强求,让小白兔把自己整理的数据板书出来。订正完后,孩子们拼命的举手要上黑板画统计图。我让小叮当、火神、小峰三个孩子合作完成。我看画这样的统计图难不住他们,但也有部分孩子没有画纸条的框线。
教材给出的两个统计图有些细微的差别,我让孩子们说,她们从数据的类别,网格线等方面说。我用红色粉笔画出两个统计图横轴上末端,前一个是横线,后一个是箭头。课后冬日阳光说他也发现了,但没有说。我让孩子看书后面的习题,也是分为两类。是什么原因呢?例题1的统计图是分类统计的结果,例题2是分段统计的结果。教材上分类统计的都是横线,分段的都是箭头。可能和整理数据的方式有关吧,网上也没有相关的说法,在电脑上用电子表格制图,制图没有一个有箭头。课上孩子们说分段的方法很多,可能会分出不同的段,这样统计图需要延长。分类是固定了的,只有这几个结果,所以是横线。也算是一个理解吧,课后和学校老师交流,黄老师也发现这一特点,
这节课,我关注了那些关键词呢?“合计”、“分段”、“直观”,这些词里有的是统计的方法,有的是统计方式的特征。条形统计图的直观和“几何直观”的直观是同一个词,条形统计图的直观恰恰是应用了几何图形的直观来完成的。分段统计是统计方式的丰富,对于同类数据的统计而言,分类属于定性的统计,分段更多是定量的统计。
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。以下试题来自:
单项选择题我们在获得了足够的实验数据后,可以对数据进行整理后以图表的展示方式表现出来,以下哪种是用来呈现定性数据的图表?()
为您推荐的考试题库
您可能感兴趣的试卷
你可能感兴趣的试题
A.保存实验过程、数据、统计结果、图表和结论
B.帮助确定研究方法是否真的能验证你的假设中的预测
C.记录对实验设计的思考,以及你对所有可能收集到的数据的推测
D.是对整个实验项目的正式记录,以便其他人能够理解你的记录
A.反馈理论
B.特征方程
C.频率响应理论
D.根轨迹法
A.仿生设计技术
B.生物遗传制造
C.仿生微型机械
D.智能机器人论文发表、论文指导
周一至周五
9:00&22:00
以数据分析观念的培养为核心
  数据能够帮助人们认识世界、做决策和预测。在当今以信息和技术为基础的时代,人们越来越多地需要与数据打交道,如“今天降水概率20%”“3月份居民消费价格指数CPI达到3.8%”“某地因台风受灾的面积达60%”“火车站的日客流量突破10万人次”等都是用数据描述客观世界中的某些现象。面对纷繁复杂的数据信息,现代公民需要具有一定的收集数据、整理数据、分析数据的能力,对数据进行选择与判断,做出合理的决策,并进行有效的表达与交流。中国论文网 /9/view-3800677.htm  随着统计教学的不断实践与探索,人们逐渐对统计学习的价值与目标有了清晰的认识,即统计学习不仅仅是画统计图表、求平均数等技能的学习,更重要的是“数据分析观念”的培养,提高学生收集数据、整理数据、分析数据的能力。数据分析观念(或称为统计观念)是在亲身经历统计活动的过程中培养出来的一种感觉、一种思维方式,其核心是“通过数据分析问题”。英国的Peter Holmes在1980年提出统计观念表现在五个方面:数据的收集;数据的记录与表示;数据的提炼;数据与概率的关系;对数据进行解释并做出推断。美国的Jerry Moreno则在1998年提出,公民的统计观念主要应体现在用统计说理、会设计调查实验、能辨认出传媒表达的错误信息等八个方面。我国2001年颁布的《义务教育数学课程标准(实验稿)》提出统计观念主要表现在:能从统计的角度思考与数据信息有关的问题;能通过收集数据、描述数据、分析数据的过程做出合理的决策,认识到统计对决策的作用;能对数据的来源、处理数据的方法,以及由此得到的结果进行合理的质疑。  在十年新课程实践的基础上,我国的《数学课程标准(2011年版)》对统计领域做了进一步修订、完善。首先,《标准(2011年版)》将核心词“统计观念”改成了“数据分析观念”,以进一步明晰和强调“数据分析是统计的核心”,并重新阐述了其内涵:“了解在现实生活中有许多问题应当先做调查研究,收集数据,通过分析做出判断,体会数据中是蕴涵着信息的;了解对于同样的数据可以有多种分析的方法,需要根据问题的背景选择合适的方法;通过数据分析体验随机性,一方面对于同样的事情每次收集到的数据可能不同,另一方面只要有足够的数据就可能从中发现规律。”从修订后的表述中可以看出,《标准(2011年版)》仍将统计意识(即数据分析意识)放在首位,修订又进一步明晰了统计的两个核心目标:通过数据分析用合适的方法提取信息、通过数据分析体会随机性,期望通过统计学习帮助学生形成运用数据分析问题的思维方式。其次,《标准(2011年版)》在“统计”的内容结构方面做了较大调整,第一学段主要鼓励学生运用自己的方式(包括文字、图画、表格等)呈现整理数据的结果,不要求学生学习“正规”的统计图以及平均数(这些内容移入了第二学段)。统计量的教学也进行了调整,只在第二学段学习平均数,中位数、众数等内容移入了第三学段。  数据分析观念的形成是一个长期的过程,数学教学应经常让学生置身于实际情境中,经历收集数据、整理和描述数据、分析数据的统计活动全过程,引导学生思考“怎样收集数据”“怎样整理和描述数据”“如何根据问题的背景选择数据分析的方法”“从数据分析中能得到什么信息和解决什么问题”等,增强学生数据收集的意识,掌握一些基本的数据分析的方法,体验数据的随机性,发展数据分析观念。  一、引导学生积极参与数据收集和分析活动,发展学生的数据分析意识,使学生逐步养成用数据分析问题的思维习惯  学生“数据分析观念”的形成,首先是要形成通过数据来分析问题的意识和习惯,也就是当遇到有关问题时能想到调查研究,通过收集数据和分析数据解决问题。教学中,要设计一些基于实际生活的统计活动,创设含有数学问题的实际情境,激发学生真正投入到统计活动的全过程中,使学生能够通过收集数据、整理数据、分析数据解决问题或做出决策,在活动中获得数据分析的亲身体验,逐步形成用数据分析问题的思维习惯。例如,有一个班要过一次集体生日,班主任和同学商量“集体生日安排在几月份”,后来决定“哪个月过生日的同学最多,就把集体生日放在那个月”。接着引导学生收集数据、整理数据,最后组织学生分析获得的数据,并做出决策,确定“集体生日安排在几月份”。这样,通过调查统计活动,学生确定了集体生日的时间,解决了实际问题,并充分体会了统计在决策中的作用。再如,班级里要选择两位运动员参加校运会的投篮比赛,也可以引导学生用收集几位候选运动员的有关数据的方法,通过数据分析做出决策。  类似上面调查统计的活动还可以设计很多,如“搞体育比赛前,调查同学们最喜欢的体育运动”“开联欢会前,调查同学们最喜欢的水果”“统计水果店一周卖出各类水果的情况,为下一周的进货提供依据”“调查最爱收看的电视节目”“调查一年级同学掉牙情况”“调查学校教师使用的交通工具”“统计一个家庭一周丢弃的垃圾袋的数量”“统计学校门口的车流量”等。这样的活动贴近学生的生活实际,具有较强的可操作性,使学生在一次次经历数据收集与分析的活动中,积累统计活动经验,逐步体会到生活中充满着大量的数据,很多问题的解决可以先做调查研究、收集数据,再通过分析做出合理决策,逐步树立从数据收集与分析的角度思考问题的意识。另外,教师还可以引导学生经常记录、逐步积累一些与自己密切相关的基本数据,如“每天上学的时间”“每天写作业的时间”“吃一餐饭的时间”等,以便在需要的时候利用数据进行决策,也有利于学生的数据分析意识的形成。  二、引导学生学习掌握收集、整理、描述和分析数据的基本方法,学会根据问题背景用合适的方法从数据中提取信息,并根据信息做出合理决策或推断  运用统计分析和解决问题的过程一般包括下面三个步骤:根据收集数据的目的,决定收集数据的方法并收集数据;根据需要整理数据,并用一定的方式描述数据;分析数据,并做出合理决策或推断。在这个过程中,学生能否掌握一些收集、整理、描述和分析数据的基本方法,并根据问题的背景选择合适的方法非常关键。  (一)引导学生学习掌握基本的收集、整理、描述和分析数据的方法   常用的收集数据方法包括测量、调查、实验等直接获得数据的方法,也包括查阅资料等间接获得数据的方法。《标准(2011年版)》在第一学段提出“了解调查、测量等收集数据的简单方法”,在第二学段提出“会根据实际问题设计简单的调查表,能选择适当的方法(如调查、试验、测量)收集数据”“能从报纸杂志、电视等媒体中,有意识地获得一些数据信息”。  在收集数据以后,需要对看起来杂乱无序的数据进行必要的整理,然后运用统计图、统计表等方式表示出来,再进行数据分析,为做出决策和推断提供依据。整理数据的方式主要有分类、排序、分组、计数(包括用画“正”字等多种方式记录)、编码等;描述数据的主要方式有文字、图画、统计图、统计表以及刻画数据特征的统计量等。《标准(2011年版)》在第一学段提出“能用自己的方式(文字、图画、表格等)呈现整理数据的结果”, 在第二学段提出“认识条形统计图、扇形统计图、折线统计图,能用条形统计图、折线统计图直观、有效地表示数据”“体会平均数的作用,能计算平均数,能用自己的语言解释其实际意义”。分析数据主要指根据数据做出判断、推断、预测、决策等,并能根据数据分析解决生活中的实际问题,《标准(2011年版)》在第一学段提出“通过对数据的简单分析,体会运用数据进行表达与交流的作用,感受数据蕴涵信息”, 在第二学段提出“能解释统计结果,根据结果做出简单的判断和预测,并能进行交流”。  教学中,要引导学生经历收集、整理、描述和分析数据的全过程,并对收集数据、整理数据、描述数据和分析数据的方法进行指导。其中,收集数据主要是让学生对一些基本的收集数据的方法有比较丰富的体验;整理数据主要是让学生体验每种整理方法的作用并会做出选择;描述数据,第一学段要鼓励学生尝试用自己的方式进行描述数据,第二学段的统计图教学,要注重让学生体会各种统计图的特点,能根据实际问题选择合适的统计图来描述数据。统计量的教学,主要是要关注“平均数”实际意义的教学(见下面的案例);分析数据的教学,关键是教师要设计一些引导性问题,引导学生结合数据思考分析和判断、预测等,并通过讨论、交流,学会一些分析数据的基本方法。  案例1:“平均数”教学片段  “平均数”教学时,在初步教学平均数的概念后,教师又先后出示了下列几个问题,引导学生结合具体问题体会平均数的实际意义。  1.下面图中的虚线表示第四小组投球平均每人投中的个数。想一想,你认为哪幅图的表示是正确的?说说你的观点和理由。  2.出示一位运动员体操决赛中的得分情况。  (1)你知道计分员是如何确定他的最后得分的?为什么要用这几个得分的平均数来代表他的最后得分?  (2)为什么要去掉一个最高分和一个最低分?  (3)你先估计一下这个运动员的平均得分,再算一算,比一比。  3.出示:光明小学教师的平均年龄是40岁。  (1)“平均年龄40岁”你怎么理解?  (2)如果想让该校老师的平均年龄降下来,有什么办法呢?  4.情境辨别。  读一读下面的几段话,你认为有道理吗?请发表你的看法,并简要说明理由。  情境一:小明班同学的平均身高是135厘米,所以他的身高一定是135厘米。  情境二:小明班同学的平均身高是135厘米,小强班同学的平均身高是132厘米,所以小明要比小强高。  情境三:一个游泳池的平均水深是120厘米,小林身高125厘米,他在这个游泳池游泳肯定不会有什么危险。  平均数是一种反映一组数据集中趋势的统计量,是描述数据的重要统计指标之一,理解平均数的统计意义是教学的关键。在上述教学片段中,教师设计了丰富的情境,引导学生通过辨析讨论,体会“平均数肯定在最大数与最小数之间”“平均数有时会受极端数据影响”“平均数是一个特征数,并不是所有数都是这个数”等特点,进一步理解平均数的实际意义。这样的教学,有助于学生今后理解用平均数表示的数据的特征,并且在进行数据分析时能想到用平均数刻画数据。  (二)引导学生根据问题背景选用合适的方法进行数据的整理、描述和分析,有效地从数据中提取信息  数据分析是一个复杂的思维过程。特别是对于不同的问题背景,学生要会选择不同的收集、整理、描述和分析数据的方法,即使是同一组数据,也可以有不同的整理和描述数据的方法。教学中,教师要启发学生根据问题的具体情况选择合理的方法,在不断修正自己想法的过程中掌握数据分析的方法。  案例2:你准备用什么方法收集下列数据?  ①同学们最喜欢的体育运动。  ②学校教师使用的交通工具。  ③全班同学立定跳远情况。  ④统计学校门口的车流量。  ⑤不同的球在同一高度落下时的反弹高度。  ⑥2000年以来的四届奥运会中国获奖牌情况。  通过思考和讨论,引导学生体会如何根据问题背景的不同,选择不同的收集数据的方法。如上述案例中的①②可以用调查的方法;③可以用测量的方法;④可以用观察记录的方法;⑤可以用实验的方法;⑥可以用查阅资料的方法。  案例3:“数据的整理与分析”教学片段。  教师呈现一个班级学生的身高记录单,并先后提出三个问题,引导学生选择不同的方法整理数据、分析数据。  呈现问题1:从这组数据中你了解到哪些信息?可以用什么数据描述这个班身高的整体情况?  学生通过分析数据、讨论,得出了以下信息:这个班中最高的人的身高是158厘米,最矮的人的身高是130厘米,这两人的身高相差28厘米。这个班的平均身高约是142厘米。  呈现问题2:开运动会时,如果要选10名身高比较接近的同学参加鲜花队,你认为该如何整理数据,然后做出选择呢?  学生通过分析数据、讨论,确定可以用“排序”的方法整理数据,教师利用excel直接进行“排序”,然后引导学生选择10名身高比较接近的同学,在交流中体会“排序”整理数据的作用。   158? 155 154 154 153 148 148 147 146 145 145 144 143 142 142 141 140 140 139 139 138 138 138? 137 136? 136? 135 135 134 132 131 130  呈现问题3:服装厂要为这个班的同学做校服,要做多少种型号的校服呢?怎么整理数据呢?  学生通过分析数据、讨论,提出了三种做服装的方法,第一种是每个厘米数为一种型号;第二种是每10厘米一个型号,共三个型号:130 ~139,140 ~149,150 ~159; 第三种是每5厘米一个型号,共六个型号:130 ~134, 135~139,140 ~144, 145~149, 150~154,155~159。教师引导学生讨论这三种方法的合理性及各自的优缺点,体会“分组整理”数据的价值。然后,引导学生用第三种方法进行分组整理,如下表:  在“分组整理”得出数据后,教师再引导学生思考讨论:  (1)这个班同学身高在哪个范围内的人数最多?  (2)根据统计数据,服装厂要做几种型号的校服?每种型号要做多少套?一共要做多少套校服呢?  (3)整理后的数据和原始数据记录单相比,有哪些优点?  通过上述三个问题的讨论,学生经历了整理数据、描述数据、分析数据并解决问题的过程,了解了对于同样的数据可以有排序、分组整理等多种整理的方法,能根据问题的背景选择合适的方法,初步学会了对原始数据进行分组整理的方法,体会分组整理能使原来繁多的数据简化、有序化,进一步增强了用统计的方法解决实际问题的意识。  三、引导学生在数据收集和分析中体会数据的随机性,学会全面客观地认识数据  (一)引导学生体会数据的随机性  《标准(2011年版)》强调通过数据分析使学生体会数据的随机性,其内涵包括两个方面:一方面对于同样的事情每次收集到的数据可能不同,另一方面只要有足够的数据就可能从中发现规律。  教学中,要选择合适的问题,引导学生在经历统计的过程中体会数据的随机性。如在关于“校门口早晨、中午、傍晚三个时间段中,哪个时间段汽车流量最大”的统计活动中,教师引导学生在用一定的方式统计和记录每天三个时间段的车流量情况。学生在开展这一统计活动时需要考虑如何收集数据、用什么方式整理和描述数据,能从这些数据中得到怎样的结论,需要观察记录多少天等。在记录一周数据的基础上,教师引导学生对七天中每个时段车流量的情况进行分析,在数据分析中体会数据的随机性,也就是对于“哪个时间段的车流量大”的统计分析中,可以体会到“每天收集到的数据有所不同(如有的日子早晨车流量最大,有的日子傍晚车流量最大,甚至个别日子中午车流量最大等),但从七天的数据中可以发现一些规律(如总体上每天早晨、傍晚的车流量大,每天中午的车流量比较小等)”。如果七天的数据还不足以支持规律的发现,可以引导学生再统计一周,然后再进行数据分析。  (二)引导全面客观地认识数据  对统计数据的质疑意识和辨别能力也是培养数据分析观念的重要方面。教学中,教师可以引导学生对数据来源、处理数据的方法以及由此得到的结果进行合理的质疑,使学生对统计数据有较全面、客观的认识。例如,可以设计这样的问题:一位同学调查了自己班的5位男同学,其中有4位同学喜欢打篮球,便得出结论:“我们班80%的同学喜欢打篮球。”请根据所学的统计知识,判断他的结论是否合理?并简述理由。显然,该学生仅凭调查了5位男同学,就断然说80%的同学喜欢打篮球,这样的数据是不可靠的,因为所取的样本容量太小,而且全是男同学,样本的抽取缺乏随机性和代表性,用特殊代替了一般。另外,日常生活中,误用和滥用统计数据的情况随处可见,一些媒体有时为了达到某种宣传效果,也会出现对统计数据进行不恰当的表述以致误导大众理解的现象,教师可以收集一些适合小学生认知水平和生活经验的数据,组织学生质疑、讨论,引导学生全面客观地认识数据,发展学生数据分析观念。  (浙江省嘉兴市南湖区教研室 314000)
转载请注明来源。原文地址:
【xzbu】郑重声明:本网站资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有,如有不愿意被转载的情况,请通知我们删除已转载的信息。
xzbu发布此信息目的在于传播更多信息,与本网站立场无关。xzbu不保证该信息(包括但不限于文字、数据及图表)准确性、真实性、完整性等。

我要回帖

更多关于 常用的数据交换方式 的文章

 

随机推荐