







高中数学人教A版 (2019)必修 第二册用样本估计总体教学ppt课件
展开 这是一份高中数学人教A版 (2019)必修 第二册用样本估计总体教学ppt课件,共57页。PPT课件主要包含了感悟提升,估计样本的平均数,估计样本的中位数,估计样本的众数,题型强化训练,小结及随堂练习等内容,欢迎下载使用。
1.会求样本数据的众数、中位数、平均数.2.理解用样本的数字特征、频率分布直方图估计总体的集中趋势.1.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数).2.理解集中趋势参数的统计含义.
中位数、众数、平均数的计算.
9.2.3 总体集中趋势的估计
复习旧知——总体百分位数的估计
一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
直观来说,一组数的第p位百分位数指的是讲这组数按照从小到大的顺序排列后,处于p%位置的数.
计算一组n个数据的第p百分位数的步骤
第一步:按从小到大排列原始数据;
第二步:计算i=n×p%;
第三步:若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
众数、中位数、平均数的概念及计算
众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.
中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据 (或最中间两个数据的平均数)叫做这组数据的中位数.
平均数:反映所有数据的平均水平
利用9.2.1节中100户居民用户的月均用水量的调査数据,计算样本数据的平均数和中位数,并据此估计全市居民用户月均用水量的平均数和中位数.
因为数据是抽自全市居民户的简单随机样本,所以我们可以据此估计全市居民用户的月均用水量约为8.79t,其中位数约为6.6t.
假设某个居民小区有2000户,你能估计该小区的月用水总量吗?
众数、中位数和平均数的含义及体现
小明用统计软件计算了100户居民用水量的平均数和中位数.但在录入数据时,不小心把一个数据7.7录成了77. 请计算录入数据的平均数和中位数,并与真实的样本平均数和中位数作比较. 哪个量的值变化更大?你能解释其中的原因吗?
通过简单计算可以发现,平均数由原来的8.79t变为9.483t,中位数没有变化,还是6.6t.这是因为样本平均数与每一个样本数据有关,样本中的任何一个数据的改变都会引起平均数的改变;但中位数只利用了样本数据中间位置的一个或两个值,并未利用其他数据,所以不是任何一个样本数据的改变都会引起中位数的改变.因此,与中位数比较,平均数反映出样本数据中的更多信息,对样本中的极端值更加敏感.
平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.在下图的三种分布形态中,平均数和中位数的大小存在什么关系?
一般来说,对一个单峰的频率分布直方图来说,如果直方图的形状是对称的(图9.2-8(1)),那么平均数和中位数应该大体上差不多;如果直方图在右边“拖尾”(图9.2-8(2)),那么平均数大于中位数;如果直方图在左边“拖尾”(图9.2-8C3)),那么平均数小于中位数.也就是说,和中位数相比,平均数总是在“长尾巴”那边.
某学校要定制高一年级的校服,学生根据厂家提供的参考身高选择校服规格.据统计,高一年级女生需要不同规格校服的频数如表9.2-5所示.
如果用一个量来代表该校高一年级女生所需校服的规格,那么在中位数、平均数和众数中,哪个量比较合适?试讨论用表9.2-5中的数据估计全国高一年级女生校服规格的合理性.
【分析】虽然校服规格是用数字表示的,但它们事实上是几种不同的类 别.对于这样的分类数据,用众数作为这组数据的代表比较合适.
【解析】为了更直观地观察数据的特征,我们用条形图来表示表中的数据(图9.2-9).可以发现,选择校服规格为“165”的女生的频数最高,所以用众数165作为该校高一年级女生校服的规格比较合适.
在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下:
分别求这些运动员的成绩的众数、中位数、平均数(保留到小数点后两位),并分析这些数据的含义.
1.众数、中位数、平均数的计算方法(1)众数是出现次数最多的数;(2)计算中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据相关数据的总数是奇数还是偶数而定;(3)平均数一般是根据公式来计算.
2.众数、中位数、平均数的意义(1)样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息,平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.(2)当一组数据中有不少数据重复出现时,其众数往往更能反映问题,当一组数据中个别数据较大或较小时,可用中位数描述其集中趋势.
频率分布直方图中的中位数、众数、平均数
由于全国各地的高一年级女生的身高存在一定的差异,所以用一个学校的数据估计全国高一年级女生的校服规格不合理.
众数只利用了出现次数最多的那个值的信息.众数只能告诉我们它比其他值出现的次数多,但并未告诉我们它比别的数值多的程度.因此,众数只能传递数据中的信息的很少一部分,对极端值也不敏感.一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.
样本的平均数、中位数和众数可以分别作为总体的平均数、中位数和众数的估计,但在某些情况下我们无法获知原始的样本数据.例如,我们在报纸、网络上获得的往往是已经整理好的统计表或统计图.这时该如何估计样本的平均数、中位数和众数?你能以下面的频率分布直方图提供的信息为例,给出估计方法吗?
在频率分布直方图中,我们无法知道每个组内的数据是如何分布的,此时,通常假设它们在组内均匀分布.这样就可以获得样本的平均数、中位数和众数的近似估计,进而估计总体的平均数、中位数和众数.
因为样本平均数可以表示为数据与它的频率的乘积之和,所以在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.如图 9.2-10 所示,可以测出图中每个小矩形的高度,于是平均数的近似值为
这个结果与根据原始数据计算的样本平均数8.79相差不大.
根据中位数的意义,在样本中,有 50%的个体小于或等于中位数,也有 50%的个体大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等
由于0.077×3=0.231,(0.077+0.107)×3=0.552,因此中位数落在区间[4.2,7.2)内.设中位数为x,由0.077×3+0.107×(x-4.2)=0.5,得到x ≈ 6.71.因此,中位数约为 6.71.这个结果与根据原始数据求得的中位数6.8很接近.
在频率分布直方图中,月均用水量在区间[4.2,7.2)内的居民最多,可以将这个区间的中点5.7作为众数的估计值.
频率分布直方图的众数估计值为最高矩形底边的中点.
众数、中位数和平均数来估计总体的数字特征的优缺点
以上我们讨论了平均数、中位数和众数等特征量在刻画一组数据的集中趋势时的各自特点,并研究了用样本的特征量估计总体的特征量的方法.需要注意的是,这些特征量有时也会被利用而产生误导.例如,假设你到人力市场去找工作,有一个企业老板告诉你,“我们企业员工的年平均收入是20万元”,你该如何理解这句话?
这句话是真实的,但它可能描述的是差异巨大的实际情况.例如,可能这个企业的工资水平普遍较高,也就是员工年收入的中位数、众数与平均数差不多;也可能是绝大多数员工的年收入较低(如大多数是5万元左右),而少数员工的年收入很高,甚至达到100万元,在这种情况下年收入的平均数就比中位数大得多.尽管在后一种情况下,用中位数或众数比用平均数更合理些,但这个企业的老板为了招揽员工,却用了平均数.所以,我们要强调“用数据说话”,但同时又要防止被数据误导,这就需要掌握更多的统计知识和方法.
题型一 众数、中位数、平均数的计算
【练习1】在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )A.甲地:总体均值为3,中位数为4B.乙地:总体均值为1,众数为0C.丙地:中位数为2,众数为3D.丁地:总体均值为1,中位数为1
【详解】对A:∵平均数和中位数不能限制某一天的病例超过7人,如0,0,0,0,4,4,4,4,6,8,∴A不正确;对B:∵平均数和众数不能限制某一天的病例超过7人,如0,0,0,0,0,0,0,0,0,10,∴B不正确;对C:∵中位数和众数不能限制某一天的病例超过7人,如0,0,0,0,2,2,3,3,3,8,∴C不正确;对D:假设过去10天新增疑似病例数据存在一个数据x,x≥8,而总体平均数为1,则过去10天新增疑似病例数据中至少有7个0,故中位数不可能为1,所以假设不成立,故符合没有发生大规模群体感染的标志,∴D正确;故选:D.
题型二 众数、中位数、平均数的应用
【练习2】据报道,某公司的33名职工的月工资(以元为单位)如下:
(1)求该公司职工月工资的平均数、中位数、众数;(2)假设副董事长的工资从5 000元提升到20 000元,董事长的工资从5 500元提升到30 000元,那么新的平均数、中位数、众数又是什么?(精确到元)(3)你认为哪个统计量更能反映这个公司员工的工资水平?结合此问题谈一谈你的看法.
【考点】用样本的数字特征估计总体的数字特征;众数、中位数、平均数
众数、中位数、平均数的特点(1)众数、中位数及平均数都是描述一组数据集中趋势的量.(2)平均数的大小与一组数据里每个数的大小均有关系,任何一个数据的变动都会引起平均数的变动.(3)众数考察各数出现的频率,其大小与这组数据中部分数据有关,当一组数据中有不少数据重复出现时,其众数往往更能反映问题.(4)中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响,中位数可能出现在所给数据中,也可能不在所给数据中,当一组数据中个别数据较大时,用中位数描述这组数据的集中趋势更合适.
题型三 用频率分布直方图估计样本众数、中位数、平均数
【练习3】在某次高中学科竞赛中,4000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间中点作代表,则下列说法中有误的是( )A.成绩在[70,80]分的考生人数最多B.不及格的考生人数为1000C.考生竞赛成绩的平均分约70.5分D.考生竞赛成绩的中位数为75分
【点睛】本题考查频率分布直方图的众数、中位数、平均数以及样本容 量的求法,考查学生的计算能力,熟记公式是解题的关键,属于中档题.
用频率分布直方图估计样本众数、中位数、平均数(1)众数:取最高小长方形底边中点的横坐标作为众数.(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x轴交点的横坐标称为中位数.(3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
1.知识清单:(1)中位数、众数、平均数的计算.(2)总体集中趋势的估计.(3)频率分布直方图中的中位数、众数、平均数.
2.方法归纳:数据分析统计.
3.常见误区:求中位数时,需要先把一组数据按从小到大(或从大到小)的顺序排列,再找中间位置的数或中间两数的平均数.
教材第 208 页第1,2,3题.
1.根据表9.2-2中的数据,估计该市2015年全年空气质量指数的平均数、中位数和第80百分位数.(注:已知该市属于“严重污染”等级的空气质量指数不超过400).
2.假设你是某市一名交通部门的工作人员,你打算向市长报告国家对本市26个公路项目投资的平均资金数额.已知国家对本市一条新公路的建设投资为2000万元人民币,对另外25个公路项目的投资是20〜100万元,这26个投资金额的中位数是25万元,平均数是100万元,众数是20万元.请你根据上面的信息给市长写一份简要的报告.
为了避免极端值对平均数的影响,可以把新建设公路项目和另外25个公路项目分开报告,例如公路建设的总投资额为2600万元,其中一条新公路的建设投资2000万元,其他25项公路是扩建或部分路段的改造项目,它们的平均投资是 24 万元.
3.某校举行演讲比赛,10位评委对两位选手的评分如下:
选手的最终得分为去掉一个最低分和一个最高分之后,剩下8个评分的平均数.那么,这两个选手的最后得分是多少?若直接用10位评委评分的平均数作为选手的得分,两位选手的排名有变化吗?你认为哪种评分办法更好?为什么?
两种评分方法甲、乙得分的平均数见下表:
如果采用去掉一个最低分和一个最高分的评分方法,乙选手比甲选手得分高.但是如果按照10 位评委的平均分作为最后的得分,甲选手的得分反而比乙的高. 这是因为有一个评委给甲选手评分为9.9,高出其他评委的评分很多,这一个评委的评分使排名顺序发生了改变.去掉一个最低分和一个最高分的评分机制可以规避个别评委对选手得分的影响.
俗话说,知己知彼方能百战百胜.在第二次世界大战期间,德国制造坦克的技术非常先进,坦克的大量使用使纳粹德国占据了战场主动权.因此,了解德军坦克的生产能力对盟军具有非常重要的战略意义.为此,除了通过常规情报收集信息外,盟军请来了统计学家参与情报的收集和分析工作.根据德国战后公布的生产记录显示,运用统计方法估计的结果与真实值非常接近,而通过常规情报进行的估计则与真实值相去甚远.
统计学在军事中的应用——二战时德国坦克总量的估计问题
下表是二战期间的三个月中,德国记录的生产坦克的数目和情报估计、统计估计的坦克数目.
统计估计有如此高的精确度,统计学家是怎么做到的呢?原来,盟军在缴获的德军坦克上发现了一个重要的线索——每辆坦克上都有一个独一无二的发动机序列号.据分析,序列号前面6位表示生产的年月,最后4位是按生产顺序从1开始的连续编号.统计学家主要是将缴获的德军坦克序列号作为样本,用样本估计总体的方法得出推断的.
当年,统计学家就是利用上述方法估计德军每月生产的坦克数的.你还能想出其他估计德军每月生产的坦克数的方法吗?例如,用样本编号的平均数作为每月生产坦克编号的平均数等,比较一下哪种方法更合理.
相关课件 更多
- 1.电子资料成功下载后不支持退换,如发现资料有内容错误问题请联系客服,如若属实,我们会补偿您的损失
- 2.压缩包下载后请先用软件解压,再使用对应软件打开;软件版本较低时请及时更新
- 3.资料下载成功后可在60天以内免费重复下载
免费领取教师福利 

.png)





