所属成套资源:2026届高三数学一轮复习讲义(标准版)(Word版附答案)
2026届高三数学一轮复习讲义(标准版)第九章9.2用样本估计总体(Word版附答案)
展开
这是一份2026届高三数学一轮复习讲义(标准版)第九章9.2用样本估计总体(Word版附答案),共8页。
1.百分位数
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有 的数据小于或等于这个值,且至少有(100-p)%的数据 这个值.
2.平均数、中位数和众数
(1)平均数:x= .
(2)中位数:将一组数据按从小到大或从大到小的顺序排列,处在最 的一个数据(当数据个数是奇数时)或最中间两个数据的 (当数据个数是偶数时).
(3)众数:一组数据中出现次数 的数据(即频数最大值所对应的样本数据).
3.方差和标准差
(1)方差:s2= 或1nnΣi=1xi2-x2.
(2)标准差:s= .
4.总体方差和总体标准差
(1)一般式:如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为Y,则总体方差S2=1NNΣi=1(Yi-Y)2.
(2)加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=1NkΣi=1fi(Yi-Y)2.
1.判断下列结论是否正确.(请在括号中打“√”或“×”)
(1)对一组数据来说,平均数和中位数总是非常接近.( )
(2)方差与标准差具有相同的单位.( )
(3)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.( )
(4)在频率分布直方图中,可以用最高的小长方形底边中点的横坐标作为众数的估计值.( )
2.在下列统计量中,用来描述一组数据离散程度的量是( )
A.平均数B.众数
C.百分位数D.标准差
3.已知在高考前最后一次模拟考试中,高三某班8名同学的物理成绩分别为84,79,84,86,95,84,87,93,则该组数据的平均数和众数分别是( )
A.86,84B.84.5,85
C.85,84D.86.5,84
4.(2024·周口模拟)已知一组从小到大排列的数据为a,2,2,4,4,5,6,b,8,8,若其第70百分位数等于其极差,则2a+b= .
1.若x1,x2,…,xn的平均数为x,方差为s2,那么mx1+a,mx2+a,…,mxn+a的平均数为mx+a,方差为m2s2.
2.数据x1,x2,…,xn与数据x1'=x1+a,x2'=x2+a,…,xn'=xn+a 的方差相等,即数据经过平移后方差不变.
题型一 样本数字特征的估计
例1 (1)(多选)(2024·郴州模拟)随机抽取8位同学对他们2024年数学新课标全国Ⅰ卷的平均分进行预估,得到一组样本数据:97,98,99,100,101,103,104,106,则下列关于该样本的说法正确的有( )
A.平均数为101B.极差为9
C.方差为8D.第60百分位数为101
(2)如图是2023年11月中国的10个城市地铁运营里程(单位:公里)及运营线路条数的统计图,下列判断正确的是( )
A.这10个城市中北京的地铁运营里程最长且运营线路条数最多
B.这10个城市地铁运营里程的中位数是516公里
C.这10个城市地铁运营线路条数的平均数为15.4
D.这10个城市地铁运营线路条数的极差是12
思维升华 计算一组n个数据第p百分位数的步骤
跟踪训练1 (1)(多选)某次比赛通过赛后数据记录得到其中一名选手的得分分别为7,12,13,17,18,20,32,则( )
A.该组数据的极差为25
B.该组数据的75%分位数为19
C.该组数据的平均数为17
D.若该组数据去掉一个数得到一组新数据,则这两组数据的平均数可能相等
(2)若某校高一年级10个班参加合唱比赛的得分分别为89,91,90,92,87,93,96,94,96,95,则这组数据的众数是 ;中位数是 .
题型二 总体集中趋势的估计
例2 某考试机构举行了新高考适应性考试,在联考结束后,根据联考成绩,考生可了解自己的学习情况,作出升学规划,决定是否参加强基计划.在本次适应性考试中,某学校为了解高三学生的联考情况,随机抽取了100名学生的联考数学成绩作为样本,并按照分数段[50,70),[70,90),[90,110),[110,130),[130,150]分组,绘制了如图所示的频率分布直方图.
(1)求出图中a的值并估计本次考试的及格率(“及格率”指得分为90分及以上的学生所占的比例);
(2)估计该校学生联考数学成绩的第80百分位数;
(3)估计该校学生联考数学成绩的众数、平均数.
思维升华 频率分布直方图中的数字特征
(1)众数:最高矩形的底边中点的横坐标.
(2)中位数:中位数左边和右边的矩形的面积和应该相等.
(3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.
跟踪训练2 某高中为了解本校高二年级学生的体育锻炼情况,随机抽取100名学生,统计他们每天体育锻炼的时间,并以此作为样本,按照[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]进行分组,得到如图所示的频率分布直方图.已知样本中体育锻炼时间在[50,60)内的学生有10人.
(1)求频率分布直方图中a和b的值;
(2)估计样本数据的中位数和平均数(求平均数时,同一组中的数据以该组区间的中点值为代表).
题型三 总体离散程度的估计
例3 某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行了10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10).试验结果如下:
记zi=xi-yi(i=1,2,…,10),z1,z2,…,z10的样本平均数为z,样本方差为s2.
(1)求z,s2;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果z≥2s210,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高).
思维升华 总体离散程度的估计
标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小.
跟踪训练3 某校随机抽取了100名学生参加“奥运会”知识竞赛,统计得到参加竞赛的每名学生的成绩(单位:分),然后按[40,50),[50,60),…,[90,100]分成6组,并绘制成如图所示的频率分布直方图,已知b+0.03=2a.
(1)求a,b的值,并估计参加竞赛的学生成绩的第30百分位数;
(2)已知成绩在[80,90)内所有学生的平均成绩为84分,方差为6,成绩在[90,100]内所有学生的平均成绩为98分,方差为10,求成绩在[80,100]内所有学生的平均成绩x和方差s2.
答案精析
落实主干知识
1.p% 大于或等于
2.(1)1n(x1+x2+…+xn)
(2)中间 平均数 (3)最多
3.(1)1nnΣi=1(xi-x)2
(2)1nnΣi=1(xi-x)2
自主诊断
1.(1)× (2)× (3)√ (4)√
2.D 3.D 4.10
探究核心题型
例1 (1)ABD [平均数为
97+98+99+100+101+103+104+1068=101,A正确;
极差为106-97=9,B正确;
方差为
(97-101)2+(98-101)2+…+(106-101)28=16+9+4+1+0+4+9+258=8.5,C错误;
因为60%×8=4.8,故第60百分位数为101,D正确.]
(2)C [北京的地铁运营线路条数最多,而运营里程最长的是上海,A错误;
地铁运营里程的中位数是558.6+5162=537.3(公里),B错误;
地铁运营线路条数的平均数为
20+27+18+14+17+12+14+10+14+810=15.4,C正确;
地铁运营线路条数的极差是27-8=19,D错误.]
跟踪训练1 (1)ACD [极差为32-7=25,故A正确;
7×75%=5.25,故75%分位数为20,故B错误;
平均数为7+12+13+17+18+20+327=17,故C正确;
去掉17后,这两组数据的平均数相等,故D正确.]
(2)96 92.5
解析 这组数据从小到大排列为87,89,90,91,92,93,94,95,96,96,其中96出现的次数最多,则这组数据的众数是96,中位数是92+932=92.5.
例2 解 (1)由频率分布直方图的性质,可得(a+0.004+0.013+0.014+0.016)×20=1,
解得a=0.003.
本次考试的及格率约为(0.016+0.014+0.003)×20=0.66=66%.
(2)得分在110分以下的学生所占的比例为(0.004+0.013+0.016)×20=0.66,
得分在130分以下的学生所占的比例为0.66+0.014×20=0.94,
所以第80百分位数位于[110,130)内,
由110+20×0.8-,估计第80百分位数为120.
(3)由题图可得,众数的估计值为100.
平均数的估计值为0.08×60+0.26×80+0.32×100+0.28×120+0.06×140=99.6.
跟踪训练2 解 (1)由题意可知,学生每天体育锻炼的时间在[50,60)内的频率为10100=0.1,
则a=0.110=0.01,
由各组频率之和为1,可知(0.005+0.01+b+0.025×2+0.005)×10=1,
解得b=0.03.
(2)前3组的频率之和为(0.005+0.01+0.03)×10=0.450.5,
所以样本数据的中位数在第4组,
设为x,
所以0.45+(x-70)×0.025=0.5,解得x=72,
估计样本数据的中位数是72,
估计平均数是(45+95)×0.05+55×0.1+65×0.3+(75+85)×0.25=72.
例3 解 (1)由题意得zi=xi-yi 的值分别为9,6,8,-8,15,11,19,18,20,12,
则z=110×(9+6+8-8+15+11+19+18+20+12)=11,
s2=110×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+0+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=61.
(2)由(1)知,z=11,
2s210=26.1=24.4,
故有z≥2s210,
所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
跟踪训练3 解 (1)因为在频率分布直方图中所有小矩形的面积之和为1,
所以(0.005+0.01+b+0.03+a+0.01)×10=1,所以a+b=0.045,
所以a+b=0.045,b+0.03=2a,解得a=0.025,b=0.02,
因为(0.005+0.01)×10=0.15,
(0.005+0.01+0.02)×10=0.35,
所以参加竞赛的学生成绩的第30百分位数在[60,70)内,设为x,
所以(0.005+0.01)×10+(x-60)×0.02=0.3,解得x=67.5.
(2)成绩在[80,90)和成绩在[90,100]内的学生人数之比为0.025∶0.01=5∶2,
所以x=5×84+2×985+2=88,s2=5×[6+(84-88)2]+2×[10+(98-88)2]5+2=3307.
试验序号i
1
2
3
4
5
6
7
8
9
10
伸缩率xi
545
533
551
522
575
544
541
568
596
548
伸缩率yi
536
527
543
530
560
533
522
550
576
536
相关学案 更多
- 1.电子资料成功下载后不支持退换,如发现资料有内容错误问题请联系客服,如若属实,我们会补偿您的损失
- 2.压缩包下载后请先用软件解压,再使用对应软件打开;软件版本较低时请及时更新
- 3.资料下载成功后可在60天以内免费重复下载
免费领取教师福利