88教案网

用样本的频率分布估计总体的分布学案

俗话说,凡事预则立,不预则废。教师要准备好教案,这是每个教师都不可缺少的。教案可以让学生们能够更好的找到学习的乐趣,帮助教师更好的完成实现教学目标。所以你在写教案时要注意些什么呢?为了让您在使用时更加简单方便,下面是小编整理的“用样本的频率分布估计总体的分布学案”,希望对您的工作和生活有所帮助。

学案4用样本的频率分布估计总体的分布
【课标导航】
(1)通过实例体会分布的意义和作用.
(2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.
(3)通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.
重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图.
难点:能通过样本的频率分布估计总体的分布.
【知识导引】
在NBA的2011赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕
甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50
乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33
请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?
如何根据这些数据作出正确的判断呢?
【自学导拨】
1.频率分布表
当总体很大或不便获得时,可以用样本的频率分布估计总体的频率分布,我们把反映的表格称为频率分布表.
2.绘制频率分布直方图的一般步骤为:
(1)计算,即一组数据中最大值与最小值的差;
(2)决定;
○1组距与组数的确定没有确切的标准,将数据分组时组数应力求合适,以使数据的发布规律能较清楚地呈现出来.
○2组数与样本容量有关,一般样本容量越大,分的组数也越多,当样本容量为100时,常分8~12组.
○3组距的选择.组距=,组距的选择力求取整,如果极差不利于分组(不能被组数整除)可适当增大极差,如在左右两端各增加适当的范围(尽量使两端增加的量相同).
(3)决定;
(4)列;一般为四列:分组、个数累计、频数、频率最后一行是合计,其中频数合计应是,频率合计是
(5)绘制频率分布直方图.为将频率分布直方图中的结果直观形象的表示出来,画图时,应以横轴表示分组,纵轴表示,其相应组距上的频率等于该组上的长方形的面积,即每个,且各小长方形的面积的总和等于..
3.频率分布折线图
连接频率分布直方图中的中点,就得到频率分布折线图.
4.总体密度曲线
随着样本容量的增加,作图时所分的组数也在增加,组距减小,相应的图会越来越接近于一条,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比.
5.茎叶图
当样本数据时,用茎叶图表示数据效果较好,它不但可以便于记录,而且统计图上没有原始数据的损失,所有的数据都可以从茎叶图中得到.
画茎叶图的步骤:(1)将数据分为“茎”(高位)和“叶”(低位)两部分.
(2)将最小茎和最大茎之间的数按大小次序排成一列.
(3)将数据的“叶”按大小次序写在其茎右(左)侧.
6.几种表示频率分布的方法的优点与不足:
(1)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便.
(2)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式.但从直方图本身得不出原始的数据内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了.
(3)频率分布折线图的优点是它反映了数据的变化趋势,如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体分布的密度曲线.
(4)用茎叶图的优点是原有信息不会被抹掉,能够展示数据的分布情况,但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了.

【教材导学】
【例1】:从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高的样本,数据如下(单位:cm).试作出该样本的频率分布表.
168165171167170165170152175174
165170168169171166164155164158
170155166158155160160164156162
160170168164174171165179163172
180174173159163172167160164169
151168158168176155165165169162
177158175165169151163166163167
178165158170169159155163153155
167163164158168167161162167168
161165174156167166162161164166
【点拨】:确定组距与组数是解决“样本中的个体取不同值较多”这类问题的出发点.本题需根据绘制频率分布直方图的步骤完成.
【解析】:最大值=180,最小值=151,
极差=29,决定分为10组;
则需将全距调整为30,组距为3,既每个小区间的长度为3,组距=全距/组数.
可取区间[150.5,180.5]
分组频数频率
[150.5,153.5)40.04
[153.5,156.5)80.08
[156.5,159.5)80.08
[159.5,162.5)110.11
[162.5,165.5)220.22
[165.5,168.5)190.19
[168.5,171.5)140.14
[171.5,174.5)70.07
[174.5,177.5)40.04
[177.5,180.5)30.03
合计1001

频率分布直方图为:
【反思】:在列频率分布表时,先求极差再分组,注意分组不能太多也不能太少,往往把第1小组的起点稍微减小一点,同时要牢固掌握列频率分布表及绘制频率分布直方图是步骤与方法.
【变式练习一】:下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高
(单位cm)
(1)列出样本频率分布表﹔
(2)一画出频率分布直方图;
(3)估计身高小于134cm的人数占总人数的百分比..

【例2】:从全校参加科技知识竞赛的学生试卷中,抽取一个样本,考察竞赛的成绩分布.将样本分成5组,绘成频率分布直方图(如图),图中从左到右各小组的小长方形的高的比是1∶3∶6∶4∶2,最后边一组的频数是6.请结合频率分布直方图提供的信息,解答下列问题:
(1)样本的容量是多少?
(2)列出频率分布表;
(3)成绩落在哪个范围内的人数最多?并求该小组的频数、频率;
(4)估计这次竞赛中,成绩不低于60分的学生占总人数的百分比.
【点拨】:本题主要考察频率分布直方图的应用,考察识图、用图的能力,运用频率分布直方图的知识解答.
【解析】:(1)由于各组的组距相等,所以各组的频率与各小长方形的高成正比且各组频率的和等于1,那么各组的频率分别为116,316,616,416,216.设该样本容量为n,则6n=216,所以样本容量为n=48.
(2)由以上得频率分布表如下:
成绩频数频率
[50.5,60.5)3116

[60.5,70.5)9316

[70.5,80.5)18616

[80.5,90.5)12416

[90.5,100.5)6216

合计481
(3)成绩落在[70.5,80.5)之间的人数最多,该组的频数和频率分别是18和38.
(4)不低于60分的学生占总人数的百分比约为
1-116×100%≈94%.
【反思】:(1)频率分布直方图中,,所以各小长方形的面积表示相应各组的频率,各小长方形的面积的总和等于.
(2)样本容量=.
【变式练习二】:某校为了了解高一年级学生的体能情况,抽调了一部分学生进行一分钟跳绳测试,将测试成绩整理后作出如下统计图,甲同学计算出前两组的频率和是0.12,乙同学计算出跳绳次数不少于100次的同学占96%,丙同学计算出从左至右第二、三、四组的频数比为4:17:15,结合统计图回答下列问题:
(1)这次共抽调了多少人?
(2)若跳绳次数不少于130次为优秀,则这次测试成绩的优秀率是多少?

【例3】:某中学高一(1)班甲、乙两名同学自高中以来每场数学考试成绩如下:
甲的得分:95,81,75,91,86,89,71,65,76,88,94,110,107;
乙的得分:83,86,93,99,88,103,98,114,98,79,101.
画出两人数学成绩茎叶图,请根据茎叶图对两人的成绩进行比较.
【点拨】:用中间的数字表示两位同学得分的十位数和百位数,两边的数字分别表示两人每场数学考试成绩的个位数.
【解析】:甲、乙两人数学成绩的茎叶图如图所示:

甲乙
从这个茎叶图可以看出,乙同学的得分情况是大致对称的,中位数是99;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是89.因此乙同学发挥比较稳定,总体得分情况比甲同学好.
【反思】:茎叶图由“茎”和“叶”两部分构成,绘制茎叶图的关键是设计好树茎,通常是以该组数据的高位数值作为树茎,树茎一经确定,树叶就自然地长在相应的树茎上了.
【变式练习三】:
在某电脑杂志的一篇文章中,每个句子的字数如下:
10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.
在某报纸的一篇文章中,每个句子的字数如下:
27,39,33,24,28,19,32,41,33,27,36,23,36,41,27,13,22,23,18,46,32,22.
(1)将这两组数据用茎叶图表示.
(2)将这两组数据进行比较分析,得到什么结论?

【思悟小结】
(由学生完成)
【基础导测】
1.将一个容量为n的样本分成若干组,已知某组的频数和频率分别为40和0.125,则n的值为
(A)640(B)320(C)240(D)160
2.下面给出4个茎叶图
则数据6,23,12,13,27,35,37,38,51可以由图______表示
3.一个容量为32的样本,已知某组样本的频率为0.0625,则该组样本的频数为
A2B.4C.6D.8
4.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁~18岁的男生体重(kg),得到频率分布直方图,如图,据图可得这100名学生中体重在[56.5,64.5)kg的学生人数是()
(A)20(B)30(C)40(D)50
5.(2010福建文)将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2:3:4:6:4:1,且前三组数据的频数之和等于27,则n等于.

6.(2010江苏卷)某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示,则其抽样的100根中,有____根在棉花纤维的长度小于20mm.

7.(2010福州高一检测)甲、乙两个小组各10名学生的英语口语测试成绩如下(单位:分):
甲组:76908486818786828583
乙组:82848589798091897974
用茎叶图表示两个小组的成绩,并判断哪个小组的成绩更整齐一些.

8.观察下面表格:
(1)完成表中的频率分布表;
(2)根据表格,画出频率分布直方图;
(3)估计数据落在[10.95,11.35)范围内的概率约为多少?
分组频数频率
[10.75,10.85)3
[10.85,10.95)9
[10.95,11.05)13
[11.05,11.15)16
[11.15,11.25)26
[11.25,11.35)20
[11.35,11.45)7
[11.45,11.55)4
[11.55,11.65)2
合计100
【知能提升】
1.对于样本频率分布折线图与总体密度曲线的关系,下列说法正确的是()
A.频率分布折线图与总体密度曲线无关
B.频率分布折线图就是总体密度曲线
C.样本容量很大的频率分布折线图就是总体密度曲线
D如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于总体密度曲线
2.为了解一片经济林的生长情况,随机测量了其中100
株树木的底部周长(单位:cm).根据所得数据画
出样本的频率分布直方图(如右图),那么在这100
株树木中,底部周长小于110cm的株数是()
A.30B.60C.70D.80
3.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;……;第六组,成绩大于等于18秒且小于等于19秒.如图是按上述分组方法得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为()
(A)0.9,35(B)0.9,45
(C)0.1,35(D)0.1,45jaB88.cOM

4.某商场在国庆黄金周的促销活动中,对10月2日9时至14时的销售额进行统计,其频率分布直方图如图1所示,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为
A.6万元B.8万元
C.10万元D.12万元
5.甲、乙两个班级各随机选出15名同学进行测验,成绩的
茎叶图如图所示.则甲、乙两班的最高成绩分别是______,
______.从图中看______班的平均成绩较高.
6.(2010北京理)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a=.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为.
7.从高一学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下(单位:分):
[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)估计成绩在[60,90)分的学生比例;
(4)估计成绩在85分以下的学生比例.

8.50辆汽车经过某一段公路的时速记录如图所示:
将其分成7组.
(1)列出样本的频率分布表;
(2)画出频率分布直方图以及频率分布折线图;
(3)根据上述结果,估计汽车时速在哪组的几率最大?

9.在育民中学举行的电脑知识竞赛中,将高一两个班参赛的学生成绩(得分均为整数)进行整理后分成五组,绘制如图所示的频率分布直方图.已知图中从左到右的第一、第三、第四、第五小组的频率分别是0.30,0.15,0.10,0.05,第二小组的频数是40.
(1)求第二小组的频率,并补全这个频率分布直方图;
(2)求这两个班参赛的学生人数是多少?
(3)这两个班参赛学生的成绩的中位数应落在第几小组内?(不必说明理由)

【数学探究】
(2010湖北文)为了了解一个小水库中养殖的鱼有关情况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的质量(单位:千克),并将所得数据分组,画出频率分布直方图(如图所示)
(Ⅰ)求出各组相应的频率;
(Ⅱ)估计数据落在[1.15,1.30)中的百分比为多少;
(Ⅲ)将上面捕捞的100条鱼分别作一记号后再放回水库,几天后再从水库的多处不同位置捕捞出120条鱼,其中带有记号的鱼有6条,请根据这一情况来估计该水库中鱼的总条数.

相关推荐

高中数学必修三导学案:2.2.1用样本的频率分布估计总体分布(1)


古人云,工欲善其事,必先利其器。作为高中教师就要精心准备好合适的教案。教案可以让学生更好的吸收课堂上所讲的知识点,有效的提高课堂的教学效率。那么,你知道高中教案要怎么写呢?下面是小编精心为您整理的“高中数学必修三导学案:2.2.1用样本的频率分布估计总体分布(1)”,希望对您的工作和生活有所帮助。

2.2.1用样本的频率分布估计总体分布(1)
【学习目标】
1.了解频率分布的意义,了解什么是频率分布表,了解频率分布直方图的意义和折线图和密度曲线的意义;
2.掌握编制频率分布表的方法和作频率分布直方图的方法.并能准确应用频率分布直方图解决有关问题.
3.培养动手操作能力,体会统计思想的应用.

【新知自学】
阅读教材第65-69页内容,然后回答问题

知识回顾:
我们学习的随机抽样方法有哪些?它们分别适用于什么样的总体,如何具体实施?
新知梳理:
1、数据分析的基本方法
分析数据的一种基本方法是用将它们画出来,或者用紧凑的表格改变数据的排列方式.作图可以达到两个目的,一是从数据中信息,二是利用图形信息;表格则是通过改变数据的,为我们提供解释数据的新方式.
2、频率分布
样本中所有数据(或者数据组)的和的比,就是该数据的频率.所有数据(或者数据组)的频率的分布,可以用、
、频率分布折线图、茎叶图等来表示.
3、频率分布直方图
在频率分布直方图中,纵轴表示,数据落在各小组内的频率用表示,各小长方形的面积的总和等于.
探究:画频率分布直方图的步骤?
⑴求极差.即一组数据中最大值和最小值的差.
⑵决定组距与组数
①组距与组数的确定没有固定的标准,常常需要一个尝试与选择的过程.
②组距和样本容量有关,一般样本容本越大,分的组也越多.当样本容量不超过100时,按照数据的多少,常分为5~12组.
③极差、组距、组数之间有如下关系:
设组数,若则组数为;若则组数为大于的最小整数.
⑶将数据分组
按组距将数据分组,分组时,各组均为左闭右开区间,最后一组是闭区间.
⑷列频率分布表
一般分为四列:,最后频数合计应是样本容量,频率合计应是1.
⑸画频率分布直方图
画图时,应以横轴表示分组,纵轴表示各组频率与组距的比值,其相应组距上的频率应该等于该的面积,即每个矩形的面积=.

【感悟】频率分布直方图能够容易的表示大量数据,非常直观的表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式。但是,直方图本身得不出原始数据内容,也就是说把数据表示成直方图后,原有的具体数据信息就被抹掉了.
4、频率分布折线图与总体密度曲线
连接频率分布直方图中,各小长方形上端的中点,就得到频率分布折线图.随着的增加,作图时所分的也在增加,相应的频率分布折线图就会越来越接近于一条,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比.
对点练习:
1.在频率分布直方图中,小矩形的高表示().
A.频率/样本容量B.组距×频率
C.频率D.频率/组距
2.一个容量为20的样本,分组与频数为:
2个、(20,30]3个、
(30,40]4个、(40,50]5个、
(50,60]4个、(60,70]2个,则样本数据在区间(-∞,50]上的可能性为()
A.5%B.25%
C.50%D.70%
3.200辆汽车通过某一路段时时速频率分布直方图如图所示,则时速在[50,60]的汽车大约有_____辆.

【合作探究】
典例精析
例题1.调查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下:
171163163166166168168160168165
171169167169151168170168160174
165168174159167156157164169180
176157162161158164163163167161
(1)作出频率分布表;
(2)画出频率分布直方图.

变式训练1.为了解一片大约一万株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm).根据所得数据画出的样本频率分布直方图如图所示,那么在这片树木中,底部周长小于110cm的株数大约是()
A.3000B.6000
C.7000D.8000

例题2.下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm)
(1)列出样本频率分布表﹔
(2)一画出频率分布直方图;
(3)估计身高小于134cm的人数占总人数的百分.

变式训练2.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?
(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.

【课堂小结】

【当堂达标】
1.一个容量为35的样本数据,分组后,组距与频数如下:[5,10),5个;[10,15),12个;[15,20),7个;[20,25),5个;[25,30),4个;[30,35),2个.则样本在区间[20,+∞)上的频率为()
A.20%B.69%C.31%D.27%

2.对某种电子元件的使用寿命进行跟踪调查,所得样本的频率分布直方图如上图所示,由图可知,这一批电子元件中使用寿命在100~300h的电子元件的数量与使用寿命在300~600h的电子元件的数量的比是()
A.12B.13C.14D.16
3.某中学举办电脑知识竞赛,满分为100分,80分以上为优秀(含80分).现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成频率分布直方图(如图所示).已知图中从左到右的第一、三、四、五小组的频率分别为0.30、0.15、0.10、0.05,而第二小组的频数是40,则参赛的人数是____________,成绩优秀的频率是____________.

【课时作业】
1.容量为20的样本,分组后,组距与频数如下:(10,20],2;(20,30],3;(30,40],4;(40,50],5;(50,60],4;(60,70],2,则样本在(-∞,50]上的频率为()
A.B.C.D.

2.10个小球分别编有号码1,2,3,4,其中1号球4个,2号球2个,3号球3个,4号球1个,数0.4是指1号球占总体分布的()
A.频数B.频率
C.频率/组距D.累计频率

3.样本:12,7,11,12,11,12,10,10,9,8,13,12,10,9,6,11,8,9,8,10,那么频率为0.25的样本的范围是()
A.[5.5,7.5)B.[7.5,9.5)
C.[9.5,11.5)D.[11.5,13.5)
4.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg),得到频率分布直方图如下:
根据下图可得这100名学生中体重在〔56.5,64.5〕
的学生人数是()
A.20B.30C.40D.50

5.从高三学生中抽取50名同学参加知识竞赛,成绩分组及各组的频数如下:(单位:分)[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100),8.
(1)列出样本频率分布表(含累积频率);
(2)画出频率分布直方图;
(3)估计成绩在[60,90)内学生的频率.

6.如右下图是一个样本的频率分布直方图,且在[15,18)内频数为8.
(1)求样本容量;
(2)若[12,15)一组的小长方形面积为0.06,求[12,15)一组的频数;
(3)求样本在[18,33)内的频率.

高中数学必修三导学案2.2.1用样本的频率分布估计总体分布(2)


2.2.1用样本的频率分布估计总体分布(2)
【学习目标】
1.进一步熟悉用样本的频率分布估计总体分布的方法,明确其意义及优缺点.
2.了解茎叶图的意义,掌握制作茎叶图的方法.

【新知自学】
用频率分布直方图和折线图表示频率分布时,直方图能以面积的形式反映数据落在各小组的频率的大小;折线图能直观反映数据的变化趋势.但都不够精确,没有保留原始数据.
1.茎叶图的特点
当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以,
而且可以,给数据的和都带来了方便.
2.画茎叶图的步骤:
1)将每个数据分为茎(高位)和叶(低位)两部分.在课本第70页甲乙两运动员的得分记录的列表分布中,茎为十位上的数字,叶为个位上的数字.
2)将最小茎和最大茎之间的数按大小次序排成一列,写在左(右)侧;
3)将各个数据的叶按大小次序写在其经右(左)侧.
注:一般来说,当数据是两位数时,十位数字作茎,个位数字作叶;如果数据是由整数部分和小数部分组成的,可把整数部分作茎,小数部分作叶.其他情况可灵活划分.
【感悟】利用茎叶图刻画数据有何优点?作茎叶图时应该注意什么?
答:用茎叶图刻画数据有两个优点:一是它所有的信息都可以从茎叶图中找到;二是茎叶图便于记录和表示,能够展示数据的分布情况.但当数据较多或数据位数较多时,茎叶图就显得不太方便了.茎叶图可以分析单组数据,也能对两组数据进行比较,画出两组数据的茎叶图,可将茎放在中间共用,叶分列左、右两侧,左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的得分要重复记录,不能遗漏.
对点练习.
1.茎叶图刻画数据有两个优点:一是_____________________,二是________________.
2.下列关于茎叶图的叙述正确的是()
(A)茎叶图可以展示未分组的原始数据,它与频率分布表以及频率分布直方图的处理方式不同
(B)对于重复的数据,只算一个
(C)茎叶图中的叶是“茎”十进制的上一级
(D)制作茎叶图的程序:第一步画出茎;第二步画出叶;第三步将“叶子”任意排列
3.在某五场篮球比赛中,甲、乙两名运动员得分的茎叶图如下.下列说法正确的是()
(A)在这五场比赛中,甲的平均得分比乙好,且甲比乙稳定
(B)在这五场比赛中,甲的平均得分比乙好,但乙比甲稳定
(C)在这五场比赛中,乙的平均得分比甲好,且乙比甲稳定
(D)在这五场比赛中,乙的平均得分比甲好,但甲比乙稳定
4.2007年在广州举行的全国少数民族运动会上,七位评委为某民族舞蹈打出的分数的
茎叶图(如图),去掉一个最高分和一个最低分后,所剩数据的平均数为().
(A)84(B)82
(C)(D)86

【合作探究】
典例精析
例题1.篮球运动员在2005赛季各场比赛的得分情况如下:12,15,24,25,31,31,36,36,37,39,44,49,50.制作茎叶图,并分析这个运动员的整体水平及发挥的稳定程度.

变式训练1.甲、乙两篮球运动员上赛季每场比赛的得分如下,试比较这两位运动员的得分水平
甲:12,15,24,25,31,31,36,36,37,39,44,49,50
乙:8,13,14,16,23,26,28,33,38,39,51

例题2:某中学甲、乙两名同学最近几次的数学考试成绩情况如下:
甲的得分:95,81,75,89,71,65,76,88,94,110,107;
乙的得分:83,86,93,99,88,103,98,114,98,79,101.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.

变式训练2.2012年的NBA全明星赛于美国当地时间2012年2月26日在佛罗里达州奥兰多市举行.如图是参加此次比赛的甲、乙两名篮球运动员以往几场比赛得分的茎叶图,则甲、乙两人这几场比赛得分的中位数之和是________.

【课堂小结】

【当堂达标】
1.某校开展“爱我平邑、爱我家乡”摄影比赛,9位评委为参赛作品A给出的分数如茎叶图所示。记分员在去掉一个最高分和一个最低分后,算的平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清。若记分员计算无误,则数字应该是___________

2.某篮球学校的甲、乙两名运动员练习罚球,每人练习10组,每组罚球40个.命中个数的茎叶图如下.则罚球命中率较高的是.

【课时作业】
1.右边茎叶图中所记录的原始数据共有个.

2.抽取高二某班其中20名同学,记录各位同学一分钟脉搏次数,其茎叶图如下,左端的数字表示脉搏次数的十位数,则这些同学一分钟脉搏次数的平均数、众数、中位数分别是、、.

586
64017
722368256
814620
90

3.甲、乙两个班各随机选出15名同学进行测验,成绩的茎叶图如图.
则甲、乙两个班的最高成绩各是_______________,从图中看,________班的平均成绩最高.
4.有两个班级,每班各自按学号随机选出10名学生,测验铅球成绩,以考查体育达标程度,测验成绩如下:单位(米)
两个班相比较,哪个班整体实力强一些?
序号12345
甲9.17.98.46.95.2
乙8.88.57.37.16.7
序号678910
甲7.28.08.16.74.9
乙8.49.88.76.85.9

5.名著《飘》的中英文版本中,第一节的部分内容的每句句子中所含单词(字)数
如下:
英文句子所含单词数:10,52,56,40,79,9,23,11,10,21,30,31;
中文句子所含字数:11,79,7,20,63,33,45,36,87,9,11,37,17,18,71,75.
(1)作出这些数据的茎叶图;
(2)比较茎叶图,你能得到什么结论.

6.下面一组数据是某生产车间30名工人某日加工零件的个数,请设计适当的茎叶图表示这组数据,并由图说明以下这个车间次日的生产情况.
134112117126128124122
116113107116132127128
126121120118108110133
130124116117123122120
112112

7.有一种鱼的身体吸收汞,汞的含量超过体重的1.00ppm(即百万分之一)时就会对人体产程危害.在30条鱼的样本中发现的汞含量是
0.070.240.950.981.020.98
1.371.400.391.021.441.58
0.541.080.610.721.201.14
1.621.681.851.200.810.82
0.841.291.262.100.911.31
(1)用前两位数作为茎,画出样本数据的茎叶图;
(2)描述一下汞含量的分布特点;
(3)从实际情况看,许多鱼的汞含量超标在于有些鱼在出售之前没有被检查过.每批这种鱼的汞含量都比1.00ppm大吗?

第2节第1课时用样本的频率分布估计总体分布教学案


第1课时用样本的频率分布估计总体分布
[核心必知]
1.预习教材,问题导入
根据以下提纲,预习教材P65~P70,回答下列问题.
(1)画频率分布直方图的步骤有哪些?
提示:求极差→决定组距与组数→决定组距与组数→将数据分组→列频率分布表→画频率分布直方图.
(2)频率分布直方图的纵轴表示什么?各矩形面积之和等于什么?
提示:频率分布直方图的纵轴表示频率/组距,各小长方形面积之和为1.
(3)频率分布折线图和总体密度曲线各指什么?
提示:连接频率分布直方图中各小长方形上端的中点就得到频率分布折线图;当频率分布直方图中组数增加,组距减小,相应的频率分布折线图会越来越接近于一条光滑的曲线,称之为总体密度曲线.
2.归纳总结,核心必记
(1)用样本估计总体、数据分析的基本方法
①用样本估计总体的两种情况
(ⅰ)用样本的频率分布估计总体分布.
(ⅱ)用样本的数字特征估计总体的数字特征.
②数据分析的基本方法
(ⅰ)借助于图形
分析数据的一种基本方法是用图将它们画出来,此方法可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.
(ⅱ)借助于表格
分析数据的另一种方法是用紧凑的表格改变数据的排列方式,此方法是通过改变数据的构成形式,为我们提供解释数据的新方式.
(2)绘制频率分布直方图的步骤
(3)频率分布折线图和总体密度曲线
(4)茎叶图
①茎叶图的制作方法(以两位数据为例):
将所有两位数的十位数字作为茎,个位数字作为叶,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出.
②茎叶图的优缺点
在样本数据较少时,用茎叶图表示数据的效果较好.它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便.但是当样本数据较多时,茎叶图就显得不太方便,因为每一个数据都要在图中占据一个空间,如果数据很多,茎叶就会很长.
[问题思考]
(1)频率分布直方图直观形象地表示了频率分布表,在频率分布直方图中是用哪些量来表示各组频率的?
提示:在频率分布直方图中用每个矩形的面积表示相应组的频率,即频率组距×组距=频率,各组频率的和等于1,因此各小矩形的面积的和等于1.
(2)茎叶图中对“叶”和“茎”有什么要求?
提示:茎叶图中,“叶”是数据的最后一个数字,其前面的数字作为“茎”.
[课前反思]
通过以上预习,必须掌握的几个知识点:
(1)绘制频率分布直方图的步骤:;
(2)频率分布折线图和总体密度曲线的制作方法:;
(3)茎叶图的制作方法:.
[思考]频率分布表、频率分布直方图各有什么优缺点?
名师指津:(1)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便.
(2)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式.但是从直方图本身得不出原始数据内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了.
?讲一讲
1.美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:
57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48
将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.
[尝试解答]以4为组距,列表如下:
频率分布直方图如图(1)所示,频率分布折线图如图(2)所示.
(1)频率分布表中极差、组距、组数的关系
①若极差组距为整数,则极差组距=组数;
②若极差组距不为整数,则极差组距的整数部分+1=组数.
(2)确定频率分布直方图中组距和组数的注意点
组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,纵使数据的分布规律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为5~12组,一般样本容量越大,所分组数越多.
?练一练
1.有一容量为50的样本,数据的分组及各组的数据如下:[10,15),4;[15,20),5;[20,25),10;[25,30),11;[30,35),9;[35,40),8;[40,45],3.
(1)列出样本频率分布表;
(2)画出频率分布直方图及折线图.
解:(1)由所给的数据,不难得出以下样本的频率分布表:
数据段[10,15)[15,20)[20,25)[25,30)
频数451011
频率0.080.100.200.22
数据段[30,35)[35,40)[40,45]总计
频数98350
频率0.180.160.061
(2)频率分布直方图如图(1)所示,频率分布折线图如图(2)所示.
观察下面茎叶图,它的中间部分像一棵树的茎,两边部分像这棵树的茎上长出来的叶子.
[思考]怎样理解认识茎叶图?
名师指津:茎叶图也是用来表示数据的一种图,它的思路是将数组中的数按位数进行比较,将高位数字作为一个主干(茎),将低位数字作为分枝(叶),列在主干的一侧,这样就可以清楚地看到每个主干后面有几个数,每个数具体是多少.
?讲一讲
2.某赛季甲、乙两名篮球运动员每场比赛得分情况如下:
甲的得分:12,15,24,25,31,31,36,36,37,39,44,49,50;
乙的得分:8,13,14,16,23,26,28,33,38,39,51.
(1)画出甲、乙两名运动员得分数据的茎叶图;
(2)根据茎叶图分析甲、乙两运动员的水平.
[尝试解答](1)作出茎叶图如图所示:
(2)由(1)中的茎叶图可以看出,甲运动员的得分情况是大致对称的,中位数是36;乙运动员的得分情况除一个特殊得分外,也大致对称,中位数是26.因此甲运动员的发挥比较稳定,总体得分情况比乙运动员好.
画茎叶图的步骤
第一步,将数据分为“茎”(高位)和“叶”(低位)两部分;第二步,将表示“茎”的数字按大小顺序由上到下排成一列;第三步,将各个数据的“叶”按次序写在其茎的左、右两侧.
?练一练
2.甲、乙两名同学最近几次的数学考试成绩情况如下:
甲的得分:95,81,75,89,71,65,76,88,94,110,107;
乙的得分:83,86,93,99,88,103,98,114,98,79,101.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.
解:甲、乙两人数学成绩的茎叶图如图所示.
从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98分;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是88分,但分数分布相对于乙来说,趋向于低分阶段.因此乙同学发挥比较稳定,总体得分情况比甲同学好.
?讲一讲
3.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.
(1)求直方图中x的值;
(2)在这些用户中,求用电量落在区间[100,250)内的户数.
[思路点拨](1)根据各小长方形的面积和为1求解.
(2)先求数据落在[100,250)内的频率,再由频率公式求值.
[尝试解答](1)由频率分布直方图知[200,250)小组的频率为1-(0.0024+0.0036+0.0060+0.0024+0.0012)×50=0.22,于是x=0.2250=0.0044.
(2)∵数据落在[100,250)内的频率为
(0.0036+0.0060+0.0044)×50=0.7,
∴所求户数为0.7×100=70.
频率分布直方图的性质
(1)每个小矩形的面积表示样本数据落在该组内的频率.
(2)所有小矩形的面积和等于1.
(3)利用一组的频数和频率,可以求样本容量.
提醒:频率分布直方图中的纵轴不是频率,而是频率/组距.
?练一练
3.为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?
解:(1)频率分布直方图是以面积的形式反映了数据落在各小组内的频率大小的,因此第二小组的频率为42+4+17+15+9+3=0.08.
又因为第二小组的频率=第二小组的频数样本容量,
所以样本容量=第二小组的频数第二小组的频率=120.08=150.
(2)由直方图可估计该校高一年级学生的达标率为
17+15+9+32+4+17+15+9+3×100%=88%.
——————————————[课堂归纳感悟提升]———————————————
1.本节课的重点是会列频率分布表,会画频率分布直方图、频率分布折线图、茎叶图,难点是理解用样本的频率分布估计总体分布的方法.
2.本节课要重点掌握的规律方法
(1)绘制频率分布直方图的步骤,见讲1.
(2)绘制茎叶图的步骤及其意义,见讲2.
(3)会应用频率分布直方图的意义解决问题,见讲3.
3.本节课的易错点
将频率分布直方图中的纵轴的单位看错而致错是本节课的主要易错点,如讲3.
课下能力提升(十二)
[学业水平达标练]
题组1列频率分布表、画频率分布直方图
1.用样本频率分布估计总体频率分布的过程中,下列说法正确的是()
A.总体容量越大,估计越精确
B.总体容量越小,估计越精确
C.样本容量越大,估计越精确
D.样本容量越小,估计越精确
解析:选C由用样本估计总体的性质可得.
2.在画频率分布直方图时,某组的频数为10,样本容量为50,总体容量为600,则该组的频率是()
A.15B.16
C.110D.不确定
解析:选A该组的频率为1050=15,故选A.
3.调查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下:
171163163166166168168160168165
171169167169151168170168160174
165168174159167156157164169180
176157162161158164163163167161
(1)作出频率分布表;
(2)画出频率分布直方图.
解:(1)最低身高151cm,最高身高180cm,它们的差是180-151=29,即极差为29;确定组距为4,组数为8,列表如下:
分组频数频率
[149.5,153.5)10.025
[153.5,157.5)30.075
[157.5,161.5)60.15
[161.5,165.5)90.225
[165.5,169.5)140.35
[169.5,173.5)30.075
[173.5,177.5)30.075
[177.5,181.5]10.025
合计401
(2)频率分布直方图如图所示.
题组2茎叶图及应用
4.如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为()
A.0.2B.0.4C.0.5D.0.6
解析:选B∵数据总个数n=10,又落在区间[22,30)内的数据个数为4,∴所求的频率为410=0.4.故选B.
5.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是()
A.46,45,56B.46,45,53
C.47,45,56D.45,47,53
解析:选A直接列举求解.由题意知各数为12,15,20,22,23,23,31,32,34,34,38,39,45,45,45,47,47,48,48,49,50,50,51,51,54,57,59,61,67,68,中位数是46,众数是45,最大数为68,最小数为12,极差为68-12=56.
题组3频率分布直方图的应用
6.(2016金华高一检测)如图所示是一容量为100的样本的频率分布直方图,则由图形中的数据,样本落在[15,20)内的频数为()
A.20B.30C.40D.50
解析:选B样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.
7.某车站在春运期间为了了解旅客购票情况,随机抽样调查了100名旅客从开始在售票窗口排队到购到车票所用的时间t(以下简称为购票用时,单位为min),下面是这次调查统计分析得到的频率分布表和频率分布直方图(如图所示).
分组频数频率
一组0≤t500
二组5≤t10100.10
三组10≤t1510②
四组15≤t20①0.50
五组20≤t≤25300.30
合计1001.00
解答下列问题:
(1)这次抽样的样本容量是多少?
(2)在表中填写出缺失的数据并补全频率分布直方图;
(3)旅客购票用时的平均数可能落在哪一组?
解:(1)样本容量是100.
(2)①50②0.10
所补频率分布直方图如图中的阴影部分.
(3)设旅客平均购票用时为tmin,则有
0×0+5×10+10×10+15×50+20×30100≤t
5×0+10×10+15×10+20×50+25×30100,
即15≤t20.所以旅客购票用时的平均数可能落在第四组.
[能力提升综合练]
1.将容量为100的样本数据,按由小到大排列分成8个小组,如下表所示:
组号12345678
频数101314141513129
第3组的频率和累积频率为()
A.0.14和0.37B.114和127
C.0.03和0.06D.314和637
解析:选A由表可知,第三小组的频率为14100=0.14,累积频率为10+13+14100=0.37.
2.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是()
AB
CD
解析:选A由分组可知C,D两项一定不对;由茎叶图可知[0,5)有1人,[5,10)有1人,∴第一、二小组频率相同,频率分布直方图中矩形的高应相同,可排除B.故选A.
3.为了解电视对生活的影响,一个社会调查机构就平均每天看电视的时间对某地10000名居民进行了调查,并根据所得数据画出了样本的频率分布直方图(如图),为了分析该地居民平均每天看电视的时间与年龄、学历、职业等方面的关系,要从10000人中再用分层抽样的方法抽出100人做进一步调查,则在[2.5,3)(小时)时间段内应抽出的人数是()
A.25B.30C.50D.75
解析:选A抽出的100人中平均每天看电视的时间在[2.5,3)(小时)时间段内的频率是0.5×0.5=0.25,所以这10000人中平均每天看电视时间在[2.5,3)(小时)时间段内的人数为10000×0.25=2500,又抽样比为10010000=1100,故在[2.5,3)(小时)时间段内应抽出人数为2500×1100=25.
4.某工厂对一批产品进行了抽样检测.如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是()
A.90B.75C.60D.45
解析:选A∵样本中产品净重小于100克的频率为(0.050+0.100)×2=0.3,频数为36,∴样本总数为360.3=120.∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90.
5.为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校200名教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示如图:
据此可估计该校上学期200名教师中,使用多媒体进行教学次数在[15,25)内的人数为________.
解析:在抽取的20名教师中,在[15,25)内的人数为6,据此可估计该校上学期200名教师中,使用多媒体进行教学的次数在[15,25)内的人数为60.
答案:60
6.在我市2016年“创建文明城市”知识竞赛中,考评组从中抽取200份试卷进行分析,其分数的频率分布直方图如图所示,则分数在区间[60,70)上的人数大约有________.
解析:根据频率分布直方图,分数在区间[60,70)上的频率为0.04×10=0.4,∴分数在区间[60,70)上的人数为200×0.4=80.
答案:80
7.在某电脑杂志的一篇文章中,每个句子的字数如下:
10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17
在某报纸的一篇文章中,每个句子的字数如下:
27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22
(1)将这两组数据用茎叶图表示;
(2)将这两组数据进行比较分析,你会得到什么结论?
解:(1)
(2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为科普读物更加通俗易懂、简单明了.
8.某市2016年4月1日-4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):
61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,
45.
(1)完成频率分布表;
(2)作出频率分布直方图;
(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.
请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.
解:(1)频率分布表:
分组频数频率
[41,51)2230

[51,61)1130

[61,71)4430

[71,81)6630

[81,91)101030

[91,101)5530

[101,111]2230

(2)频率分布直方图如图所示.
(3)答对下述两条中的一条即可:
①该市一个月中空气污染指数有2天处于优的水平,占当月天数的115;有26天处于良的水平,占当月天数的1315;处于优或良的天数为28,占当月天数的1415.说明该市空气质量基本良好.
②轻微污染有2天,占当月天数的115;污染指数在80以上的接近轻微污染的天数15,加上处于轻微污染的天数2,占当月天数的1730,超过50%.说明该市空气质量有待进一步改善.

2.2.2用样本的数字特征估计总体的数字特征


2.2.2用样本的数字特征估计总体的数字特征
教学目标:
知识与技能
(1)正确理解样本数据标准差的意义和作用,学会计算数据的标准差。
(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释。
(3)会用样本的基本数字特征估计总体的基本数字特征。
(4)形成对数据处理过程进行初步评价的意识。
过程与方法
在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法。
情感态度与价值观
会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系。
重点与难点
重点:用样本平均数和标准差估计总体的平均数与标准差。
难点:能应用相关知识解决简单的实际问题。
教学设想
【创设情境】
在一次射击比赛中甲、乙两名运动员各射击次,命中环数如下﹕
甲运动员﹕,,,,,,,,,;
乙运动员﹕,,,,,,,,,
观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。——用样本的数字特征估计总体的数字特征(板出课题)。
【探究新知】
一、众数、中位数、平均数
〖探究〗:P62
(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?
(2)能否用一个数值来描写样本数据的离散程度?(让学生回忆初中所学的一些统计知识,思考后展开讨论)
初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息。例如前面一节在调查位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是(最高的矩形的中点)(图略见课本第页)它告诉我们,该市的月均用水量为的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少。
〖提问〗:请大家翻回到课本第页看看原来抽样的数据,有没有这个数值呢?根据众数的定义,怎么会是众数呢?为什么?(请大家思考作答)
分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而是由样本数据的频率分布直方图得来的,所以存在一些偏差。
〖提问〗:那么如何从频率分布直方图中估计中位数呢?
分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数。因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等。由此可以估计出中位数的值为。(图略见课本63页图)
〖思考〗:这个中位数的估计值,与样本的中位数值不一样,你能解释其中的原因吗?(原因同上:样本数据的频率分布直方图把原始的一些数据给遗失了)
(课本63页图)显示,大部分居民的月均用水量在中部(左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的。
〖思考〗:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例)
二、标准差、方差
1.标准差
平均数为我们提供了样本数据的重要信息,可是,有时平均数也会使我们作出对总体的片面判断。某地区的统计显示,该地区的中学生的平均身高为176㎝,给我们的印象是该地区的中学生生长发育好,身高较高。但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质。因此,只有平均数难以概括样本数据的实际状态。
例如,在一次射击选拔比赛中甲、乙两名运动员各射击次,命中环数如下﹕
甲运动员﹕,,,,,,,,,;
乙运动员﹕,,,,,,,,,
观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?如果你是教练,选哪位选手去参加正式比赛?
我们知道,。
两个人射击的平均成绩是一样的。那么,是否两个人就没有水平差距呢?(观察P66图2.2-8)直观上看,还是有差异的。很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据。
考察样本数据的分散程度的大小,最常用的统计量是标准差。标准差是样本数据到平均数的一种平均距离,一般用s表示。
样本数据的标准差的算法:
(1)、算出样本数据的平均数。
(2)、算出每个样本数据与样本数据平均数的差:
(3)、算出(2)中的平方。
(4)、算出(3)中n个平方数的平均数,即为样本方差。
(5)、算出(4)中平均数的算术平方根,,即为样本标准差。
其计算公式为:

显然,标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小。
〖提问〗:标准差的取值范围是什么?标准差为0的样本数据有什么特点?
从标准差的定义和计算公式都可以得出:。当时,意味着所有的样本数据都等于样本平均数。
(在课堂上,如果条件允许的话,可以给学生简单的介绍一下利用计算机来计算标准差的方法。)
2.方差
从数学的角度考虑,人们有时用标准差的平方(即方差)来代替标准差,作为测量样本数据分散程度的工具:

在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差。
【例题精析】
〖例1〗:画出下列四组样本数据的直方图,说明他们的异同点。
(1)5,5,5,5,5,5,5,5,5
(2)4,4,4,5,5,5,6,6,6
(3)3,3,4,4,5,6,6,7,7
(4)2,2,2,2,5,8,8,8,8
分析:先画出数据的直方图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差。
解:(图略,可查阅课本P68)
四组数据的平均数都是5.0,标准差分别为:0.00,0.82,1.49,2.83。
他们有相同的平均数,但他们有不同的标准差,说明数据的分散程度是不一样的。
〖例2〗:(见课本P69)
分析:比较两个人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本数据的平均数、标准差,以此作为两个总体之间的差异的估计值。
【课堂精练】
P71练习1.2.34
【课堂小结】
1.用样本的数字特征估计总体的数字特征分两类:
a)用样本平均数估计总体平均数。
b)用样本标准差估计总体标准差。样本容量越大,估计就越精确。
2.平均数对数据有“取齐”的作用,代表一组数据的平均水平。
3.标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度。
【评价设计】
1.P72习题A组3、4、10

文章来源:http://m.jab88.com/j/44845.html

更多

最新更新

更多