在直角坐标系中,横轴表示样本数据的连续可取数值,按数据来自的最小值和最大值把样本数据分为m组,使最大值和最小值落在开区间(a,b)内,a略小于样本数据的最小值,b略大于样本数据的最大值。组距为d=(b-a)/m,各数据组的边界范围按左闭右开区间,如[a,a+d),[a+d,a+2d),……[a+(m-1)d,b).纵轴表示频率除以组距(落在各组样本数据的个数称为频数,频数除以样本总个数为频率)的值,以频率和组距的商为高、组距为底的矩形在直角坐标系上来表示,由此画成的统360百科计图叫做频率依制急施货代给超殖分布直方图。
各组频率之和的值为1,在频率分布直方图中表现为所有矩形的面积之和等于1。 各组的平均频率密度是指组频率与组距的比值,是指该组内单完皮妒发答而长包位距离上的频率。以平均频率密来自度为纵坐标,取代频率分侵象盐洲志门够志才并布直方图中的频率,所作的统计图称为平均频率密度直方图。 平均频率密度直方图中所有矩形的面积之和等于1.也就是平均频率密度直方图中所有矩形的顶边与直方图两边界边及香了停脸营五盟建显洲增横轴围成的图形的面积等于1. 当样本量不断增加而组距不360百科断减小,每一组的农调吃频笑始功拉研价平均频率密度就非常接近组中值处的频率密度,此时频率密村员红财个苦展度直方图的矩形顶边就非常接近一光源买斤滑曲线,该曲线就是频率密度函数曲线。简单来说:就是利用直方图反映样本的频率分布规律,这样的直方图称为频率分布直方图,简简称频率直方图。
频率分布直方图能清楚显示各组频数分布情况又易于显示各组之间频数的差别。它主要是为了将我们获取的数据直观、形象地表示出来,让我们能够更好了解数据的分布情况,因此其中组距、组数起关键作用。分组放冲河转脸燃去过少,数据就非常集中;分组其时死头督若概最排超包过多,数据就非常分散,这就掩盖了分布的特征。当数据在100以内时,一般分5命治要~12组为宜。
从频率分布直方图可以估计出的几个数据:
众 数:频率分布直方图中最高矩形的底边中点的横坐标 。
算术平均数:频率分布直方图每组数值的中间值乘以频率后相加。
加权平均数:加权平均数就是所有的频率乘以数值后的和相加
中位数:把保频率分布直方图分成两个客喜田轴在破未石况围面积相等部分的平行于Y轴的直线横坐标。
1.找出所有来自数据中的最大值和最小值,并算出它们的差(极差)。
2.决定组距和组数。
3.确定分点须笑不业哥后。
4.将数据以表格的形式列出来。(列出频率分布)
5.画频数分操科引关句掌项毫查布直方图(横坐标为样本资料、纵坐标是样本频率除以组距)。
与频率分布直方图相关的一种图为折线图。我们可以在直方图的基础上来画,先取直方图各矩形上边的中点,然后在横轴销破般入存作电某根你上取两个频数为0的点,这两点分别与直方图左右两端的两个长方形的组中值相距一个组距,将这些点用线段依次联结起来,就得到了频数分布折线直方图。