直方图类别是包含频率分布或原始数据列表中的数据点的值范围。它们也称为间隔、箱或箱宽度。在直方图中(一种条形图),这些类被描述为垂直柱,其中柱的高度指示类范围中包含的数据点的数量。通常,选择直方图类别是为了增强数据统计或趋势的直观表示。
当有大量数据需要显示时,直方图特别有用用于描述其分布的形状。整个数据范围被分解为多个区间,并且计算落入每个区间的数据点的数量以给出类别频率。间隔的范围或宽度决定直方图类别的数量并影响图形的形状。
手放在臀部的女人如果间隔太宽,则可能会因类包含性太强而遗漏重要信息。当间隔宽度的选择太窄时,低类别频率可能会过分重视实际上是随机变化的内容。有多种方法可以为数据集设置适当数量的直方图类别。
根据 Sturgis 规则,类的数量应接近数据点数量的以 2 为底的对数加一。根据 Rice 规则,定义的类数量应为立方的两倍数据点数量的根。无论使用哪种方法选择直方图类别的数量,都应该尝试几种不同的宽度,以测试直方图形状对类别大小的敏感性。正确的类别数量是最准确描述的类别数量数据的分布。
随着对于一系列数据,适当数量的直方图类别,应该产生有意义的图形表示,以便能够进行清晰的解释。直方图应显示数据的中心和分布、任何偏度或数据不对称以及异常值或出现在预期值范围之外的数据点。模式或最常出现的值以及可能指示多种模态的分组应该是明显的。直方图分析还可能表明数据收集过程中的错误。
直方图长期用于金融和社会科学,在消费电子产品的图形显示中变得越来越熟悉。数码摄影对其使用特别开放,许多相机都采用颜色直方图来指示白平衡和曝光。数码摄影直方图还可能将像素显示为针对灰色阴影绘制的直方图类别。








