數(shù)據(jù)分組的主要目的是觀察數(shù)據(jù)的分布特征。數(shù)據(jù)分組的方法有單變量值分組和組距分組兩種。由于分組的目的之一是觀察數(shù)據(jù)分布的特征,因此組數(shù)的多少應(yīng)適中。

簡(jiǎn)介

數(shù)據(jù)分組是根據(jù)統(tǒng)計(jì)研究的需要,將原始數(shù)據(jù)按照某種標(biāo)準(zhǔn)化分成不同的組別,分組后的的數(shù)據(jù)稱為分組數(shù)據(jù)。數(shù)據(jù)分組的主要目的是觀察數(shù)據(jù)的分布特征。數(shù)據(jù)分組后再計(jì)算出各組中數(shù)據(jù)出現(xiàn)的的頻數(shù)

就形成了一張頻數(shù)分布表。

分組方法

數(shù)據(jù)分組的方法有單變量值分組和組距分組兩種。

單變量值分組

單變量值分組是把一個(gè)變量值作為一組,這種分組通常值適合離散變量,而且在變量值較少的情況使用。

組距分組

在連續(xù)變量或變量值較多的情況下,通常采用組距分組。它是將全部變量值依次劃分為若干區(qū)間,并將這一區(qū)間的變量值作為一組。在組距分組中,一個(gè)組的最小值稱為下限;一個(gè)組的最大值稱為上限。

分組原則

采用組距分組時(shí),需要遵循不重不漏的原則。不重是指一項(xiàng)數(shù)據(jù)只能分在其中的某一組,不能在其他組中重復(fù)出現(xiàn);不漏是指組別能夠窮盡,即在所分的全部組別中每一項(xiàng)數(shù)據(jù)都能分在其中的某一組,不能遺漏。

分組步驟

第1步:確定組數(shù)。一組數(shù)據(jù)分多少組合適呢?一般與 數(shù)據(jù)本身的特點(diǎn)及數(shù)據(jù)的多少有關(guān)。由于分組的目的之一是觀察數(shù)據(jù)分布的特征,因此組數(shù)的多少應(yīng)適中。如果組數(shù)太少,數(shù)據(jù)的分布就會(huì)過(guò)于集中,組數(shù)太多,數(shù)據(jù)分布就會(huì)過(guò)于分散,這都不便于觀察數(shù)據(jù)分布的特征和規(guī)律。組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。一般情況下,一組數(shù)據(jù)所分的組數(shù)應(yīng)不少于5組且不多于15組。實(shí)際應(yīng)用時(shí),可根據(jù)數(shù)據(jù)的多少和特點(diǎn)及分析要求來(lái)確定組數(shù)。

第2步:確定各組的組距。組距是一個(gè)組的上限與下限的差。組距可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來(lái)確定,及組距=(最大值—最小值)/組數(shù)。

第3步:根據(jù)分組整理成頻數(shù)分布表。