一、 數值型數據的整理與顯示
品質數據的整理與圖示方法都適用于數值型數據的整理與顯示。但數值型數據還有一些特定的整理和圖示方法,并不適用于品質數據。
(一) 數據的分組
數據分組就是根據統計研究的需要,將數據按照某種標準劃分成不同的組別。分組后再計算出各組中出現的次數和頻數,形成一張頻數分布表。分組的方法單變量值分組和組距分組兩種。單變量值分組是把每一個變量值作為一組,這種分組方法通常只適用于離散變量且變量值較少的情況。在連續變量或變量值較多的情況下,通常采用組距分組。
組距分組是將全部變量值依次劃分為若干區間,并將這一區間的變量值作為一組。下面結果具體的例子說明分組的過程和頻數分布表的編制過程。
某高中一年級一共有55名學生,高一語文考試中成績分別為:
59 73 87 65 89 85 77 94 69 97
56 80 68 95 96 50 63 88 91 90
96 92 93 79 74 65 74 89 83 51
74 79 94 67 92 92 93 70 87 86
54 87 86 54 62 76 86 73 86 70
100 110 108 102 112
第一步:確定分組組數。確定分組組數的要求是:第一,劃分的組數,既不應太多也不應太少。組數過多,達不到通過分組壓縮資料的目的;組數太少,將造成原始資料的信息丟失過多;第二,組數的確定,要盡量保證組間資料的差異性與組內資料的同質性;第三,采用的分組辦法,要能夠充分顯示客觀現象本身存在的狀態。
統計分組:斯特基方法,其計算公式為 ,K為分組組數,N為數據個數。本例中, ,即應分7組
第二步,對原始資料進行排序。(略)
第三步,求極差,即將最大的觀察值與最小的觀察值相減便得到極差。本例中為112-50=62
第四步,確定各組組距。組距=極差(全距)/組數
本例中,組距=62/7≈8.9,組距可取10。
組距與組數成反比關系,組數越多,組距越小,組數越少,組距越大。
組距=某組的上限值-該組的下限值
第五步,確定組限。
確定組限應注意:
第一,第一組的下限值應比最小的觀察值小一點,最后一組的上限值應比最大的觀察值大一點;
第二,特別需要或不得已的情況除外,最好不要使用開口組;
第三,組限應取得美觀些,按數字編好,組限值應能被5除盡,且一般要用整數表示。
本例中,把第一組的下限值定為50,
第六步,確定各組觀察值出現的頻數。采用組距分組時,需要遵循“不重不漏”的原則。
為解決“不重”的問題,統計分組時習慣上規定“上組限不在內”,即當相鄰兩組的上下限重疊時,恰好等于某一組上限的觀察值不算在本組內,而計算在下一組內。
第七步,制作頻數分布表,并填上相關的內容,以及其他需要說明的事。
相關推薦:2009年全國經濟師考試報名時間匯總(更新中)在線課程 |
2024年
學考雙贏定制班 63%學員選擇 |
2024年
學考雙贏黑卡班 31%學員選擇 |
2024年
學考雙贏取證班 6%學員選擇 |
2024年
專項提分班 |
||
學 | 基礎學習 拿分階段 |
私教精講班 | ||||
強化學習 提分階段 |
重要考點提煉班 | |||||
練 | 沖刺密訓 搶分階段 |
8套名師密押卷 | ||||
背 | 考前終極 搶分階段 |
通關必備200題 | ||||
考前3小時密訓班 | ||||||
專項班 | 經濟基礎: 圖形/計算題專項 |
|||||
專業課: 案例專項專項 |
||||||
★★★ 三星題庫 ¥680/年 |
每日一練 |
|||||
每日錯題榜 |
||||||
章節刷題 |
||||||
★★★★ 四星題庫 ¥980/年 |
真題題庫 |
|||||
高頻常考 |
||||||
大數據易錯 |
||||||
★★★★★ 五星題庫 ¥1680/年 |
通關必備200題 |
|||||
名師密押8套卷 |
||||||
教學資料 | 課程講義 | |||||
全程學習計劃書 | ||||||
人工助學服務 | 微信一對一 班主任督學 7×13陪伴模式 |
|||||
老師微信 一對一答疑 |
||||||
定制服務 無憂從容包 |
無憂從容卡 ¥980 | |||||
專項突破班 ¥1360 | ||||||
黑卡特權 | 不過退費 | |||||
額外贈送 | 贈送2023年 【教材精講班】 |
贈送2023年 【教材精講班】 |
贈送2023年 【教材精講班】 |
|||
課程有效期 | 2024年11月30日 | 2025年11月30日 | 2024年11月30日 | 2024年11月30日 | ||
套餐價格 | 全科:¥4680 單科:¥2880 |
全科:¥9880 單科:¥5980 |
全科:¥1580 單科:¥880 |
全科:¥1080 單科:¥680 |