初級(jí)統(tǒng)計(jì)師考《統(tǒng)計(jì)相關(guān)知識(shí)》:統(tǒng)計(jì)數(shù)據(jù)的預(yù)處理
相關(guān)鏈接:初級(jí)統(tǒng)計(jì)師《統(tǒng)計(jì)相關(guān)知識(shí)》第二章:統(tǒng)計(jì)資料收集方法
統(tǒng)計(jì)數(shù)據(jù)的整理
數(shù)據(jù)搜集來(lái)之后,要對(duì)其進(jìn)行加工整理,以使之系統(tǒng)化、條理化,符合統(tǒng)計(jì)分析的要求。數(shù)據(jù)整理通常包括數(shù)據(jù)的預(yù)處理、分組或分類、匯總等,其中,編制頻數(shù)分布是統(tǒng)計(jì)整理的重要內(nèi)容。
一、數(shù)據(jù)的預(yù)處理
數(shù)據(jù)的預(yù)處理是在分組或分類之前對(duì)數(shù)據(jù)所做的審核、篩選和排序等。
(一)數(shù)據(jù)的審核與篩選
來(lái)自不同渠道的統(tǒng)計(jì)數(shù)據(jù)和不同類型的統(tǒng)計(jì)數(shù)據(jù),在審核的內(nèi)容和方法上也有差別。對(duì)于由直接調(diào)查取得的原始數(shù)據(jù),要從完整性和準(zhǔn)確性兩方面去審核。完整性審核就是檢查應(yīng)調(diào)查的單位或個(gè)體有否遺漏,調(diào)查項(xiàng)目填寫是否齊全等。準(zhǔn)確性審核,一是看數(shù)據(jù)是否真實(shí),與實(shí)際有無(wú)出入;二是看數(shù)據(jù)的登錄、計(jì)算等是否有誤。邏輯檢查和計(jì)算檢查是審核數(shù)據(jù)準(zhǔn)確性的兩種方法。邏輯檢查就是從定性角度去看數(shù)據(jù)是否有悖邏輯,相互矛盾之嫌,故多用于審核名類數(shù)據(jù)和順序數(shù)據(jù)。比如,中學(xué)文化程度的人所填的職業(yè)是大學(xué)教師,這就不符合邏輯了。計(jì)算檢查是審核調(diào)查表中的各項(xiàng)數(shù)據(jù)在計(jì)算結(jié)果和計(jì)算方法上有無(wú)錯(cuò)誤,故多用于對(duì)區(qū)間數(shù)據(jù)和比數(shù)據(jù)的審核。例如,檢查各分項(xiàng)數(shù)字之和是否等于相應(yīng)的合計(jì)數(shù),各組頻數(shù)之和是否等于1或100%,出現(xiàn)在不同表格上的同一指標(biāo)數(shù)值是否相同等。
對(duì)于通過其他渠道取得的第二手?jǐn)?shù)據(jù),除了審核其完整性和準(zhǔn)確性之外,還應(yīng)審核其適用性和時(shí)效性。第二手?jǐn)?shù)據(jù)可以來(lái)自多種渠道,有些數(shù)據(jù)可能是為特定目的,通過專門調(diào)查而取得的,或者是已經(jīng)按特定目的的需要做了加工整理。對(duì)于這種數(shù)據(jù),使用者首先應(yīng)弄清數(shù)據(jù)的來(lái)源、口徑以及有關(guān)背景材料,不能盲目生搬硬套。而且,有些時(shí)效性較強(qiáng)的問題,若取得的數(shù)據(jù)過于滯后,就失去了研究的意義,一般來(lái)說(shuō),應(yīng)盡可能使用最新的統(tǒng)計(jì)數(shù)據(jù)。
對(duì)審核中發(fā)現(xiàn)的錯(cuò)誤應(yīng)盡可能予以糾正。如果對(duì)發(fā)現(xiàn)的錯(cuò)誤無(wú)法糾正,或者有些數(shù)據(jù)不符合調(diào)查的要求而又無(wú)法彌補(bǔ)時(shí),就要對(duì)數(shù)據(jù)進(jìn)行篩選。數(shù)據(jù)篩選有兩方面內(nèi)容:一是將某些不符合要求的數(shù)據(jù)或有明顯錯(cuò)誤的數(shù)據(jù)予以剔除;二是將符合某種特定條件的數(shù)據(jù)篩選出來(lái),不符合特定條件的數(shù)據(jù)予以剔除。
(二)數(shù)據(jù)的排序
數(shù)據(jù)排序就是按一定順序?qū)?shù)據(jù)排列,其目的是為了便于研究者通過瀏覽數(shù)據(jù)發(fā)現(xiàn)一些明顯的特征或趨勢(shì),找到解決問題的線索。排序還有助于對(duì)數(shù)據(jù)檢查、糾錯(cuò),為重新分組或歸類提供依據(jù)。在某些場(chǎng)合,排序本身就是分析的目的之一,例如,美國(guó)的《財(cái)富》雜志每年都要排出世界500強(qiáng)企業(yè),通過這一信息,經(jīng)營(yíng)者不僅能知道本企業(yè)所處的地位和差距,還可以了解到競(jìng)爭(zhēng)對(duì)手的狀況,從而有效地制定本企業(yè)的發(fā)展規(guī)劃和戰(zhàn)略目標(biāo)。
名類數(shù)據(jù),如果是字母型數(shù)據(jù),排序有升序與降序之分,升序更常見些,因?yàn)樯蚋帜傅淖匀慌帕邢嗤?如果是漢字型數(shù)據(jù),排列方式很多,比如按漢字的首位拼音字母排列,這與字母型數(shù)據(jù)的排序完全一樣,也可按筆畫順序,其中也有筆畫多少的升序與降序之分。交替運(yùn)用不同方式排序,在漢字型數(shù)據(jù)的檢查、糾錯(cuò)中十分有用。區(qū)間數(shù)據(jù)和比數(shù)據(jù)的排序只有兩種,即遞增和遞減。設(shè)一組數(shù)據(jù)為 ,遞增排序后可表示為: ;遞減排序后可表示為: 。排序后的數(shù)據(jù)亦稱為順序統(tǒng)計(jì)量(Order statistics)。無(wú)論是定性數(shù)據(jù)還是定量數(shù)據(jù),其排序均可借助計(jì)算機(jī)完成。
各省(區(qū)、市)統(tǒng)計(jì)專業(yè)技術(shù)資格考試辦公室聯(lián)系方式一覽表
2013初/中級(jí)統(tǒng)計(jì)師《統(tǒng)計(jì)相關(guān)知識(shí)》知識(shí)點(diǎn)匯總
2013年統(tǒng)計(jì)師考試招生簡(jiǎn)章
全國(guó)2012年統(tǒng)計(jì)師考試成績(jī)查詢匯總
2013年統(tǒng)計(jì)師考試報(bào)名時(shí)間預(yù)估 2012年統(tǒng)計(jì)師考試考后交流專區(qū)
最新資訊
- 2026初級(jí)統(tǒng)計(jì)師《統(tǒng)計(jì)業(yè)務(wù)知識(shí)》核心考點(diǎn)必背通關(guān)合集2026-03-09
- 2026統(tǒng)計(jì)師考試教材不變,歷年真題放心刷起來(lái)(附近5年真題解析)2026-03-08
- 考試時(shí)間提前!2026年統(tǒng)計(jì)師考試時(shí)間調(diào)整,需要改變備考思路2026-03-05
- 2026年統(tǒng)計(jì)師考試大綱預(yù)計(jì)不變,繼續(xù)沿用2021版大綱2026-01-22
- 2026年初級(jí)統(tǒng)計(jì)師備考資料:免費(fèi)下載—初級(jí)統(tǒng)計(jì)師歷年真題(2020-2025)2026-01-14
- 倒計(jì)時(shí)5天!2025年統(tǒng)計(jì)師考試考前必背考前幾頁(yè)紙!(初級(jí)+中級(jí))2025-10-14
- 僅剩9天!2025年統(tǒng)計(jì)師考試考前沖刺備考資料免費(fèi)下載(初級(jí)+中級(jí))2025-10-10
- 免費(fèi)下載!沖刺階段的復(fù)習(xí)寶典-2025年中級(jí)統(tǒng)計(jì)師考前幾頁(yè)紙(各科目匯總)2025-10-10
- 必背資料!2025年中級(jí)統(tǒng)計(jì)師考試-經(jīng)濟(jì)學(xué)基礎(chǔ)知識(shí)-考前10頁(yè)紙2025-10-10
- 沖刺寶典!2025年中級(jí)統(tǒng)計(jì)師考試-會(huì)計(jì)基礎(chǔ)知識(shí)-考前12頁(yè)紙2025-10-10

