| SPSS由IBM公司出品,它提供了包括描述性統(tǒng)計(jì)、推斷性統(tǒng)計(jì)、因子分析、聚類分析、回歸分析等多種統(tǒng)計(jì)分析功能,并包括文本分析、機(jī)器學(xué)習(xí)算法、數(shù)據(jù)分析模型等。SPSS的界面友好,易于操作,能夠快速?gòu)臄?shù)據(jù)中提取有用的洞察和分析,廣泛應(yīng)用于教育、心理、醫(yī)學(xué)、市場(chǎng)、人口、保險(xiǎn)等多個(gè)研究領(lǐng)域,也用于產(chǎn)品質(zhì)量控制、人事檔案管理和日常統(tǒng)計(jì)報(bào)表等。 面對(duì)龐大的數(shù)據(jù)庫(kù),如何才能進(jìn)行更加精準(zhǔn)的分析?除了對(duì)整體數(shù)據(jù)進(jìn)行分析外,我們還可以使用IBM SPSS Statistics的選擇個(gè)案分析方法,指定數(shù)據(jù)的分析范圍,比如以條件篩選的方式選擇個(gè)案,以獲得更精準(zhǔn)的數(shù)據(jù)分析結(jié)果。
接下來(lái),本文將分為兩節(jié),詳細(xì)介紹IBM SPSS Statistics的選擇個(gè)案分析方法。事不宜遲,一起來(lái)學(xué)習(xí)下吧。
一、打開(kāi)數(shù)據(jù)文件
首先,打開(kāi)一組包含定性與定量變量的數(shù)據(jù),其中包含了賬號(hào)、性別、地區(qū)三個(gè)定性變量,以及客單價(jià)、點(diǎn)擊頁(yè)面數(shù)兩個(gè)定量變量,因后續(xù)需演示個(gè)案的條件篩選功能。

圖1:打開(kāi)數(shù)據(jù)文件
二、使用選擇個(gè)案功能
接著,在IBM SPSS Statistics的數(shù)據(jù)菜單中,選擇“選擇個(gè)案”選項(xiàng)。

圖2:選擇個(gè)案功能
在打開(kāi)的“選擇個(gè)案”功能面板中,可使用選擇所有個(gè)案、條件滿足個(gè)案、隨機(jī)個(gè)案等選項(xiàng)。其中所有個(gè)案,即不作任何篩選的選項(xiàng),后續(xù)使用過(guò)濾輸出時(shí),可通過(guò)“所有個(gè)案”選項(xiàng)恢復(fù)已過(guò)濾的數(shù)據(jù)。

圖3:選擇個(gè)案設(shè)置面板
在輸出方式的設(shè)置上,如果后續(xù)數(shù)據(jù)集還需要進(jìn)行其他的分析操作,建議選擇“將選定個(gè)案復(fù)制到新數(shù)據(jù)集”的方式。
過(guò)濾選項(xiàng)是將被篩選掉的個(gè)案暫時(shí)鎖定,可在輸出數(shù)據(jù)集中看到這些個(gè)案被劃一斜線,而且數(shù)據(jù)集的末端會(huì)生成一個(gè)新的過(guò)濾變量(filter_$),保留的個(gè)案標(biāo)記為1,鎖定的個(gè)案標(biāo)記為0。
由于個(gè)案只是暫時(shí)鎖定的狀態(tài),如需恢復(fù)數(shù)據(jù),只需選擇“所有個(gè)案”,即可恢復(fù)。
接下來(lái),我們使用實(shí)例逐一講解不同的個(gè)案選項(xiàng)。

圖4:輸出選項(xiàng)
三、實(shí)例演示條件篩選
條件篩選選項(xiàng),即通過(guò)函數(shù)、復(fù)雜方程式等設(shè)置條件,篩選個(gè)案范圍的選項(xiàng)。如圖5所示,單擊“如果”按鈕。

圖5:選擇如果條件滿足選項(xiàng)
接著,在彈出的“if”函數(shù)面板中設(shè)置篩選條件。如圖6所示,以篩選“點(diǎn)擊頁(yè)面數(shù)為1”的個(gè)案為例,需先將“點(diǎn)擊頁(yè)面數(shù)”添加到編輯框中,然后再分別單擊“=”、“1”,完成“點(diǎn)擊頁(yè)面數(shù)=1”函數(shù)的編輯。

圖6:設(shè)定if條件
接著,在輸出的數(shù)據(jù)集中,就可以獲得僅包含“點(diǎn)擊頁(yè)面數(shù)為1”的個(gè)案。
圖7:完成條件篩選
四、實(shí)例演示隨機(jī)個(gè)案樣本
在進(jìn)行數(shù)據(jù)研究時(shí),經(jīng)常需要獲取數(shù)據(jù)的自然分布規(guī)律,比如地區(qū)的年齡分布、性別分布等。在分析自然分布規(guī)律時(shí),需剔除各種人為因素,盡可能地做到隨機(jī)性。
如需獲取變量值的隨機(jī)分布數(shù)據(jù)的話,隨機(jī)個(gè)案樣本就能很好地確保隨機(jī)性。如圖8所示,單擊“樣本”開(kāi)啟設(shè)置面板。

圖8:隨機(jī)個(gè)案樣本
如圖9所示,隨機(jī)個(gè)案樣本的百分比選項(xiàng)的隨機(jī)性會(huì)更好,但如果是要獲取早期錄入數(shù)據(jù)的隨機(jī)樣本,可以選取第二種隨機(jī)方式,即抽取N個(gè)個(gè)案,來(lái)自前N1個(gè)個(gè)案。
我們以抽取10%的所有個(gè)案為例,隨機(jī)抽取個(gè)案。

圖9:設(shè)置隨機(jī)抽樣方式
如圖10所示,可以看到,輸出的數(shù)據(jù)集中僅包含了12個(gè)個(gè)案,且個(gè)案的序號(hào)都是隨機(jī)的。
圖10:完成隨機(jī)抽樣
上一節(jié),我們主要學(xué)習(xí)了選擇個(gè)案中的條件篩選與隨機(jī)選取個(gè)案的功能,本節(jié)中,將會(huì)重點(diǎn)講解基于時(shí)間或個(gè)案范圍、使用過(guò)濾變量?jī)煞N選擇個(gè)案的功能。
一、實(shí)例演示時(shí)間或個(gè)案范圍選擇個(gè)案
基于時(shí)間或個(gè)案范圍,顧名思義,就是以時(shí)間或序號(hào)為條件進(jìn)行篩選的選項(xiàng)。單擊“范圍”開(kāi)啟設(shè)置面板。

圖1:基于時(shí)間或個(gè)案范圍
如圖2所示,基于時(shí)間或個(gè)案范圍選項(xiàng)的設(shè)置面板很簡(jiǎn)單,只要輸入第一個(gè)個(gè)案的觀測(cè)值以及最后一個(gè)個(gè)案的觀測(cè)值,即可完成篩選。
我們以輸入1-10觀測(cè)值范圍為例。

圖2:設(shè)置個(gè)案范圍
如圖3所示,可以看到,觀測(cè)值11以后的個(gè)案都被暫時(shí)鎖定了。
圖3:完成個(gè)案范圍選擇
二、實(shí)例演示使用過(guò)濾變量選擇個(gè)案
最后介紹的是使用過(guò)濾變量選擇個(gè)案的選項(xiàng)。該選項(xiàng)指的是通過(guò)將數(shù)據(jù)集的變量指定為過(guò)濾變量,選擇其變量值不為0或 missing 的個(gè)案,來(lái)達(dá)到篩選數(shù)據(jù)目的的選項(xiàng)。

圖4:使用過(guò)濾變量
我們嘗試將賬號(hào)添加到過(guò)濾變量,如圖5所示,SPSS彈出了“列表中不允許存在字符串變量”的警告。這是因?yàn),過(guò)濾變量必須是定量變量,才能起到識(shí)別變量值不為0或 missing 的個(gè)案。

圖5:過(guò)濾變量不允許添加字符串變量
為了更好地演示過(guò)濾變量的使用,我們?cè)黾恿艘粋(gè)“性別編碼”的變量,通過(guò)將性別轉(zhuǎn)化為定量變量來(lái)起到篩選性別的目的。

圖6:重新編碼數(shù)據(jù)
為了讓性別編碼的碼表更加清晰,如圖7所示,打開(kāi)變量視圖,在“性別編碼”的值標(biāo)簽中,將“值=1,標(biāo)簽=男”、“值=2,標(biāo)簽=女”添加到值標(biāo)簽中。

圖7:編輯變量的值標(biāo)簽
如圖8所示,可以看到,性別編碼中的碼表就很清晰了,方便后續(xù)查看數(shù)據(jù)使用。

圖8:完成變量的值標(biāo)簽設(shè)置
然后,再次打開(kāi)“選擇個(gè)案”功能,將“性別編碼”添加為過(guò)濾變量。

圖9:添加性別編碼為過(guò)濾變量
可以看到如圖10所示,在輸出的數(shù)據(jù)集中就僅包含了性別編碼為1,也就是男性的個(gè)案。
圖10:完成過(guò)濾變量的個(gè)案選擇
以上就是IBM SPSS Statistics指定分析范圍之選擇個(gè)案的方法演示。在進(jìn)行數(shù)據(jù)分析時(shí),我們需要多次篩選數(shù)據(jù)作深層次的研究,SPSS的選擇個(gè)案功能可快速地進(jìn)行個(gè)案篩選,提高數(shù)據(jù)處理的效率。
世界上許多有影響的報(bào)刊雜志就SPSS給予了高度的評(píng)價(jià)。 |