1、簡(jiǎn)單隨機抽樣
有放回簡(jiǎn)單隨機抽樣從總體中隨機抽出一個(gè)樣本單位,記錄觀(guān)測結果后,將其放回到總體中去,再抽取第二個(gè),如此類(lèi)推,一直到抽滿(mǎn)n個(gè)單位為止。
單位有被重復抽中的可能,容易造成信息重疊而影響估計的效率,較少采用。
2、不放回簡(jiǎn)單隨機抽樣
從包含N個(gè)單元的總體中逐個(gè)隨機抽取單元并無(wú)放回,每次都在所有尚未被抽入樣本的單元中等概率的抽取下一個(gè)單元,直到抽取n個(gè)單元為止。
每個(gè)單位最多只能被抽中一次,不會(huì )由于樣本單位被重復抽中而提供重疊信息,比放回抽樣有更低的抽樣誤差。
3、分層抽樣
先按照某種規則把總體分為不同的層,然后在不同的層內獨立、隨機的抽取樣本,這樣所得到的樣本稱(chēng)為分層樣本。如果每層中的抽樣都是簡(jiǎn)單隨機抽樣,則稱(chēng)為分層隨機抽樣。
4、系統抽樣
系統抽樣指先將總體中的所有單元按一定順序排列,在規定范圍內隨機抽取一個(gè)初始單元,然后按事先規定的規則抽取其他樣本單元。最簡(jiǎn)單的系統抽樣是等距抽樣。
5、整群抽樣
整群抽樣是將總體中所有的基本單位按照一定規則劃分為互不重疊的群,抽樣時(shí)直接抽取群,對抽中的群調查其全部的基本單位,對沒(méi)有抽中的群則不進(jìn)行調查。
擴展資料
概率抽樣包括以下幾個(gè)方面的優(yōu)點(diǎn):調查者可獲得被抽取的不同年齡、不同層次的人們的信息; 能估算出抽樣誤差; 調查結果可以用來(lái)推斷總體。
例如,在一項使用概率抽樣法的調查中,如果有 5 %的被訪(fǎng)者給出了某種特定回答,那么,調查者就可以以此百分比再結合抽樣誤差,推及總體情況。
另一方面,概率抽樣也有一些弊病:在大多數案例中,同樣規模的概率抽樣的費用要比非概率抽樣高;概率抽樣比非概率抽樣需要更多時(shí)間策劃和實(shí)施;必須遵守的抽樣計劃執行程序會(huì )大量增加收集資料的時(shí)間。
參考資料來(lái)源:百度百科-概率抽樣
1.簡(jiǎn)單隨機抽樣
若總體中每個(gè)個(gè)體被抽到的機會(huì )是均等的(即抽樣的隨機性),且在抽樣取走一個(gè)個(gè)體之后總體內成分不變(即抽樣的獨立性),這種抽樣方式稱(chēng)為簡(jiǎn)單隨機抽樣。
簡(jiǎn)單隨機抽樣一般用下述三種方法:
(1)抽簽法。把總體中的每一個(gè)個(gè)體都編上號碼,并做成簽,充分混合后從中隨機抽取一部分,這部分所對應的個(gè)體就組成一個(gè)樣本。
(2)查表法。查隨機數表,確定從總體中所抽取個(gè)體的號碼,則號碼所對應的個(gè)體就進(jìn)入樣本。隨機數表可隨意從任何一區、任何一個(gè)數目開(kāi)始,依次向各個(gè)方向順序進(jìn)行。
(3)計算機造數法。用電子計算機編造隨機數程序,把隨機數作為總體中抽出個(gè)體進(jìn)入樣本的號碼。
2.系統抽樣(等距抽樣)
系統抽樣方法實(shí)際上是等間隔法的機械抽樣。它把總體中所有個(gè)體按一定順序編號,然后依固定間隔取樣,間隔的大小視所需樣本容量與總體中個(gè)體數目的比率而定,起始數字必須是隨機決定的。等距抽樣又有直線(xiàn)等距抽樣,對稱(chēng)等距抽樣和循環(huán)等距抽樣三種。這種方法與簡(jiǎn)單隨機抽樣相比,方便、易學(xué)、易做,當總體按一定順序排定后,第一個(gè)樣本一經(jīng)確定,其他樣本也隨之確定。但是,這種抽樣方法在名單排列中,如果存在周期性部分,則會(huì )造成偏差。因此,在等距抽樣間距確定以后,選擇起點(diǎn)時(shí),應根據掌握的信息,盡量避開(kāi)總體可能存在周期的點(diǎn)。
3.分層抽樣(類(lèi)型抽樣)分層抽樣是先把總體按一定標志分成不同類(lèi)型或層次,然后從各種不同類(lèi)型中隨機抽取若干單位組成樣本。
分層抽樣在各層中抽取的樣本也可看成總的樣本數在各層的分攤,它又有三種方法:
(1)等比例抽樣。即各層所抽樣本數占各層總體單位數的比例相等。
(2)按各層的離散情況分配樣本。某層的離散程度大,則該層多分攤一些樣本。
(3)最優(yōu)分配。既考慮到各層的單位數的多少,又考慮到各層的離散情況。
4.整群抽樣
整群抽樣是先將各單位劃分為若干群(組),然后以群為單位從中隨機抽取一些群,對抽中的群的所有單位進(jìn)行調查。
概率抽樣包括有簡(jiǎn)單隨機抽樣、系統抽樣(等距抽樣)、分層抽樣(類(lèi)型抽樣)、整群抽樣、多段抽樣、PPS抽樣和戶(hù)內抽樣。
例如: 簡(jiǎn)單隨機抽樣是一種廣為使用的概率抽樣方法。是最完全的概率抽樣。
如前面提到的,隨機抽樣就是總體中每個(gè)單位在抽選時(shí)有相等的被抽中的機會(huì )。在簡(jiǎn)單隨機抽樣條件下,抽樣概率公式為:抽樣概率=樣本單位數∕總體單位數例如,如果總體單位數為 10000 ,樣本單位數為 400 ,那么抽樣概率為 4 %。
簡(jiǎn)單隨機抽樣的優(yōu)點(diǎn)在于,它看起來(lái)簡(jiǎn)單,并且滿(mǎn)足概率抽樣的一切必要的要求,保證每個(gè)總體單位在抽選時(shí)都有相等的被抽中的機會(huì )。簡(jiǎn)單隨機抽樣可以通過(guò)電話(huà)隨機撥號功能完成這個(gè)步驟,可以從電腦檔案中挑選調查對象。
同樣,簡(jiǎn)單隨機抽樣會(huì )遇到“樣本可能分布不均勻”以及“沒(méi)有好的抽樣框”等問(wèn)題。友邦顧問(wèn)在簡(jiǎn)單隨機抽樣過(guò)程中常使用的技巧為“抽簽法”和“隨機表”法。
在定量抽樣調查中,等距抽樣常常代替簡(jiǎn)單隨機抽樣。由于該抽樣方法簡(jiǎn)單實(shí)用,所以應用普遍。
等距抽樣得到的樣本幾乎與簡(jiǎn)單隨機抽樣得到的樣本是相同的。等距抽樣的基本做法是,將總體中的各單元先按一定的順序排列、編號,然后決定一個(gè)間隔,并在此間隔基礎上選擇被調查的單位個(gè)體。
樣本距離可通過(guò)下面公式確定:樣本距離 =總體單位數∕樣本單位數例如,假設你使用本地電話(huà)本并確定樣本距離為 100 ,那么 100 個(gè)中取 1 個(gè)組成樣本。這個(gè)公式保證了整個(gè)列表的完整性。
等距抽樣方式隨意用一個(gè)起點(diǎn),例如,如果你把一本電話(huà)本作為抽樣框,必須隨意取出一個(gè)號碼決定從該頁(yè)開(kāi)始翻閱。假設從第 5 頁(yè)開(kāi)始,在該頁(yè)上再另選一個(gè)數決定從該行開(kāi)始。
假定選擇從第 3 行開(kāi)始,這就決定了實(shí)際開(kāi)始的位置。等距抽樣方式相對于簡(jiǎn)單隨機抽樣方式最主要的優(yōu)勢就是經(jīng)濟性。
等距抽樣方式比簡(jiǎn)單隨機抽樣更為簡(jiǎn)單,花的時(shí)間更少,并且花費也少。使用等距抽樣方式最大的缺陷在于總體單位的排列上。
一些總體單位數可能包含隱蔽的形態(tài)或者是“不合格樣本”,調查者可能疏忽,把它們抽選為樣本。 定量調查中的分層抽樣是一種卓越的概率抽樣方式,在友邦公司以往的調查中經(jīng)常被使用。
分層抽樣的具體程序是:把總體各單位分成兩個(gè)或兩個(gè)以上的相互獨立的完全的組(如男性和女性),從兩個(gè)或兩個(gè)以上的組中進(jìn)行簡(jiǎn)單隨機抽樣,樣本相互獨立。總體各單位按主要標志加以分組,分組的標志與我們關(guān)心的總體特征相關(guān)。
例如,我們正在進(jìn)行有關(guān)啤酒品牌知名度方面的調查,初步判別,在啤酒方面男性的知識與和女性不相同,那么性別應是劃分層次的適當標志。如果不以這種方式進(jìn)行分層抽樣,分層抽樣就得不到什么效果,花再多時(shí)間、精力和物資也是白費。
分層抽樣與簡(jiǎn)單隨機抽樣相比,我們往往選擇分層抽樣,因為它有顯著(zhù)的潛在統計效果。也就是說(shuō),如果我們從相同的總體中抽取兩個(gè)樣本,一個(gè)是分層樣本,另一個(gè)是簡(jiǎn)單隨機抽樣樣本,那么相對來(lái)說(shuō),分層樣本的誤差更小些。
另一方面,如果目標是獲得一個(gè)確定的抽樣誤差水平,那么更小的分層樣本將達到這一目標。在調查實(shí)踐中,為提高分層樣本的精確度實(shí)際上要付出一些代價(jià)。
通常,我們現實(shí)正確的分層抽樣一般有三個(gè)步驟:首先,辯明突出的(重要的)人口統計特征和分類(lèi)特征,這些特征與所研究的行為相關(guān)。例如,研究某種產(chǎn)品的消費率時(shí),按常理認為男性和女性有不同的平均消費比率。
為了把性別作為有意義的分層標志,調查者肯定能夠拿出資料證明男性與女性的消費水平明顯不同。用這種方式可識別出各種不同的顯著(zhù)特征。
調查表明,一般來(lái)說(shuō),識別出 6 個(gè)重要的顯著(zhù)特征后,再增加顯著(zhù)特征的辨別對于提高樣本代表性就沒(méi)有多大幫助了。第二,確定在每個(gè)層次上總體的比例(如性別已被確定為一個(gè)顯著(zhù)的特征,那么總體中男性占多少比例,女性占多少比例呢?)。
利用這個(gè)比例,可計算出樣本中每組(層)應調查的人數。最后,調查者必須從每層中抽取獨立簡(jiǎn)單隨機樣本。
以上各種抽樣類(lèi)型全部是按單位抽取的,即按樣本單位數,分別一個(gè)單位一個(gè)單位地抽取。在整群抽樣中,樣本是一組單位一組單位地抽取。
整群抽樣有兩個(gè)關(guān)鍵步驟:-同質(zhì)總體被分為相互獨立的完全的較小子集。-隨機抽選子集構成樣本。
如果調查者在抽中的子集中觀(guān)察全部單位,我們就有了一級整群樣本。如果在抽中的子集中再以概率方式抽取部分單位觀(guān)察,我們就有了二級整群樣本。
分層和整群抽樣都要將總體分為相互獨立的完全子集。它們的區別是,分層抽樣的樣本是從每個(gè)子集中抽取,而整群抽樣則是抽取部分子集。
地理區域抽樣是整群抽樣的典型方式。挨門(mén)挨戶(hù)去調查一個(gè)特定城市的調查者也許會(huì )隨機抽選一些區域,較集中地訪(fǎng)查一些群體,大量減少訪(fǎng)問(wèn)時(shí)間和經(jīng)費。
整群抽樣被認為是概率抽樣技術(shù),因為它隨機抽出群和隨機抽出單位。值得注意的是,在整群抽樣下,我們假定群中單位與總體一樣存在異質(zhì)性。
如果一群中單位的特征非常相似,如果由于共同環(huán)境使群內差異小而群與群之間差異大。一般來(lái)說(shuō),要解決這個(gè)問(wèn)題可以擴大群數,然后從各群中抽取少量單位數,以保證樣本。
概率抽樣方法 (Probability Sampling)
概率抽樣包括有
1. 簡(jiǎn)單隨機抽樣(又稱(chēng):?jiǎn)渭冸S機抽樣)
2. 系統抽樣(等距抽樣)
3. 分層隨機抽樣(類(lèi)型抽樣)
4. 分群隨機抽樣
等方法。概率抽樣又稱(chēng)幾率抽樣、可能率抽樣,在實(shí)踐中受到人們的普遍重視和廣泛應用。概率抽樣是以概率論與數理統計為基礎,首先按照隨機的原則選取調查樣本,使調查母體中每一個(gè)子體均有被選中的可能性,即具有同等被選為樣本的可能率,機遇均等。定量市場(chǎng)調查中的概率抽樣是指在調查總體樣本中的每個(gè)單位都具有同等可能性被抽中的機會(huì )。
概率抽樣的基本原則是:樣本量越大,抽樣誤差就越小,而樣本量越大,則成本就越高。根據數理統計規律,樣本量增加呈直線(xiàn)遞增的情況下(樣本量增加一倍,成本也增加一倍),而抽樣誤差只是樣本量相對增長(cháng)速度的平方根遞減。因此,樣本量的設計并不是越大越好,通常會(huì )受到經(jīng)濟條件的制約。
簡(jiǎn)單隨機抽樣簡(jiǎn)單隨機抽樣(simple random sampling)又稱(chēng)純隨機抽樣,是概率抽樣的最基本形式。
它是按等概率原則直接從含有N個(gè)元素的總體中隨機抽取n個(gè)元素組成樣本(N>n)。常用的辦法類(lèi)似于抽簽,即把總體的每一個(gè)單位都編號,將這些號碼寫(xiě)在一張張小紙條上,然后放入一容器(如紙盒、口袋)中,攪拌均勻后,從中任意抽取,直到抽夠預定的樣本數目。
這樣,由抽中的號碼所代表的元素組成的就是一個(gè)簡(jiǎn)單隨機樣本。?比如,某系共有學(xué)生300人,系學(xué)生會(huì )打算采用簡(jiǎn)單隨機抽樣的辦法,從中抽取出60人進(jìn)行調查。
為了保證抽樣的科學(xué)性,他們先從系辦公室得到一份全系學(xué)生的名單,然后給名單中的每個(gè)學(xué)生都編上一個(gè)號(從001到300)。抽樣框編好后,他們又用300張小紙條分別寫(xiě)上001,002,…,300。
他們把這300張寫(xiě)好不同號碼的小紙條放在一個(gè)盒子里,攪亂后,隨便摸出60張小紙條。然后,他們按這60張小紙條上的號碼找到總體名單上所對應的60位同學(xué)。
這60位同學(xué)就構成了他們本次的樣本。這種方法簡(jiǎn)便易學(xué)。
但當總體元素很多時(shí),寫(xiě)號碼的工作量就很大,攪拌均勻也不容易,因而此法往往在總體元素較少時(shí)使用。對于總體元素很多的情形,我們則采用隨機數表來(lái)抽樣。
本書(shū)后就附有一張隨機數表,表中的數碼和排列都是隨機形成的,沒(méi)有任何規律性(故也稱(chēng)為亂數表)。利用隨機數表進(jìn)行抽樣的具體步驟是:(1)先取得一份總體所有元素的名單(即抽樣框);(2)將總體中所有元素一一按順序編號;(3)根據總體規模是幾位數來(lái)確定從隨機數表中選幾位數碼;(4)以總體的規模為標準,對隨機數表中的數碼逐一進(jìn)行衡量并決定取舍;(5)根據樣本規模的要求選擇出足夠的數碼個(gè)數;(6)依據從隨機數表中選出的數碼,到抽樣框中去找出它所對應的元素。
按上述步驟選擇出來(lái)的元素的集合,就是所需要的樣本。舉例來(lái)說(shuō),某總體共3 000人(四位數),需要從中抽取100人作為樣本進(jìn)行調查。
首先,我們要得到一份總體成員的名單;然后對總體中的每一個(gè)人從1到3 000進(jìn)行編號;再根據總體的規模,確定從隨機數表中選擇四位數。具體的選法是從隨機數表的任意一行和任意一列的某一個(gè)四位數開(kāi)始,按照從上到下的順序,或者從左到右的順序,以3 000為標準,對隨機數表中依次出現的每個(gè)四位數進(jìn)行取舍:凡小于或等于3 000的數碼就選出來(lái),凡大于3 000的數碼以及已經(jīng)選出的數碼則不要,直到選夠100個(gè)數碼為止;最后按照所抽取的數碼,從總體名單中找到它們所對應的100個(gè)成員。
這100個(gè)成員就構成一個(gè)隨機樣本。表6—2就是對3 000人的總體進(jìn)行抽樣時(shí),我們采用隨機數表對四位數碼進(jìn)行取舍的例子(采用后四位數,并按從上往下的順序)。
表6—2隨機數表抽樣例隨機數表中的數碼選用的數碼不選用的原因后面四位數大于后面四位數大于30001359866042后面四位數大于3 與所選的第三個(gè)數碼重復27256511761176如果采用前四位數字,仍按從上往下的順序,那么從表6—2中我們又可以抽取出1 053、0 139、1 359、2 725這四個(gè)號碼;如果取中間的四位數字,所得到的則是2 990、1 404、1 912和0 582這四個(gè)號碼了。二、系統抽樣系統抽樣(systematic sampling)又稱(chēng)等距抽樣或間隔抽樣。
它是把總體的單位進(jìn)行編號排序后,再計算出某種間隔,然后按這一固定的間隔抽取個(gè)體的號碼來(lái)組成樣本的方法。它和簡(jiǎn)單隨機抽樣一樣,需要有完整的抽樣框,樣本的抽取也是直接從總體中抽取個(gè)體,而無(wú)其他中間環(huán)節。
系統抽樣的具體步驟是:(1)給總體中的每一個(gè)個(gè)體按順序編號,即制定出抽樣框。(2)計算出抽樣間距。
計算方法是用總體的規模除以樣本的規模。假設總體規模為N,樣本規模為n,那么抽樣間距K就由下列公式求得:K(抽樣間距)=N(總體規模)n(樣本規模)(3)在最前面的K個(gè)個(gè)體中,采用簡(jiǎn)單隨機抽樣的方法抽取一個(gè)個(gè)體,記下這個(gè)個(gè)體的編號(假設所抽取的這個(gè)個(gè)體的編號為A),它稱(chēng)做隨機的起點(diǎn)。
(4)在抽樣框中,自A開(kāi)始,每隔K個(gè)個(gè)體抽取一個(gè)個(gè)體,即所抽取個(gè)體的編號分別為A,A+K,A+2K,…,A+(n-1)K。(5)將這n個(gè)個(gè)體合起來(lái),就構成了該總體的一個(gè)樣本。
例如,要在某大學(xué)總共3 000名學(xué)生中,抽取一個(gè)容量為100的大學(xué)生樣本。我們先將3 000名學(xué)生的名單依次編上號碼,然后按上述公式可求得抽樣間距為:K=3 000/100=30即每隔30人抽一名。
為此,我們先在1~30的數碼中,采用簡(jiǎn)單隨機抽樣的方法抽取一個(gè)數字,假如抽到的是12,那么就以12為第一個(gè)號碼,每隔30名再抽一個(gè)。這樣,我們便可得到12,42,72,…,2 982總共100個(gè)號碼。
我們再根據這100個(gè)號碼,從總體名單中一一對應地找出100名學(xué)生,這100名學(xué)生就構成本次的一個(gè)樣本。從上面的過(guò)程中我們不難看出,系統抽樣較之于簡(jiǎn)單隨機抽樣來(lái)說(shuō),顯然簡(jiǎn)便易行多了,尤其是當總體及樣本的規模都較大時(shí)更是如此。
這也正是社會(huì )研究較少采用簡(jiǎn)單隨機抽樣而較多采用系統抽樣的原因。值得注意的是。
聲明:本網(wǎng)站尊重并保護知識產(chǎn)權,根據《信息網(wǎng)絡(luò )傳播權保護條例》,如果我們轉載的作品侵犯了您的權利,請在一個(gè)月內通知我們,我們會(huì )及時(shí)刪除。
蜀ICP備2020033479號-4 Copyright ? 2016 學(xué)習?shū)B(niǎo). 頁(yè)面生成時(shí)間:3.163秒