暨南大學(xué)劉建平教授主持完成的國(guó)家社會(huì)科學(xué)基金項(xiàng)目《輔助信息在抽樣調(diào)查中的應(yīng)用模型與方法研究》(批準(zhǔn)號(hào)為04BTJ013),最終成果為專(zhuān)著《輔助信息在抽樣調(diào)查中的應(yīng)用模型與方法》。課題組成員有:陳光慧。
當(dāng)今社會(huì)已經(jīng)步入信息時(shí)代,人們每天都面對(duì)著海量的數(shù)據(jù)和信息。無(wú)論是國(guó)家對(duì)經(jīng)濟(jì)社會(huì)的宏觀管理,還是處于社會(huì)再生產(chǎn)各個(gè)環(huán)節(jié)的投資者、生產(chǎn)者和消費(fèi)者以及各種中介機(jī)構(gòu)的微觀管理;無(wú)論是有效地生產(chǎn),還是高質(zhì)量地生活,抑或科學(xué)地研究,都需要獲取和利用大量、及時(shí)和有效的信息。社會(huì)對(duì)信息的依賴(lài)和需求日益增大,人們對(duì)有效獲取信息的手段和方法愈來(lái)愈重視。面對(duì)海量的信息,如何有效地獲取和利用信息是統(tǒng)計(jì)工作的一項(xiàng)基本任務(wù)。作為統(tǒng)計(jì)調(diào)查主體方法的抽樣調(diào)查,由于在獲取信息中所具有的獨(dú)特優(yōu)勢(shì)而得到越來(lái)越廣泛的重視和應(yīng)用。一項(xiàng)大中型抽樣調(diào)查能否獲得成功,很大程度上依賴(lài)于抽樣調(diào)查中對(duì)輔助信息利用得好壞。
一、該成果的主要內(nèi)容和重要觀點(diǎn) 1.研究思路與方法路徑。該成果的研究思路與方法可歸納為兩條路徑。路徑一:兩個(gè)階段→一個(gè)目標(biāo)→兩個(gè)標(biāo)準(zhǔn)。兩個(gè)階段是指輔助信息在抽樣調(diào)查中的應(yīng)用主要體現(xiàn)在抽樣設(shè)計(jì)和抽樣估計(jì)兩個(gè)階段;一個(gè)目標(biāo)是指如何充分利用現(xiàn)實(shí)中各種類(lèi)型的輔助信息進(jìn)行抽樣設(shè)計(jì)和估計(jì)量設(shè)計(jì),構(gòu)造出一個(gè)精度更高的估計(jì)量;兩個(gè)標(biāo)準(zhǔn)指的是評(píng)價(jià)抽樣設(shè)計(jì)和估計(jì)量?jī)?yōu)劣的兩個(gè)依據(jù):一個(gè)是構(gòu)造的估計(jì)量要滿(mǎn)足無(wú)偏性、有效性、一致性和充分性等統(tǒng)計(jì)性質(zhì)的要求,另一個(gè)是要能給出估計(jì)量的方差及其估計(jì)量的計(jì)算公式。這是該項(xiàng)成果的整體研究思路。路徑二:超總體回歸模型→有限總體回歸模型→樣本回歸模型。傳統(tǒng)的抽樣調(diào)查將總體看成是固定的,隨機(jī)性?xún)H表現(xiàn)在樣本的抽取,估計(jì)推斷以抽樣設(shè)計(jì)為基礎(chǔ)。該成果把有限總體看成是超總體的一個(gè)隨機(jī)實(shí)現(xiàn),把超總體回歸模型作為研究的工具,是一種基于模型的模型輔助估計(jì)方法。它首先研究如何充分利用現(xiàn)有的各類(lèi)輔助信息設(shè)計(jì)超總體回歸模型,其次研究如何估計(jì)超總體回歸模型的參數(shù)。如果掌握有限總體的數(shù)據(jù),就依據(jù)有限總體的數(shù)據(jù)估計(jì)出超總體回歸模型參數(shù)的估計(jì)值 ,進(jìn)而給出估計(jì)量的方差;實(shí)際調(diào)查中,一般并不掌握有限總體的數(shù)據(jù),這時(shí)就運(yùn)用概率樣本數(shù)據(jù)進(jìn)行估計(jì),估計(jì)出超總體回歸模型參數(shù)的樣本估計(jì)值,進(jìn)而得到方差的估計(jì)量。這是該成果在估計(jì)量設(shè)計(jì)階段利用輔助信息的主要方法路徑。
2.提出在普查基礎(chǔ)上科學(xué)編制抽樣框是在我國(guó)統(tǒng)計(jì)調(diào)查方法體系中真正確立普查基礎(chǔ)地位和抽樣調(diào)查主體地位的關(guān)鍵,給出了編制基礎(chǔ)抽樣框和操作抽樣框以及對(duì)名錄庫(kù)進(jìn)行更新維護(hù)的思路和方法。
3.建立了抽樣調(diào)查的基礎(chǔ)概念體系。它是構(gòu)建輔助信息在抽樣調(diào)查中應(yīng)用模型和方法體系的基礎(chǔ)。這些基礎(chǔ)概念包括抽樣設(shè)計(jì)、樣本示性變量、包含概率、量、量的方差及其估計(jì)量。這些概念相互之間邏輯關(guān)系緊密,對(duì)于抽樣從設(shè)計(jì)到估計(jì)的全過(guò)程起著基礎(chǔ)的和基本的作用。抽樣設(shè)計(jì)是研究包含概率、量及其相關(guān)統(tǒng)計(jì)性質(zhì)的基礎(chǔ)。在有限總體中,抽樣設(shè)計(jì)確定了,包含概率和量也就隨之確定了。不同的抽樣設(shè)計(jì),給出不同的包含概率,最終也使量具有不同的形式。量是在抽樣設(shè)計(jì)下得到的一般性估計(jì)量,量具有的統(tǒng)計(jì)性質(zhì)能很容易推廣到具體抽樣設(shè)計(jì)下的不同情形。樣本示性變量的定義和優(yōu)良特性使包含概率、量及其統(tǒng)計(jì)性質(zhì)的推導(dǎo)簡(jiǎn)潔方便。該成果的研究?jī)?nèi)容是以包含概率和量為基礎(chǔ)的。
4.建立了輔助信息在抽樣設(shè)計(jì)中應(yīng)用的模型與方法體系。該成果分別對(duì)等概率抽樣設(shè)計(jì)中的伯努力抽樣、簡(jiǎn)單隨機(jī)抽樣、系統(tǒng)抽樣和不等概率抽樣設(shè)計(jì)中的泊松抽樣、樣和樣如何利用輔助信息提高抽樣效率進(jìn)行了系統(tǒng)深入的研究,比較了各種方法對(duì)輔助信息的利用程度及其效率。特別是給出了樣本量大于2時(shí)樣設(shè)計(jì)下方差估計(jì)的一種簡(jiǎn)便算法,使樣的應(yīng)用不再局限于樣本量小于等于2的情形,給出了在MPPS抽樣下利用輔助信息對(duì)Hansen-Hurwitz估計(jì)量進(jìn)行擴(kuò)展的方法,解決了多目標(biāo)抽樣下估計(jì)量整體估計(jì)精度不高的問(wèn)題。比較好地解決了如何在分層抽樣設(shè)計(jì)中利用輔助信息分配樣本、選擇分層標(biāo)志、確定分層界限和層數(shù)的問(wèn)題,探討了利用輔助信息尋求多目標(biāo)分層抽樣的最優(yōu)設(shè)計(jì)方法。系統(tǒng)研究了在整群抽樣設(shè)計(jì)和二階抽樣設(shè)計(jì)中應(yīng)用不同類(lèi)型輔助信息的基本條件和方法,對(duì)兩種方法的抽樣設(shè)計(jì)效應(yīng)以及影響效應(yīng)大小的因素進(jìn)行了深入的分析研究。
5.建立了輔助信息在抽樣估計(jì)中應(yīng)用的模型與方法體系。該成果所用的抽樣推斷方法是模型輔助估計(jì)。這種方法只是把超總體回歸模型作為一種輔助工具,而不是依賴(lài)超總體模型進(jìn)行估計(jì),不管模型是否會(huì)出現(xiàn)設(shè)定誤差,都不會(huì)直接影響到回歸估計(jì)量基本統(tǒng)計(jì)性質(zhì)的成立。在抽樣估計(jì)階段,要利用已知的輔助變量提高抽樣估計(jì)的精度,關(guān)鍵在于建立反映輔助變量與研究變量之間關(guān)系的回歸模型。所以,該研究成果專(zhuān)門(mén)研究了如何根據(jù)獲得的輔助信息的不同類(lèi)型,建立恰當(dāng)?shù)胤从齿o助變量與研究變量之間關(guān)系的超總體回歸模型,從而最大限度地提高各種回歸估計(jì)量的精度。首先研究了如何由一般的超總體回歸模型推導(dǎo)出GREG估計(jì)量,對(duì)GREG估計(jì)量的統(tǒng)計(jì)性質(zhì)進(jìn)行了嚴(yán)格的推導(dǎo)證明。其次,根據(jù)輔助變量與研究變量之間具體的回歸關(guān)系,對(duì)一般的超總體回歸模型所得出的結(jié)論加以推廣,建立比率模型、線(xiàn)性回歸模型、事后分層回歸模型和非參數(shù)回歸模型,分別推導(dǎo)出比率估計(jì)量、線(xiàn)性回歸估計(jì)量、事后分層回歸估計(jì)量和非參數(shù)回歸估計(jì)量,并研究相應(yīng)的估計(jì)量性質(zhì)。從而建立起一個(gè)較為完整的抽樣估計(jì)方法體系。
6.建立了輔助信息在抽樣設(shè)計(jì)與估計(jì)量設(shè)計(jì)中同時(shí)應(yīng)用的模型與方法體系。為了更加充分地利用已有的輔助信息,盡可能地提高抽樣估計(jì)的精度,該成果將抽樣設(shè)計(jì)與估計(jì)方法作為一個(gè)整體,研究了利用一種或多種輔助信息同時(shí)改進(jìn)抽樣設(shè)計(jì)和估計(jì)量設(shè)計(jì)的模型和方法。把抽樣設(shè)計(jì)階段的分層抽樣和抽樣估計(jì)階段的比率估計(jì)、回歸估計(jì)結(jié)合起來(lái)進(jìn)行研究,使輔助信息在分層抽樣設(shè)計(jì)和比率估計(jì)與回歸估計(jì)中同時(shí)得到應(yīng)用;研究了如何利用不同種類(lèi)的輔助信息在整群抽樣設(shè)計(jì)和二階抽樣設(shè)計(jì)下進(jìn)行回歸估計(jì),對(duì)整群抽樣設(shè)計(jì)效應(yīng)進(jìn)行了更深入的討論,對(duì)分層整群抽樣回歸模型與事后分層整群抽樣回歸模型進(jìn)行了系統(tǒng)的研究;研究了如何利用輔助變量進(jìn)行二重分層抽樣、二重回歸估計(jì)以及二重分層回歸估計(jì),即在二重抽樣下同時(shí)考慮分層抽樣設(shè)計(jì)和使用回歸估計(jì)方法,實(shí)現(xiàn)從抽樣設(shè)計(jì)和估計(jì)方法兩個(gè)層面同時(shí)提高二重抽樣的估計(jì)精度。
7.輔助信息在抽樣調(diào)查其他環(huán)節(jié)中應(yīng)用的模型與方法。該研究成果圍繞抽樣設(shè)計(jì)和估計(jì)量設(shè)計(jì)這兩個(gè)關(guān)鍵,對(duì)輔助信息在相關(guān)課題中的應(yīng)用模型和方法也進(jìn)行了研究,具體包括輔助信息在域估計(jì)、樣本輪換和無(wú)回答中的應(yīng)用。從滿(mǎn)足多層次推斷和多級(jí)管理的需要出發(fā),分別研究了輔助信息在域估計(jì)中的直接估計(jì)和間接估計(jì)的應(yīng)用模型和方法。研究了在樣本輪換中分別以前期樣本資料為輔助信息的量,同時(shí)以前期樣本資料及全面資料為輔助信息的回歸估計(jì)量,同時(shí)以前期樣本資料和全面資料為輔助信息的校準(zhǔn)估計(jì)量。研究了處理無(wú)回答的加權(quán)調(diào)整法和插補(bǔ)法,提出了校準(zhǔn)加權(quán)調(diào)整法,這種方法綜合了加權(quán)調(diào)整法和插補(bǔ)法兩者的優(yōu)點(diǎn),更充分地利用了已有的輔助信息,從而更多地減少了由于無(wú)回答的存在給估計(jì)帶來(lái)的精度損失。
二、研究成果的學(xué)術(shù)和社會(huì)價(jià)值 1.建立了輔助信息在抽樣調(diào)查中應(yīng)用的模型和方法體系。該成果在系統(tǒng)總結(jié)前人研究成果的基礎(chǔ)上,對(duì)輔助信息在抽樣調(diào)查中各個(gè)環(huán)節(jié)的應(yīng)用模型與方法進(jìn)行系統(tǒng)研究,建立了輔助信息在抽樣調(diào)查中的應(yīng)用模型和方法體系。這也有利于從事抽樣調(diào)查實(shí)踐的人員運(yùn)用該研究成果對(duì)抽樣實(shí)踐進(jìn)行指導(dǎo),從而提高我國(guó)抽樣調(diào)查的方法技術(shù)水平,提高抽樣調(diào)查的效率和效益。
2.在若干方面取得突破性進(jìn)展,解決了抽樣方法中存在的一些難題。給出樣本量大于2時(shí)樣下方差估計(jì)的一種簡(jiǎn)便算法,解決了二階包含概率不易計(jì)算的難題,拓展了樣的應(yīng)用范圍;給出了MPPS抽樣下,利用輔助信息對(duì)Hansen-Hurwitz估計(jì)量進(jìn)行擴(kuò)展的方法,解決了多目標(biāo)抽樣下估計(jì)量整體精度不高的難題。通過(guò)輔助變量的最小值和最大值進(jìn)行線(xiàn)性轉(zhuǎn)化改進(jìn)比率估計(jì)量,給出在不同條件下選用有效估計(jì)量的標(biāo)準(zhǔn);在比率模型和線(xiàn)性回歸模型中考慮異方差問(wèn)題,針對(duì)不同的方差結(jié)構(gòu),給出相應(yīng)的估計(jì)方法;將事后分層作為估計(jì)方法研究,根據(jù)定性和定量的輔助信息分別建立事后分層回歸模型;根據(jù)輔助變量與研究變量之間的非參數(shù)回歸關(guān)系建立非參數(shù)回歸模型等等,開(kāi)辟了抽樣估計(jì)方法研究的新領(lǐng)域。
(責(zé)編:陳葉軍)