暨南大學(xué)陳光慧主持完成的國家社會科學(xué)基金項(xiàng)目《超總體模型輔助條件下抽樣估計(jì)方法及其應(yīng)用研究》(項(xiàng)目批準(zhǔn)號為:14CTJ014),最終成果為同名論文集。課題組成員有:馬志華、容越彥、曹偉偉、閆單單、楊檳羽。
一 研究的目的和意義
在整個抽樣調(diào)查過程中,抽樣設(shè)計(jì)和抽樣估計(jì)是影響抽樣精度最主要,也是最具技術(shù)性的兩個環(huán)節(jié)。抽樣設(shè)計(jì)研究如何從總體中抽出一個隨機(jī)樣本以更好地代表總體,在實(shí)際調(diào)查中一般使用復(fù)雜抽樣設(shè)計(jì)。國內(nèi)外對此研究非常成熟,理論也相當(dāng)完善。抽樣估計(jì)是在抽樣設(shè)計(jì)環(huán)節(jié)之后,基于樣本信息研究應(yīng)用什么樣的抽樣估計(jì)方法對總體未知參數(shù)進(jìn)行推斷估計(jì)。相對來說,抽樣估計(jì)方面的研究還遠(yuǎn)不夠充分和完善。
1.研究目的
在既定的調(diào)查經(jīng)費(fèi)和樣本信息下,通過改進(jìn)抽樣估計(jì)方法得出更優(yōu)的估計(jì)結(jié)果,這對于提高數(shù)據(jù)質(zhì)量的貢獻(xiàn)是潛在和巨大的。本項(xiàng)目理論研究目的在于,尋找現(xiàn)有抽樣估計(jì)中難以解決的關(guān)鍵技術(shù)問題,通過構(gòu)建一套現(xiàn)代抽樣回歸估計(jì)方法的基礎(chǔ)理論體系,改進(jìn)抽樣估計(jì)效率,為提高調(diào)查數(shù)據(jù)質(zhì)量奠定方法論基礎(chǔ)。
近年來,我國政府統(tǒng)計(jì)部門在抽樣框、聯(lián)網(wǎng)直報(bào)、“一套表”和復(fù)雜抽樣設(shè)計(jì)等方面做了大量工作,但在抽樣估計(jì)方面考慮得并不多。本項(xiàng)目應(yīng)用研究目的在于,在當(dāng)前形勢下針對產(chǎn)生統(tǒng)計(jì)數(shù)據(jù)的最大源頭,即政府抽樣調(diào)查體系進(jìn)行研究,重點(diǎn)解決抽樣估計(jì)問題,構(gòu)建適應(yīng)我國統(tǒng)計(jì)管理體制的抽樣估計(jì)體系,潛在地提高數(shù)據(jù)質(zhì)量。
2.研究意義
(1)在理論方面,本項(xiàng)目拓寬了傳統(tǒng)抽樣估計(jì)方法的研究范疇,在超總體模型輔助條件下研究一套抽樣估計(jì)方法,將傳統(tǒng)的回歸理論與抽樣估計(jì)結(jié)合起來,在兩者的交叉領(lǐng)域進(jìn)行研究,使得在既定的樣本信息下產(chǎn)生更加準(zhǔn)確的估計(jì)結(jié)果。(2)在應(yīng)用方面,本項(xiàng)目成果可為政府統(tǒng)計(jì)部門改革和完善抽樣方法提供借鑒和參考。比如基于復(fù)雜抽樣設(shè)計(jì)的廣義回歸估計(jì)方法、連續(xù)月度調(diào)查下的校準(zhǔn)組合估計(jì)方法,這些必將有效指導(dǎo)我國開展統(tǒng)計(jì)調(diào)查工作,產(chǎn)生更加準(zhǔn)確的調(diào)查數(shù)據(jù)。
二 成果的主要內(nèi)容、重要觀點(diǎn)及創(chuàng)新之處
1.主要內(nèi)容
本項(xiàng)目以超總體模型為基礎(chǔ),圍繞如何產(chǎn)生更加準(zhǔn)確的抽樣估計(jì)問題展開研究,將模型輔助下的廣義回歸估計(jì)與模型誤差設(shè)定、復(fù)雜抽樣設(shè)計(jì)、多水平模型、連續(xù)性樣本輪換調(diào)查結(jié)合起來得出精度更高的估計(jì)結(jié)果,并與我國實(shí)際抽樣調(diào)查結(jié)合起來,構(gòu)建一套適應(yīng)國情的抽樣回歸估計(jì)方法體系。
(1)為了改進(jìn)模型識別的效果,在模型形式方面,根據(jù)輔助變量與研究變量之間的關(guān)系,將現(xiàn)行的線性回歸模型擴(kuò)展到非線性、半?yún)?shù)和非參數(shù)模型。本部分在現(xiàn)有研究的基礎(chǔ)上,借鑒數(shù)理統(tǒng)計(jì)的最新研究成果,利用前沿的建模方法,研究建立一套模型體系,涵蓋各種模型形式,為后續(xù)回歸估計(jì)提供模型基礎(chǔ)。
(2)為了增強(qiáng)估計(jì)方法的推廣價值,在上述一般性模型體系下進(jìn)行系統(tǒng)性的模型輔助抽樣估計(jì)研究。包括:將目前的比率估計(jì)、線性回歸估計(jì)、非參數(shù)估計(jì)等各種方法統(tǒng)一在廣義回歸估計(jì)體系下進(jìn)行研究;根據(jù)樣本信息識別出恰當(dāng)?shù)哪P托问,并通過上述廣義回歸估計(jì)體系得出具體的回歸估計(jì)量,如在非參數(shù)模型下應(yīng)用局部多項(xiàng)式回歸估計(jì),不需太多的模型假定,更接近實(shí)際調(diào)查情況。
(3)為了提高模型估計(jì)效果,在上述廣義回歸估計(jì)體系下,對估計(jì)方法進(jìn)行改進(jìn)研究。在模型設(shè)定方面,改變超總體模型誤差項(xiàng)的方差結(jié)構(gòu),從理論上對現(xiàn)行方法進(jìn)行擴(kuò)展;在誤差項(xiàng)方差函數(shù)中考慮各種復(fù)雜抽樣設(shè)計(jì)的影響,將抽樣設(shè)計(jì)引入估計(jì)量中;利用校準(zhǔn)估計(jì)思想,對回歸系數(shù)和權(quán)重系數(shù)進(jìn)行最優(yōu)化校準(zhǔn),得出廣義校準(zhǔn)回歸(組合)估計(jì)方法。
(4)針對復(fù)雜抽樣下的估計(jì)難題,引入多水平模型(Multilevel)進(jìn)行廣義多水平回歸估計(jì)。本部分在現(xiàn)行的組回歸模型和單因素方差分析基礎(chǔ)上,考慮各階抽樣單元的水平差異和各群單元的類別差異,建立綜合的多水平模型,通過度量多層次樣本中的各層、各群和各階的影響,分層次開展廣義回歸估計(jì),提高復(fù)雜抽樣下的整體估計(jì)精度。
(5)基于輪換樣本調(diào)查研究廣義回歸組合估計(jì)方法。首先,對于常見的輪換樣本調(diào)查,基于已有的平衡輪換模式研究廣義組合估計(jì)方法,利用各期信息更準(zhǔn)確度量輪換樣本間的相關(guān)關(guān)系,得出有效性更高的估計(jì)量;其次,在廣義組合估計(jì)基礎(chǔ)上,利用各期輔助信息構(gòu)建回歸模型,進(jìn)行廣義回歸組合估計(jì)。另外,還與校準(zhǔn)估計(jì)方法結(jié)合,提出校準(zhǔn)組合估計(jì)方法,進(jìn)一步提高估計(jì)精度。
(6)針對我國抽樣調(diào)查在估計(jì)環(huán)節(jié)存在的不足,建立適應(yīng)政府管理體制的模型輔助抽樣估計(jì)方法體系。利用上述研究的理論方法,并借鑒發(fā)達(dá)國家建設(shè)抽樣估計(jì)系統(tǒng)的成功經(jīng)驗(yàn),研究內(nèi)容有:面對大數(shù)據(jù)時代的機(jī)遇與挑戰(zhàn),提出現(xiàn)代政府統(tǒng)計(jì)調(diào)查體系改革的思路和建議;結(jié)合我國各類調(diào)查使用的復(fù)雜設(shè)計(jì)、輪換模式,構(gòu)建具體的超總體模型,確定具體的模型輔助廣義回歸估計(jì)的程序和步驟。
2.重要觀點(diǎn)
(1)利用輔助信息進(jìn)行模型識別,構(gòu)建恰當(dāng)?shù)某傮w回歸模型進(jìn)行輔助估計(jì);(2)放寬模型假定條件,將現(xiàn)行的線性回歸估計(jì)拓展到半?yún)?shù)、非參數(shù)估計(jì)的研究范疇,引入校準(zhǔn)估計(jì)等方法改進(jìn)廣義回歸估計(jì);(3)將傳統(tǒng)的一階抽樣估計(jì)擴(kuò)展到復(fù)雜抽樣下的多階估計(jì);(4)研究近似模型無偏和一致的方差估計(jì)量,提高方差估計(jì)效果;(5)在各類實(shí)際調(diào)查中應(yīng)用這一套模型輔助抽樣估計(jì)體系,實(shí)現(xiàn)連續(xù)各期協(xié)調(diào)運(yùn)作,提高估計(jì)效率,全面、準(zhǔn)確地提供抽樣調(diào)查數(shù)據(jù)。
3.創(chuàng)新之處
(1)關(guān)于模型回歸系數(shù)的樣本估計(jì)問題。本項(xiàng)目在估計(jì)回歸系數(shù)時,在主流的加權(quán)最小二乘估計(jì)法的基礎(chǔ)上,綜合利用復(fù)雜抽樣設(shè)計(jì)的包含概率、模型誤差項(xiàng)方差函數(shù)的信息,并校準(zhǔn)樣本權(quán)重,得出更加準(zhǔn)確的模型回歸系數(shù)估計(jì)量,以解決這一重點(diǎn)問題。(2)在連續(xù)性抽樣設(shè)計(jì)下構(gòu)建超總體模型進(jìn)行廣義回歸組合估計(jì)。在連續(xù)抽樣估計(jì)方面,以往主要是應(yīng)用組合估計(jì)法,未考慮建立模型。本項(xiàng)目通過校準(zhǔn)估計(jì)方法,使用現(xiàn)期和過去各期的輔助信息,研究模型輔助下的廣義校準(zhǔn)組合估計(jì)方法,并根據(jù)實(shí)際情況應(yīng)用到各類連續(xù)性樣本輪換調(diào)查中。(3)結(jié)合我國政府調(diào)查的實(shí)際需要,應(yīng)用模型輔助抽樣估計(jì)方法。本項(xiàng)目結(jié)合大數(shù)據(jù)時代的特征,將這一套估計(jì)方法與現(xiàn)行政府抽樣調(diào)查的組織機(jī)構(gòu)、調(diào)查制度、調(diào)查內(nèi)容、調(diào)查指標(biāo)等方面改革相結(jié)合,綜合考慮各方面的制約因素和阻力,在多方博弈中尋求調(diào)查制度與方法的更優(yōu)平衡點(diǎn),提高這套理論方法的實(shí)際應(yīng)用價值。
三 成果的價值
該成果的學(xué)術(shù)價值在于:在借鑒西方國家前沿的抽樣估計(jì)方法研究成果基礎(chǔ)上,進(jìn)行系統(tǒng)性的改進(jìn)和創(chuàng)新,最終形成了一系列較為科學(xué)、合理的模型輔助抽樣估計(jì)方法體系,這套估計(jì)方法體系為我國政府統(tǒng)計(jì)的應(yīng)用研究奠定了扎實(shí)的理論基礎(chǔ)。
該成果的應(yīng)用價值在于:針對我國當(dāng)前政府統(tǒng)計(jì)數(shù)據(jù)質(zhì)量問題,該成果從抽樣估計(jì)的角度進(jìn)行研究,給出一系列模型輔助抽樣估計(jì)方法,在不增加調(diào)查經(jīng)費(fèi)的情況下提高估計(jì)精度和調(diào)查數(shù)據(jù)質(zhì)量,為前沿的模型輔助抽樣估計(jì)方法在我國政府統(tǒng)計(jì)部門的應(yīng)用鋪平道路。