応用統計学

アブストラクト


小標本かつ応答変数発現確率が高い場合のロジスティック回帰モデルにおける回帰パラメータの検定法, 41-51

大倉征幸,鎌倉稔成

要旨

ロジスティック回帰モデルを小標本かつ応答変数発現確率が高い条件下または低い条件下で用いる場合,完全分離または準完全分離が生じていないかを確認することが重要である.完全分離または準完全分離が生じていると,最尤推定量は存在しない.しかし,SAS,S-PLUSやRなどの統計ソフトウェアでは,最尤推定値を求めるため,反復法を実行してしまう.SASやS-PLUSといった商用ソフトウェアでは,完全分離または準完全分離の可能性や反復法が収束しなかったことを警告表示した上で,反復法の結果を表示する.ところが,Rに標準で提供されているglm関数は,最尤推定値が求まっていないにもかかわらず,そのことを明確に表示せずに反復法の結果を表示してしまう.その場合,回帰パラメータ推定値の標準誤差が大きくなるので,事後的にも標準誤差から完全分離または準完全分離を確認できることを示した.Firth(1993)は,最尤推定量のバイアスを取り除く方法を提案しており,結果として,完全分離または準完全分離が生じていても,回帰パラメータの推定が可能となり,回帰パラメータ推定値の標準誤差を用いてWald検定が可能である.しかし,最尤法またはFirth法によるWald検定は,小標本かつ応答変数発現確率が高い(または低い)条件下で用いると,第一種過誤の確率が過度に保守的となる.本論文では,完全分離または準完全分離に近い状態となりやすい,小標本かつ応答変数発現確率が高い条件下において,回帰パラメータの検定をブートストラップ法を用いて検定する方法を提案し,帰無仮説の下で第一種過誤の確率をシミュレーションによりWald検定と比較する.ブートストラップ法を用いた検定は,小標本かつ応答変数発現確率が高い条件下で,保守的となる第一種過誤の確率を改善し,回帰パラメータの検定に有用であることを示した.

英文要旨

Test for a Regression Parameter in a Logistic Regression Model Under the Small Sample Size and the High Event Occurrence Probability

Masayuki Ohkura and Toshinari Kamakura

When a logistic regression model is used under a small sample size and a high or a low event occurrence probability, it is important to confirm the existence of the complete or the quasi-complete separation. If the complete or the quasi-complete separation exists, a maximum likelihood estimator cannot be obtained. However, some statistical softwares such as SAS, S-PLUS or R execute an iteration method to obtain a maximum likelihood estimate. Commercial softwares present a result of the iteration with a warning message regarding the existence of the complete or the quasi-complete separation, or failing in convergence of the iteration. However, glm function implemented in R presents the result of the iteration with regard to the maximum likelihood estimate in spite of failing in convergence of the iteration. In this case, a standard error for the regression parameter estimate is very large. We show that it is possible to confirm the existence of the complete or the quasi-complete separation from the standard error for the regression parameter estimate. Firth (1993) suggested a method to eliminate a bias of the maximum likelihood estimator. As a result, Firth's method can estimate the regression parameter under the complete or the quasi-complete separation and it is possible to use Wald test using the standard error for the regression parameter estimate derived from Firth's method. However, Wald test using both the maximum likelihood method and Firth's method is very conservative under the small sample size and the high (or the low) event occurrence probability. The aim of this paper is to suggest a test for the regression parameter using the bootstrap method instead of Wald test under the small sample size and the high event occurrence probability that tends to near the complete or the quasi-complete separation. Under a null hypothesis, the probability of the type I error in the proposed method is compared with that in Wald test. We show that the proposed method for the slope parameter improves the type I error and assures the prescribed α significance level under the small sample size and the high event occurrence probability.


「2011年第40巻 No.1」目次へ

「応用統計学」総目次へ

「応用統計学」トップへ

「応用統計学会トップ」へ