応用統計学

アブストラクト


生存時間研究におけるルール・アンサンブル法の開発, 45-63,

下川敏雄、辻光宏、後藤昌司

要旨

がん臨床研究の一つの目標は,背景因子,進行程度,あるいは遺伝子情報などから予後を適切に予測することである.近年,高い予測確度をもつアンサンブル学習法の生存時間研究への拡張が報告されている (Ishwaran et al., 2008 ; Rigeway, 2007).しかしながら,これらの方法では,推定されたモデルをブラック・ボックス化するため,予後に対する樹木モデル(基本学習器)の影響を提示できない.本論文では,Friedman \& Popescu(2008)を生存時間解析に拡張した生存時間ルール・アンサンブル法を提案した.生存時間ルール・アンサンブル法は,ルール(基本学習器)の真偽に対するハザード比をElasticNet罰則法により推定された回帰パラメータ(ルール重要度)により提示できる.また,基本学習器に修正線形項を加えることができるため,真のモデルが線形構造をもつ場合にも対処できる.生存時間ルール・アンサンブル法の適用は,文献事例により評価した.性能の評価は,数値検証を通して,既存の生存時間アンサンブル法(生存時間RandomForest法,一般化Boosting法,生存時間Bagging法) と比較した.その結果,生存時間ルール・アンサンブル法は,ルール重要度を通してモデルに影響を与える基本学習器を評価できただけでなく,既存の生存時間アンサンブル学習法に比べて予測確度が向上することが確認できた.

英文要旨

ADevelopment of Rule Ensemble Method for Survival Data

Toshio Shimokawa, Mitsuhiro Tsuji and Masashi Goto

An important theme in survival analysis is the investigation of prognosis factors that affect survival time. The tree-structured method has been applied to evaluate covariates;however, this method apparently has poor predictive outcomes. This problem may be improved by modeling many trees in a linear combination, as carried out in ensemble learning. The ensemble learning method has been actively studied in machine learning and statistics. Recently, several ensemble methods have been extended to ensure right-censored survival outcomes. Ishwaran et al. (2008) proposed the random survival forest method, which is constructed using a committee of many survival trees based on logrank statistics or Harrell's C index. Ridgeway (2008) extended the multivariate additive regression trees (MART) method using the framework of the generalized linear model. Since these ensemble methods construct models having a "black box" nature, the models are difficult to intercept. Friedman and Popescu (2008) proposed the rule ensemble method, in which nodes of tree models are used as base learners. In this paper, we propose the newly developed rule ensemble method to analyze survival data, namely the survival rule ensemble method. The usefulness of the survival rule ensemble method is illustrated by a practical example in oncology data. By carrying out small-scale simulations, we found that the survival rule ensemble method showed better predictive performance compared with existing ensemble methods for survival outcomes.


「2013年第42巻 No.2」目次へ

「応用統計学」総目次へ

「応用統計学」トップへ

「応用統計学会トップ」へ