応用統計学

アブストラクト


区間値関数データに対する主成分分析法の提案, 21-33

池田智康,小宮由里子,南弘征,水田 正弘

要旨

本研究では,関数主成分分析のシンボリックデータ解析への拡張を扱う. シンボリックデータ解析とは,Didayによって提唱された,データへの新しいアプローチである(Bock and Diday 2000, Billard and Diday 2006). シンボリックデータ解析において,観測値は多値データや区間値データ,モダルデータとして表現され,これらを総称して"シンボリックコンセプト"と呼ぶ. このような様々なデータ表現を用いることで,解析対象である抽象的なコンセプトをより柔軟に表現し,適切なデータ解析を行える利点がある. またシンボリックデータ解析を応用することで,従来の統計的解析方法では扱いにくかった膨大かつ複雑なデータを効率的に解析することができる. シンボリックデータ解析における代表的な手法として区間値データへの主成分分析の適用方法が研究されている. 多様なデータセットに対する別のアプローチとして,Ramsayらが提唱した関数データ解析がある(Ramsay and Silverman 2005). 関数データ解析では,データをベクトルや行列ではなく実関数として表現し,これら関数を直接解析するアプローチである. 仮に観測値が連続的な変化など関数構造をもつ場合,関数データ解析を応用することで,より適切な解析を行うことができる. 本論文では,関数データをシンボリックデータ解析の枠組みへ拡張し,上限関数と下限関数という2つの関数からなる"区間値関数データ"というデータタイプを提案する. そして,このデータに対する主成分分析法,つまり区間値関数主成分分析法について述べる. また,この提案手法を気温データに適用した例を述べ,その結果を考察する.

英文要旨

An Extension of Functional PCA to Interval-Valued Functional Data, 21-33

Tomoyasu Ikeda,Yuriko Komiya,Hiroyuki Minami and Masahiro Mizuta

We discuss an extension of Functional Principal Component Analysis (Functional PCA) to Symbolic Data Analysis (SDA). SDA proposed by Diday is a new approach for analyzing datasets which are too large and complex to handle with conventional methods. In SDA, an observation is represented by symbolic concept including numerical, interval-valued and modal-valued data. Symbolic PCA methods have been studied as dimension reduction techniques, which are mainly applied to interval-valued data. Another approach for a huge variety of datasets is Functional Data Analysis (FDA), developed by Ramsay. In FDA, each data is characterized by real-valued functions, rather than by a vector and/or a matrix whose components are real-values. We can analyze datasets effectively with FDA if observations are identified as discretized functions. We can apply FDA, for instance, to time series, spectrometric data, weather data, etc. In this paper, we introduce an idea of interval-valued functional data with a pair of functions, an upper function and a lower function, and extend an FDA method to the framework of SDA. In particular, we propose an interval-valued functional PCA method based on interval-valued PCA methods. We apply our method to actual data and show its effectiveness.


「2010年第39巻 No.1」目次へ

「応用統計学」総目次へ

「応用統計学」トップへ

「応用統計学会トップ」へ