トップ «前の日記(2010-12-25) 最新 次の日記(2010-12-30)» 編集

十日日記


2010-12-28

Link カテゴリカルデータ解析

今年受講した放送大学「統計学('09)」の教科書がおもしろいという話を以前に書いた。私が想像する統計学教科書の典型的な配列は、確率空間の定義からはじまって確率論と確率分布とが続き、標本分布を経て推定や検定へと移り、回帰分析がどこかに入るというものだ。ところが「統計学('09)」は導入からAICが出てくるし、実質的な内容は二項分布モデルの信頼区間を構成するところから始まる。重回帰分析やロジスティック回帰分析、分散分析、主成分分析や因子分析を扱うなど、実践的にできていた。

カテゴリカルデータ解析 講義で学んだことを利用するために統計パッケージの演習書はないかと思案していたところ、担当講師自身が書籍を出していることを知った。藤井良宣『カテゴリカルデータ解析』(共立出版、2010年)といい、「R出学ぶデータサイエンス」シリーズの第1巻を飾っている。

同書はカテゴリカルデータの解析手法について幅広く述べている。最初の2章でRの基本的な使い方を説明したのち、二元表(特に2×2表)の解析をベースにして、三元表(層別の二元表)に進んだりロジスティック回帰分析(数値が2値の場合)やポアソン回帰分析(数値が頻度の場合)、対数線型モデル(3変数を対等に扱う場合)に進んだりしている。「統計学('09)」で扱っていない話題で同書に含まれるものは、対応分析・決定木・数量化理論だ。判型はA4と大きいが、同書もまた180ページほどの紙幅である。12章立てで章末には練習問題があり、大学の2単位分の講義・演習に適した分量になっている。

同書で知った図示方法に「モザイクグラフ」(Mosaic Plots)がある。少し前に「面グラフ」について触れたことがあったけれども、あれを一般化したものだ。百聞は一見にしかずで、「What is a mosaic plot?」を見たほうが早い。これもRを使うと簡単に描ける。

Tags:
[]


プロフィール

渡辺 慎太郎(na@10days.org)

分野別表示

Admin | Client | Dev | Excel | Linux | PC | PDA | Web | iPad | web | 家電 | 文具 | | 英語 | 言語 | | 音楽

月別表示

1999|07|
2003|05|06|07|08|09|10|11|12|
2004|01|02|03|04|05|06|07|09|10|11|12|
2005|01|02|03|04|05|06|07|08|09|10|11|12|
2006|01|02|03|04|05|06|07|08|09|10|11|12|
2007|01|02|03|04|05|06|07|08|09|10|11|12|
2008|01|02|03|04|05|06|07|08|09|10|11|12|
2009|01|02|03|04|05|06|07|08|09|10|11|12|
2010|01|02|03|04|05|06|07|08|09|10|11|12|
2011|01|02|03|04|05|06|07|08|09|10|11|12|

最近の記事

雨量情報 dictionary.com Yahoo google Yahoo! 路線情報 東京アメッシュ l-mura l-aka l-momo 目次 r-mura r-aka r-daidai r-kiiro asahi.com nogulabo r-sora r-midori r-midori r-momo