統計ソフトとアンケート法のお話2001/06/18

本田整形外科クリニック 本田忠


はじめに
 統計は基礎統計、多変量解析に大きく分かれますが、データ解析をする時は、当然必要なものです。ネット上で流通しているソフトのうち、代表的なものをあげておきます。

データ解析の実際
 最近、学会の仕事で、全国の、会員の先生方から、アンケートを取る必要があり、その集計と解析を、簡単にするには、どうすればよいかという課題を与えられました。全国区ですし、会員数が多いので、従来の紙ベースで行えば、枚数も多い。集計作業も大変である。再打ち込みによる、間違いも多い。郵送費もかかる。時間もかかる。できるだけ、経費と事務作業量を減らしたいという、ご要望です。

データの発生源入力(ネットでアンケートを集計し、解析を行う)
 データを作成する先生(アンケート協力者)から、ネット上のアンケート集計のデータベースに、直接入力していただくのが、最も簡単です(データ発生源入力)。間に介在する方が多ければ多いほど、間違いや無駄が多い。またアナログデータでは、郵送費などのコストもかかる。

先ずは、「アンケート解析専用メーリングリスト」を立ち上げる。ここは解析者の相互連絡用です。また、アンケート協力者募集は、会員専用のメーリングリストで、行います。
 ネット上のホームページに、データ入力用のデータベースを公開し、各自ネットから、直接、各項目を、打ち込むようにします。しかしダイアルアップ環境で、データ量が多量で、入力に時間がかかるような方は、csvファイルか、エクセルファイルで、直接送っていただく(郵送やメール)こととしました。現時点では初心者も多いし、まだ回線スピードも遅い方もいる。入力方式は、デジタルであれば、データの互換性が確保されてさえいれば、どの方法で入力しても良いと思います。過度期ですから、いろんな入力方式を用意する。あくまでも会員のニーズにこたえる。
 結果は、ネット管理者が、まとめてCSVファイル(データ区切りがカンマ)で、解析連絡用メーリングリストに流す。
 解析者は集計結果データをエクセル等に取り込み、データ編集と加工をする。ついで統計解析をする。結果はhtml形式にして、グラフを多用して、会のホームページに載せる(プレゼンテーション)というシステムを考えました。この方式はアンケート協力者が、インターネットに接続さえされていれば、どこからでも、安価に時間も空間も関係なく入力できるのがメリットです。また事務局への負担が少ない(関与しないでもすむ)。


必要なソフトの種類
1)ホームページとメーリングリスト
 ネット上で公開出来る、データ入力用のデータベースのソフトと、会全体のメーリングリスト(ネット上には私の所属する会の15%程度の会員数。これは日々増加中です。ネット会員数は多ければ多いほど、数多くデータは集まる)。解析者間の連絡専用メーリングリスト(数名程度)が必要です。質問や討論もすべてネット上で行う。
2)集計用ソフト
 単なるアンケートといっても、内容は多岐にわたり、項目も多い。データの形式も数値から、文字まで多様です。集計ソフトでは、まずはネットから、集まってきた、データ(CSVファイル)を取り込めて、自由に削除や分類、変更等の、データ編集機能が充実したソフトでないといけません。これは解析する先生の御希望もあり エクセルがよいかと思いました。エクセルならデータの取り込みも簡単ですし、グラフ作成もできる。それらをhtml形式(ホームページ)に変更することも簡単にできる。
3)統計ソフト
 データ編集をエクセルでするなら、統計ソフトはエクセルをベースとするものが便利です。またエクセルからあるいはcsvファイルから、データを取り込めないといけません。

統計の基礎
統計学自習ノート
医用統計・保健統計学

エクセルで統計を
EXCELで統計を
1)エクセル統計、社会情報サービス統計調査研究室。フリーソフト
SSRI統計WEB
 基本統計、推定検定、分散分析、時系列分析、多変量解析の各手法を網羅した統計解析アドインソフトです。記述統計量 、相関分析、t検定、welch検定、t検定(対応あり)、独立性の乗検定、分散分析、wilcoxon検定、 kruskal-wallis検定・friedman検定、カイ自乗検定・yates補正・連関係数・直接確率。
多変量解析
重回帰分析、主成分・因子分析、判別分析、数量化1類、数量化2類、数量化3類など
2)JSTAT for Windows
Windows98 Windows95 WindowsNT、フリーソフト、著作権者:佐藤 真人(医師)
 エクセルなどで整理されたデータをそのままの形で貼り付ければ、各種統計計算や統計グラフ作成を行ってくれる。
 基本統計量の計算、度数分布表、等分散のF検定、Bartlett検定、対応のあるt検定(検出力の計算も行います。)、対応のないt検定(検出力の計算も行います。)、Wilcoxonの符号付順位和検定、Mann-WhitneyのU検定、分散分析、カイ2乗検定、Kruskal-Wallis検定、Friedman検定、回帰直線、回帰曲線、Fisherの直接確率計算法、Spearmanの順位相関係数、Kendallの順位相関係数、Thompson棄却検定、Grubbs-Smirnov棄却検定、ヒストグラム、散布図などのグラフ作成、乱数表の作成。
多変量解析;重回帰分析、主成分分析、判別分析
3)KyPlot(カイプロット) Windows3.1(16ビット版)、95/98/MeおよびNT/2000,著作権者;吉岡 耕一
KyPlotはデータの解析、グラフの作成、作図用のアプリケーションです。
統計:基本統計量、独立性検定、t-テスト(一群、二群対応なし、二群対応あり)、ANOVA(一元配置、二元配置反復なし、二元配置反復あり)、ノンパラメトリック検定(Mann-Whitney、Wilcoxon、Kruskal-Wallis、Jonkheere、Friedman反復なし、Friedman反復あり、二群のKolmogorov-Smirnov検定)、多重比較(Tukey-Kramer、Dunnet、Steel-Dwass、Steel)、単回帰分析、重回帰分析、標準線アッセイ、 多項式回帰
多変量解析:主成分分析、因子分析、判別分析、クラスター分析、正準相関分析
生存時間解析:Weibullモデル、比例ハザードモデル(Cox回帰)、Kaplan-Meier法、生命表法、二群の生存分布の比較
Excelのファイルやテキスト形式のファイルも読み込めます。
グラフの種類と機能
二次元グラフ
 折れ線、散布、面、棒、重ね棒、円、レーダー、極座標、バブル、三角グラフ、および表、イメージ、等値線(コンター)グラフ
三次元グラフ(32ビット版のみ)
表層、等値線(コンター)、柱状、棒、重ね棒、Waterfall(滝型)グラフ、折れ線、散布

その他のソフト
1)PasTAN for Windows シェアウェア 4,000円、著作権者 澤口俊之
 データがワークシート形式で表示されるため、表計算ソフトと同様の感覚で操作できる。平均や分散、中央値といった基本統計量はもちろん、U-テスト、重回帰分析、一元配置分散分析など20種類の統計テストが可能。 ファイルはCSV形式やテキスト形式に対応し、Excelなどの表計算ソフトとはクリップボード経由でデータをコピー&ペーストできる。なお、実行にはVB6のランタイムが必要。
2)リンク集
 以下がよくまとまっております
2−1)統計 ソフト ・ データ に 関する 情報
2−2)フリーの統計解析プログラム
2−3)統計 ソフト ・ 統計 学習 用 データ

市販のもの
日本における代表的な統計解析ソフトをご紹介します。
[統計解析支援ソフト]
エクセル統計2000 株式会社 社会情報サービス
スプレッドサーチ 株式会社 社会情報サービス
SAS 株式会社 SASインスティチュートジャパン
SPSS エス・ピー・エス・エス株式会社
Stat View 株式会社 ヒューリンクス
STATISTICA スタットソフトジャパン株式会社
JUSE-QCAS/MA 株式会社 日本科学技術研修所
S-PLUS 株式会社 数理システム
[アンケート集計ソフト]
秀吉シリーズ 株式会社 社会情報サービス
[フリーアンザー分析ソフト]
トレンドサーチ 株式会社 社会情報サービス
[グラフ作成ソフト]
The Graph 株式会社 アイフォー
[プレゼンテーションソフト]
Power Point マイクロソフト株式会社

まとめ
 統計はさすがに安いものから、高額のものまで多数あります。昭和50年代ごろには、雑誌にのっていたBasicの統計プログラムを動かして、バグ取りをしながら使っていたことを思い出しました。今はネットで何でも手に入る。便利な時代になったと感心します。

参考文献
1)論文作成の英養素
英語論文作成をサポートする論文作成の英養素
2)窓 の 杜 - オンライン ソフトで 卒業 論文 を 完成させよう