栄養イノベーション専攻
データサイエンス教育研究室
山田 耕太郎 教授
ちょっとデータサイエンス~日常の問題をデータサイエンスで解決しよう!~
栄養データサイエンス領域の授業を少しだけ紹介します。ここでは主成分分析をやってみましょう。
例えばあなたが女子会のお店選びを任され,インターネットで10件の候補をピックアップしたとします。各お店にはクチコミの評価があり,それをまとめると次の表のようになりました。
さて,あなたはどのお店にしますか?こんなときに役立つのが主成分分析です。この分析はExcelでやろうとするととても大変なのですが,プログラミングするとアッと言う間に次のようなグラフを得ることができます。
お店の評価項目は「美味しい」「かわいい」「サービスが良い」の3つですが,主成分分析すると2つの評価項目にまとめてくれます。今回の場合は「美味しい」と「サービスが良い」をひとまとめにした項目(第一主成分)と「かわいい」の項目(第二主成分)で,それをグラフにすると次のようになります(矢印は筆者が加筆しました)。
このグラフは,左にいくほど「料理が美味しくてサービスの良いお店」,下にいくほど「かわいいお店」がプロットされているということになります。クチコミの表を見ながお店を選ぶよりも分かりやすくなったのではないでしょうか?
先生からヒトコト
このように,一見して分かりにくいデータを分かりやすくまとめることができると,問題解決や意思決定の際にとても役立ちます。あなたもデータサイエンスで世の中の問題解決に貢献しませんか。