概要
今回の5 Minites Analysisでは、世界中の統計家やデータアナリストが最適モデルを競い合うプラットフォーム「Kaggle(カグル)」上のデータセットの1つであるKaggle historical Olympic athletic data の分析を行いました。オリンピックへの参加傾向を男女別に時系列で把握するため、様々な方法を用いてデータをフィルタリングし、ピボットテーブルを作成しました。
手順
1.データをロードしてその構造を確認する
データをロードする手順については5 Minites Analysis:ロサンゼルスの健康条例違反の分析をご覧ください。
2.データを閲覧し探索する
データをインポートすると、合計27万1116行のデータを閲覧することができます。Sex(性別)の棒グラフアイコンをクリックすると、男女別に集計されたデータがグラフで表示されます。これを見ると、男性の参加者は女性の3倍近いことが分かります。
データをインポートすると、合計27万1116行のデータを閲覧することができます。Sex(性別)の棒グラフアイコンをクリックすると、男女別に集計されたデータがグラフで表示されます。これを見ると、男性の参加者は女性の3倍近いことが分かります。
3.ピボットテーブルを作成して調査結果を報告する
もう少し深く分析するために、ピボットツールを用いてデータを再編成しました。まずはピボットツールを選択して開き、次いでピボットテーブルのディメンション(分析軸)として「Sex」(性別)、「Year」(開催年)、「Season」(夏季または冬季)を選択します。分析の出発点として、Sexディメンションを行領域に配置します。そしてSeason、次いでYearをドラッグ&ドロップすると、興味深い傾向が見て取れます。
もう少し深く分析するために、ピボットツールを用いてデータを再編成しました。まずはピボットツールを選択して開き、次いでピボットテーブルのディメンション(分析軸)として「Sex」(性別)、「Year」(開催年)、「Season」(夏季または冬季)を選択します。分析の出発点として、Sexディメンションを行領域に配置します。そしてSeason、次いでYearをドラッグ&ドロップすると、興味深い傾向が見て取れます。
全体としては、夏季オリンピックは冬季よりも男女の参加者数の差が大きいことが分かります。また、Yearを列の領域に追加すると、男女の参加者数が平等に近づいていることが分かります。Seasonでフィルタリングして「Line Chart」(折れ線グラフ)を選択すると、夏季オリンピックは冬季オリンピックによりも急速に男女平等に近づいていることが分かります。
まとめ
このように、オリンピックへの参加者数は回を重ねるごとに男女平等に近づいています。近い将来、男性アスリートよりも女性アスリートの方が多くなる可能性があります。実際、2016年のリオデジャネイロでは、米国チームの女性アスリートは男性より多く参加していました。米国は歴史的に他のどの国よりもはるかに多くのアスリートをオリンピックに輩出していますので、十分考えられることです。