健康データ分析:CDC行動危険因子データは緑色野菜を食べることを推奨

誰もが健康になりたいと考えていますが、その方法については様々な意見や考え方があります。多くの矛盾する食事法、膨大な時間とモチベーションを必要とするルーチン運動など。健康な体と心のために、実際のデータに結び付けて考えることは不可欠であり、とても有益です。

そこで、世界中の統計家やデータアナリストが最適モデルを競い合うプラットフォーム「Kaggle(カグル)」上にあるデータで、CDC(全米疾病予防管理センター)が提供するCDC’s Behavioral Risk Factor Surveillance System(CDCの行動リスク因子監視システム)というデータを調査することにしました。

このデータには、2011年から2015年まで毎年実施した調査に対する40万人以上の個人の回答が含まれています。個人の行動や健康状態に関する何百もの質問に対する回答が含まれている非常に包括的なデータセットです。もちろんデータは非常に膨大で、調査が困難です。そこで、PivotBillionsを使用すると、データセットを簡単にロードおよび拡張し、すぐにデータを理解し、様々な方法でピボットテーブルを作成して傾向を分析することができました。

PivotBillionsの列作成機能を使用して、各個人の果物、フルーツジュース、および緑またはオレンジ色の野菜の摂取量を分類する列を行動危険因子データに追加しました。そして、これらの列のいくつかと健康上の問題による活動制限の量でピボットテーブルを作成することで、緑黄色野菜と果物の摂取量による活動制限の平均値を確認することができました。

今回の40万人以上の調査で、緑黄色野菜や果物を毎日摂取することで健康状態が改善することが示されました。さらに、果物や緑黄色野菜を食べないよりは果物を毎日食べる方が良い、果物より緑黄色野菜を毎日食べる方がよりベターで、最低1日1回緑黄色野菜と果物の両方を食べるのがベストであることが示されました。緑黄色野菜や果物を毎日摂取すると、健康上の課題が40%以上減少するという結果も出ています。

緑黄色野菜とフルーツジュースの摂取量でピボットテーブルを作成すると、それらの影響についても分析することができます。

緑黄色野菜とフルーツジュースは、健康上の課題を約16%減少させ、緑黄色野菜と果物の組み合わせはより効果的のようです。

これらは、PivotBillionsを使用して実施した傾向分析のほんの一例です。このデータセットで様々なことを調査することができます。このファイルをダウンロードして自分で試してみることも可能です。