概要 Data.govは米国政府が提供するオープンソースデータで、農業、教育、財政、健康、科学などに及ぶ広範な興味深い情報を多数提供しています。現在、20万以上のデータセットがリスト化されています。 5 Minute A […] continue reading »
Category: All
バスケット分析による売上の最大化
販売データ分析は、あらゆるビジネスにおいて有益です。一般に公開されることはめったにありませんが、ある小売チェーンが、2018年に、世界中の統計家やデータアナリストが最適モデルを競い合うプラットフォーム「Kaggle(カグ […] continue reading »
Amazonレビューにおける詐欺の可能性を探る
Amazonは、その多様な品揃えや製品レビューなどにより、米国のみならず世界で最も人気のあるマーケットプレイスの1つとなっています。しかし、これらのレビューはどの程度正確なのでしょうか。 Amazonのセラーやその競合相 […] continue reading »
15億件のニューヨーク市タクシーデータからみえたライドシェアの成長
「データの時代」多くのデータセットが作り出され、それぞれのデータが膨張し続けています。個人データ、オープンデータに関わらず、世界中の個人や組織が、大量のデータから膨大な量の情報や洞察を得られる環境が整いつつあります。 例 […] continue reading »
米国疾病予防管理センターのデータ分析:屋内活動と屋外活動のどちらに効果があるか
運動行動と健康改善との関連性を理解するために、PivotBillionsを使用してCDC(米国疾病予防管理センター)の行動危険因子データを分析 運動行動と健康改善との関連性を理解するために、世 […] continue reading »
20億件のWebログをリアルタイムに解析
データ管理はますます難しくなってきています。管理するデータの種類が増えれば増えるほどデータは大きくなり、分析しづらくなります。 例えば、Adobe Analytics(旧SiteCatalyst)で収集したWebログを使 […] continue reading »
通貨取引モデル:4ヶ月で実質純利益150%以上の増加を達成
PivotBillionsとRを使用した手数料支払い後の収益性の高い通貨取引モデルの開発 一貫し […] continue reading »
サンフランシスコはサイコパスだらけの街なのか
サンフランシスコは、約47平方マイルの面積に80万人以上の人口を持つ米国で最も人口の多い都市の1つです。このレベルの人口密度の都市は、治安を確保するためにレベルの高い警戒活動に取り組む必要があります。 サンフランシスコが […] continue reading »
5 Minites Analysis:ロサンゼルス市のWebサイトトラフィックの分析と、Googleアプリストアのセンチメント分析
概要 今回は、世界中の統計家やデータアナリストが最適モデルを競い合うプラットフォーム「Kaggle(カグル)」で見つけた2つの異なるデータセットを取り上げて、PivotBillionsによる2つの簡単な分析を行いました。 […] continue reading »
ハイテク、工学、科学における男女格差の可視化
ハイテクや科学の分野において女性の参加を増やすため、様々な改善や改革が行われています。しかし、具体的にどこが改善されているのでしょうか。国全体として男女平等が進んでいるのでしょうか、また改善は地域によって差があるのでしょ […] continue reading »