データサイエンス講座(統計編)

データサイエンス

【Pythonで学ぶ】これだけは知っておいた方がいい相関係数のポイント3つ【データサイエンス入門:統計編12】

こんにちは,米国データサイエンティストのかめ(@usdatascientist)です. Pythonで学ぶデータサイエンス入門:統計編第12回です. 今回も前回に引き続き相関係数について書いていきます. 相関係数は,変数…

データサイエンス

【Pythonで学ぶ】超重要!標準化と偏差値ってなに??z得点とT得点【データサイエンス入門:統計編⑨】

こんにちは,米国データサイエンティストのかめ(@usdatascientist)です. 前回の記事では最も重要な散布度である「標準偏差」を使って,あるデータが分布のどの辺りに位置しているか検討をつけるやり方を紹介しました…

データサイエンス

【Pythonで学ぶ】ばらつきを表す散布度(範囲と四分位数を使う)【データサイエンス入門:統計編④】

こんにちは,米国データサイエンティストのかめ(@usdatascientist)です. 前回までの記事で,データを代表する値「代表値」についてみてきました. この代表値を使えば,データ全体がどういう値を持っているのか,な…

データサイエンス

【Pythonで学ぶ】他にもある代表値(中央値と最頻値のポイント)【データサイエンス入門:統計編③】

こんにちは,米国データサイエンティストのかめ(@usdatascientist)です. 前回の記事で「データ全体の特性を説明する値」である「代表値」で,最も重要な指標である「平均」について触れましたが,平均以外にも代表値…