【Pythonで学ぶ】これだけは知っておいた方がいい相関係数のポイント3つ【データサイエンス入門:統計編12】
こんにちは,米国データサイエンティストのかめ(@usdatascientist)です. Pythonで学ぶデータサイエンス入門:統計編第12回です. 今回も前回に引き続き相関係数について書いていきます. 相関係数は,変数…
こんにちは,米国データサイエンティストのかめ(@usdatascientist)です. Pythonで学ぶデータサイエンス入門:統計編第12回です. 今回も前回に引き続き相関係数について書いていきます. 相関係数は,変数…
こんにちは,米国データサイエンティストのかめ(@usdatascientist)です. Pythonで学ぶデータサイエンス入門:統計編第11回です. 前回の記事で2変数間の相関関係を表す指標として共分散を紹介しました. …
こんにちは,米国データサイエンティストのかめ(@usdatascientist)です. 統計編も第10回まで来ました.まだまだ終わる気配はありません. 簡単に今までの流れを説明すると,第1回で記述統計と推測統計の話をし,…
こんにちは,米国データサイエンティストのかめ(@usdatascientist)です. 前回の記事では最も重要な散布度である「標準偏差」を使って,あるデータが分布のどの辺りに位置しているか検討をつけるやり方を紹介しました…
こんにちは,米国データサイエンティストのかめ(@usdatascientist)です. 過去数回の記事で散布度について紹介をしてきました.(散布度というのはデータのばらつき具合を表す指標です.) 第4回:範囲,IQR(四…
こんにちは,米国データサイエンティストのかめ(@usdatascientist)です. 前回の記事で,不偏分散というのは母集団の分散の推定量だという話をし,標本分散\(s^2\)は母集団分散\(\sigma^2\)に比べ…
こんにちは,米国データサイエンティストのかめ(@usdatascientist)です. 前回の記事で,散布度の指標として最も重要な分散\(s^2\)と標準偏差\(s\)を解説しました.NumPyとscipy.statsや…
こんにちは,米国データサイエンティストのかめ(@usdatascientist)です. 前回の記事で「データのばらつきを表す指標」である散布度の必要性を説明しました. 散布度には前回の記事で説明した範囲と,四分位数を使っ…
こんにちは,米国データサイエンティストのかめ(@usdatascientist)です. 前回までの記事で,データを代表する値「代表値」についてみてきました. この代表値を使えば,データ全体がどういう値を持っているのか,な…
こんにちは,米国データサイエンティストのかめ(@usdatascientist)です. 前回の記事で「データ全体の特性を説明する値」である「代表値」で,最も重要な指標である「平均」について触れましたが,平均以外にも代表値…