回帰分析
今までいろいろな記事で線形回帰分析の解説をしたが、この時は最小二乗法を用いたものだった。 最尤法を使ってもできるので、今回はその計算を紹介したい。 以下の4ステップに従って進めていく。 ①データを集める まずは使用するデータを決める。 色んな記事…
以前の記事で回帰分析の信頼区間について解説した。 chemstat.hatenablog.com 今回はこの計算をエクセルのテンプレート化してみた。 エクセルファイルのアップロードははてなブログの仕様上できないようなので、Googleスプレッドシートで公開した。ご自由に…
普段Excelで機械的に処理しているときにはついつい忘れがちだが、回帰分析は「データのx軸成分にばらつきはない」という前提で行っている。 なので本来のx軸は誤差が生じ得ないものか、y軸に対して誤差が無視できるほど精度の高いデータでなければならない。…
重み付き回帰分析というものがある。それぞれのデータに重みを設定し、信頼度の低いデータが回帰の結果に影響を及ぼさないようにする方法である。 存在は知っていたが計算方法を具体的に知らなかったので、勉強してみることにした。 データの準備 とりあえず…
pythonを使った回帰分析について、いくつかライブラリを紹介したのでこの記事にまとめておく。今後なにか増えたらここに追記していく予定。 第一弾scikit-learn LinearRegression。機械学習によく使われているライブラリ。 これはそのうちもうちょっと勉強し…
この記事では行列をつかって単回帰分析を実施した。この手法でほぼそのまま重回帰分析も出来るようなので、ついでに計算してみよう。 データの準備 データは下記のものを使用する。 x(説明変数) 1 2 3 4 5 y(説明変数) 2 6 6 9 6 z(被説明変数) 1 3 4 7 9 過…
統計や機械学習について調べると、行列を使った解説が多数出てくる。何かの役に立つことを期待して行列を使った計算方法も調べておく。ちなみに線形代数がすこぶる苦手なので、計算はpythonに頼りっぱなしである。 データの準備 データはいつものように下記…
この記事ではpythonを使って回帰分析する際のコードをまとめていく。いくつか方法がありそうなので、ライブラリごとに書いていければと思う。 今回はstatsmodels.api編。 コードはこちら。詳細は参考サイトを見て頂ければ。今回もメモ書き程度に残していく %…
この記事ではpythonを使って回帰分析する際のコードをまとめていく。いくつか方法がありそうなので、ライブラリごとに書いていければと思う。 今回はnumpy.polyfit編。 いままでいろいろなライブラリを使ってきたが、numpyにもあったらしい。単純なn時の関数…
この記事ではpythonを使って回帰分析する際のコードをまとめていく。いくつか方法がありそうなので、ライブラリごとに書いていければと思う。 今回はscipy.optimize.minimize編。 curve_fitに比べるとやってることは変わらないし、手間が増えるだけなのだけ…
この記事ではpythonを使って回帰分析する際のコードをまとめていく。いくつか方法がありそうなので、ライブラリごとに書いていければと思う。 今回はscipy.optimize.curve_fit編。 使い方は参考サイトのほうが分かりやすいので、自分用のメモとして残してい…
この記事ではpythonを使って回帰分析する際のコードをまとめていく。いくつか方法がありそうなので、ライブラリごとに変えていければと思う。 今回はscikit-learn LinerRegression編。 検索すると山ほど例が出てくるので、今回は自分のメモ用に簡単なコード…
エクセルの回帰分析で出てくる数字の計算は、前回までですべて終わったのだが、ついでなので、単回帰分析の信頼区間も計算したいと思う。重回帰の際の信頼区間もあるようなのだが、今の私の能力では解説できないので、もうちょっと勉強してから記事にしたい…
エクセルの回帰分析、今回は係数のt検定について計算する。 これまでは、以下のデータを用いて回帰直線の傾きと切片、回帰統計の値、分散分析表を計算してきた。今回の計算でも、平均値や偏差平方和等で今まで計算した値を用いているので、必要であれば参照…
エクセルの回帰分析、今回は分散分析表の値を計算する。 これまでは、以下のデータを用いて回帰直線の傾きと切片、回帰統計の値を求めた。今回の計算でも、平均値や偏差平方和は前回の値を用いているので必要であれば参照してほしい。 (説明変数) 1 2 3 4 5 …
エクセルの回帰分析、今回は回帰統計の値を計算する。 前回は以下のデータを用いて回帰直線の傾きと切片を求めた。今回の計算でも、平均値や偏差平方和は前回の値を用いているので必要であれば参照してほしい。 (説明変数) 1 2 3 4 5 (被説明変数) 2 6 6 9…
エクセルには重回帰分析のツールがあり、解析を行うと下記の表が得られる。 何回も見た表だが、実際これが何を表しているのかよくわからなかったので、調べてみた。一つずつ解説していこうと思う。 データの準備 とりあえず適当にXとYを定めた以下のデータを…
みんな大好き回帰分析。自分の組んだ実験で相関が見れると、賭けに勝ったような気になって幸せな気持ちになる。とはいえ実際は判断が難しかったり外れ点にひきずられたりで解釈に悩む場合が多い。 よく見る回帰直線は下のような形だろう。エクセルで数クリッ…