scikit-learnを使った単回帰モデルによる予測の流れは大きく6ステップに分けられそうです。
- データの下準備
- モデルオブジェクトの用意
- モデルの学習
- テストデータを使った検証
- 検証結果の評価
- 特徴量の調整
ポイントとなる関数や注意点についてまとめました。
noralogは「一歩を踏み出しかねている誰かの背中を押そう」をコンセプトに体験談やハウツーの例をまとめます。
scikit-learnを使った単回帰モデルによる予測の流れは大きく6ステップに分けられそうです。
ポイントとなる関数や注意点についてまとめました。
Pandasを使うなかで、グラフのプロット方法が色々あって混乱していたのですが、そのうちSeries.plot.hist()のようにplotのあとにそれぞれのグラフのプロットを関数呼び出しをするような方法とSeries.plot(kind=”hist”,…)のようにplot関数の引数kindからグラフの種類を選ぶ方法の違いについて理解できたのでメモです。
結論は、違いはないそうです!
Pythonでは
タプル……要素の変更ができない
リスト……要素を変更可能
と区別されます。
numpy.arrayオブジェクトはタプルからでもリストからでも作成できるようです。タプルからarrayをつくったときと、リストからarrayをつくったときの違いがよくわからなかったのでまとめてみました。
二項分布とは、ベルヌーイ試行という試行についてみられる確率分布のことだそうです。
ベルヌーイ試行とは何かというと、「ある現象についてAかBのどちらかが起こる」といった現象のことを言うそうです。
つまりどういうことかというと「コイン投げで表と裏どっちが出るか」といったようなことを指します。
“Pythonで二項分布のグラフをプロットしてみる” の続きを読む
Pythonでpadansを使ってWebページにあるテーブル(表)のデータを拾ってくる手順です。
データはDataFrameとして取得できるので、そのまま加工できて便利そうです。
“PythonでWebサイトから表データを拾ってくる手順” の続きを読む