【Python】 機械学習の前処理その4 テストデータを分割しロバスト性を上げる ホールドアウト法の使い方
- 2021.08.09
- scikit-learn, 前処理, 機械学習
機械学習アルゴリズムを評価する基準の一つにロバスト性(頑健性)という指標があります。ロバスト性とは、外れ値、飛び値や、運用時にテストデータと異なる傾向が出た場合にも、間違った予測をしにくい性質のことです。本記事では、データの傾向変化に対するロバスト性を向上する方法として、ホールドアウト法をご紹介したいと思います。
ITエンジニアが趣味で勉強したことを書き綴ります。PythonとMT5用言語のMQL5についての記事多めです。
機械学習アルゴリズムを評価する基準の一つにロバスト性(頑健性)という指標があります。ロバスト性とは、外れ値、飛び値や、運用時にテストデータと異なる傾向が出た場合にも、間違った予測をしにくい性質のことです。本記事では、データの傾向変化に対するロバスト性を向上する方法として、ホールドアウト法をご紹介したいと思います。
まえがき 機械学習ははただデータをAPIに投げ込めばできるというものではありません。良い結果を得るためには、データをそのまま使うのではなく、効率的に学習できるように加工する必要があります。必要な加工はデータの特性や機械学習で知りたい情報によっても異なります。ですので、適切なデータ加工を行うことはエンジニアの腕の見せ所ともいえるわけです。本日はそんなデータ加工の方法の中で、最もよく使われる規格化と […]
pythonで機械学習を行うとき、必ずと言ってよいほど使用されるのが、scikit-learnというライブラリです。 scikit-learn を使いこなすために、目的にあったアルゴリズムを選ぶための基準となるCheatSheetというものが用意されています。今回はこの CheatSheet を紹介してゆきます。 まえがき scikit-learnは数多くの機械学習のアルゴリズムを簡単に実装でき […]