データ分析の手法の一つです。データの中から機械が学習し、データの中にある規則を発見する方法です。
近年は、その「規則」から様々な予測ができるようになってきました。
前述した通り、機械学習は手法の一つです。
機械学習で規則を学習する方法にもいくつか種類があります。
教師あり学習とは、データに正解を与えた状態で学習させる方法です。
主に、予測や判定として利用されることが多いです。
教師なし学習とは、データに正解を与えない状態で学習させる方法です。
データの特徴からグルーピングさせたり、データに特徴付けをさせることを得意としています。
強化学習とは、機械にデータを与えて学習させる方法です。
教師あり学習とよく似ていますが、機械が自ら試行錯誤しながら学習していくことができます。
機器の故障は、教師あり学習で予測することができます。
では実際に、どうやって教師あり学習をするのか、具体例を用いて説明していきます。
学習とは実際にそのようなことを指すのでしょうか?犬猫判別AIを例に説明します。
様々な種類の犬の画像を「dog」というフォルダに格納します。
猫も同じように「cat」というフォルダに格納します。
これらを学習させます。学習にも様々な分析の手法があります。
例えば、画像のpixel値や白黒の割合等で判断されます。
学習が終わったモデルに対して、学習させていない犬の写真を見せると、これまでの規則から犬か猫か判断できます。
教師あり学習だけではなく、機械学習には「モデル」というものが必要となってきます。
教師あり学習におけるモデルとは、「データに正解を与えた状態で学習を終えたプログラム」です。
モデルに対して、まだ知らない情報を与えたとしてもこれまで学習した内容から、予測して答えを出力します。
故障を予測するには、機器異常時のデータが必要になってきます。
以下のようなものがあげられます。
・機器性能
・稼働時間
・機器異常検知時の操作
・過去の故障履歴
・警告ログ
・故障時期データ
機器の種類によって様々です。
上記のようなデータを学習させて、故障する規則を理解したモデルを作成します。
モデルには、故障までの規則が学習されています。モデルに利用ログデータを渡すことで傾向から故障が発生するであろう時期が出力されます。
より正確な予測結果を求める場合には、新しいデータ、複数のデータ、長期間のデータを使うことが大切です。
機器故障に関しては様々な要因が考えられるため、機器に関する情報が大量に必要です。
データの種類が多岐にわたることによって、規則を見つけ出しやすくなります。長期間のデータがあることで、より精度が上がります。
ログデータの種類が少ない状態での学習は予測精度が低くなります。
人間と同じように、予測をするモデルにも経験を学習させておくことは重要です。
以下のようなものが考えられます
・何をしたときに壊れたのか
・壊れる前に警告はでていたのか
・その時の気温・湿度は?
・機器にかかる圧力はどうだったか?
複数の情報を学習させることによって、規則を見つけ出します。
最新のログデータを用いることで、現時点での稼働時間や使用方法など実際の環境に近づけることが出来ます。
機器によって必要なデータは様々です。
近年ではIoT化が進んでいるため、必要なデータは収集しやすい傾向にあります。
なんのデータを集めれば良いかわからないときは、専門家に相談するのが一番良いでしょう。ティファナでは、データ収集のアドバイスのほかにも、データ選定、整形、予測までサポートいたします。
澁谷さくら(AIさくらさん)
登録・チューニング作業をお客様が一切することなく利用できる超高性能AI。
運用やメンテナンス作業は完全自動化。問い合わせ回数や時間を問わない無制限サポート、クライアントの業務に合わせた独自カスタマイズで、DX推進を目指す多くの企業が採用。