AIモデル(機械学習モデル)とは、入力データの分析から評価結果の出力までの処理を具体的な計算式で記述したものです。
本記事では、AIモデルの定義や種類について解説します。
AIモデルとは
AIモデル(機械学習モデル)とは、入力データを分析して、評価した結果を出力するまでの一連の処理を具体的な計算式で記述したものです。
AIはデータ分析を行うために、「アルゴリズム」を用いて、膨大なデータから傾向や特徴を抽出します。アルゴリズムは、後述する「教師あり学習」、「教師なし学習」、「強化学習」の3種類に分類することができます。目的に応じて最適なアルゴリズムを選択し、AIモデルを構築する必要があります。
精度の高いAIモデルを構築するためには、データ収集時のデータの質と量、AIモデル構築時の最適なアルゴリズムの選択、AIモデル構築後の継続的な精度検証・チューニング作業が必要になります。
AIモデルの種類
AIモデルは、図1のように分類することができます。
教師あり学習
教師あり学習には、連続値の予測を行う回帰モデルと与えられたクラスごとにデータを識別する判別モデルがあります。「結果」とのその「要因」の関係性は、その関係性を示すデータが事前に大量に与えられることでパターンとして学習することができ、未知のデータが発生した際には、どのような「結果」となるかを予測することができます。
機械学習の分野では、「結果」はターゲットや教師ラベル、目的変数などと呼ばれます。また、「要因」は特徴量や説明変数などと呼ばれます。教師あり学習は、このターゲットと特徴量をペアとして持つデータを基とした機械学習のことです。
回帰モデル
ターゲットが量的データ(連続値)の場合、回帰モデルを採用します。たとえば、企業業績の予測を行う場合、回帰モデルを使用することが考えられます。売上金額をターゲットとし、その売上げの変動には、為替や設備投資、マクロ指標などに加え、ニュースやアナリストレポートなどのテキスト情報も特徴量となることが考えられます。
回帰モデルの学習データの例は、図2の通りです。各銘柄レコードの特徴量には、売上げや利益などといった情報が考えられます。ターゲットは、それらの情報が公開された一定期間後の株価です。
判別モデル
ターゲットが質的データ(クラス、カテゴリー)の場合、判別モデルを採用します。与えられたデータを複数のクラス(カテゴリー)に分類するためのモデルです。
多くの判別モデルは、各クラスの予測確率を出力します。そのため、予測結果として質的なクラスが必要な場合は、適切な確率の閾値を設定し、予測確率から予測クラスを算出します。ビジネス目的によっては、予測確率をスコアとして使用する場合もあります。たとえば、銀行の与信業務では、審査対象となる顧客の一定期間後のデフォルト確率を予測する与信モデル(判別モデル)が作成できます。このモデルを活用し、予測確率に閾値を設けて融資の自動審査や予測確率(スコア)に応じた融資枠の決定を行うことが考えられます。
モデル構築にあたり必要となるデータの例は、図3の通りです。各顧客レコードの特徴量は、年齢や性別、収入などといった情報が考えられます。ターゲットは、過去に審査した顧客が融資を受けた一定期間後のデフォルト発生有無です。
教師なし学習
教師なし学習は、ターゲットが事前に決まっていない特徴量のみを持つデータについて、その特徴量の傾向を学習しモデル化する方法です。
教師なし学習には、クラスタリングやAnomaly Detection(教師なし学習による異常検知)などの手法があります。
クラスタリング
似た特徴量を持つデータをグルーピングする手法をクラスタリングと呼びます。ビジネスへの活用の場面では、グルーピングした結果から、グループ(クラスタ)ごとに施策を検討し役立てます。たとえば、銀行のリテール部門であれば、顧客の年齢や年収といった基本情報に加え、顧客の子どもの人数や年齢、住宅ローンの融資状況などの情報を使用してクラスタリングを行い、類似する顧客グループごとに適切な資産運用の方法を提案することができます。
クラスタリングには、階層的クラスタリングと非階層的クラスタリングの2種類があります。階層的クラスタリングは、与えられたデータとクラスタとの関係性を階層構造化することができます。この関係図をデンドログラムと呼びます。事前にクラスタ数が決まっていなくても、デンドログラムを見ながら事後でクラスタ数を設定することができます。
下図は、デンドログラム作成によるクラスタ数設定のイメージです。与えられたデータを階層構造化し、分析者は可視化された樹形図を見ながら適切なクラスタ数を6つと判断し決定しています。
一方、非階層的クラスタリングは、最終的に作成したいクラスタ数があらかじめ決まっている場合に採用します。代表的な手法はk-means法です。作成したいクラスタ数と初期値を与え、座標上近いデータ同士をまとめます。階層的クラスタリングよりも計算量が少ないという利点がありますが、学習の度にグルーピングの中身が変わる可能性があり、計算時に与える初期値を複数使用するなどの工夫が必要となります。図6は、3個のクラスタにクラスタリングした結果です。
Anomaly Detection(教師なし学習による異常検知)
機械の故障、不正な取引など、異常を知らせる機能はいろいろな場面で必要とされます。ある閾値を超えた状況を異常と定義するとき、これを知らせるプログラムは簡単に作ることができます。しかし、CPUの稼働、メモリの使用量、ディスクアクセスなど、あらゆる活動データが複雑に絡み合っている場合、異常はそのときどきで異なるものとなり、定義が難しくなります。
Anomaly Detection(異常検知)には、教師なし学習と教師あり学習の双方のアプローチがありますが、異常な挙動が多種多様なものである場合、教師なし学習による異常検知がしばしば採用されます。
教師なし学習による異常検知として、株式の不正な取引を検知する東京証券取引所(日本取引所グループ)の例があります。東京証券取引所では2018年3月に、売買審査業務にAIを適用開始したことをアナウンスしました。ここでは、過去の異常性がないと仮定された取引データを学習し、このパターンから著しく異なる出来高や株価推移を異常と検出し、アラートを出力する仕組みが導入されていることが考えられます。
引用(「AIモデルの種類」以降):大和総研フロンティアテクノロジー本部 『エンジニアが学ぶ金融システムの「知識」と「技術」』 翔泳社 2019年01月24日 p86-p91 ※「AIモデルとは」章を本サイトで追記