AIサービス(AI as a Service) - ディープラーニングを利用した非構造化データの利活用推進 -

 AI as a Service(AIaaS)とは、自ら機械学習モデルを作ることなく、画像や音声などの非構造化データからビジネス価値に直結するデータを抽出・変換することができる、企業の情報システムに組み込みやすいエンタープライズ向けAIサービスのことです。AIaaSはデータ利活用推進のための有力な施策として注目されていますが、導入にはいくつか注意したいポイントもあります。

 本記事ではAIaaSについて、誕生の背景や特徴、導入時の注意点などについて詳しく説明していきます。

AIサービス(AIaaS:AI as a Service)とは

 AI as a Service(以下、AIaaS)とは、AI関連サービスのうち、自ら機械学習モデルを作ることなく、非構造化データからビジネス価値に直結するデータを抽出・変換することができる企業の情報システムに組み込みやすいエンタープライズ向けAIサービスのことです。一般的には名称が統一されておらず、「事前トレーニング済みAIサービス」(AWS)、「デベロッパー向けAI」(Google Cloud)、「コグニティブサービス」(マイクロソフト)などと呼ばれることもあります。

 現在、AI関連サービスは多種多様なものがあり、スマートフォンから使えるコンシューマ向けの身近なサービスも多くあります。
 たとえばカメラで写した画像に含まれる植物を検索したり、外国語の文章をリアルタイムに翻訳したりできる、Google Lensなどがあります。また2020年ごろに話題になったDeepLは非常に精度の高い実用的な翻訳ができることが特徴で、グローバルビジネスや言語学習などをはじめ生活に大きく影響を与えているサービスの一つです。

 これらコンシューマ向けサービスをそのまま企業の情報システムに組み込む場合にはいくつか課題があります。
 たとえば、一定期間内の呼び出し数に上限がある、サービスレベルの保証がない、投入データがログとしてサービス(サーバ)側で保存されてしまい適切なデータ保護が行われない、などの課題です。
 これらの課題に対応できるよう、多くのAI関連サービスにエンタープライズ向けの有償プラン・オプションが用意されています。

 注目のウェビナー:大和証券グループで"ChatGPT"を使ってみた

AIaaS誕生の背景

 「データ(情報)はヒト、モノ、カネと並ぶ4大経営資源の1つ」、「データは新時代の石油」、などと表されるように、データは現代の企業経営において重要な要素とみなされており、その注目度はIT技術の革新・スマートフォンの普及・4G/5G高速モバイル通信の登場などにより、ますます高まっています。
 しかし、2010年代前半までは、エンタープライズ用途のデータ利活用は基幹系システムやデータウェアハウス(DWH)が扱えるレベルのデータ量やデータ形式(すなわち構造化データ)にとどまっていました。これは当時、大量かつ多様なデータを扱うためのITインフラやソフトウェアの利用が技術的に難しかったこと、データ分析に関する各企業の理解度・利用度が未成熟であったこと、などによります。

 その中で、Googleをはじめとする巨大IT企業と大学・研究所などのアカデミアは、膨大なデータと優秀な技術者・研究者、そして各種IT技術革新を活用することで、実用的なディープラーニングの研究を加速的に進めていきました。これが第3次AIブームを象徴する出来事の一つであり、2010年代後半にはGoogleなどの巨大IT企業が翻訳、画像検索などのAI関連サービスをリリースし、広く一般に利用されるようになりました。
 一般の企業においてもデータレイクなどデータの重要性を意識した経営戦略・施策が推進・継続されることにより、テキスト・音声・画像・動画データなどの非構造化データが十分に蓄積されてきました。企業がこのようなデータから新しい価値を生み出したいと考えるのは自然な流れです。

 データレイクの詳しい解説を見る:データレイク・DWH - 経営資源であるデータから価値を生み出すためのアーキテクチャ -

 とはいえ、データサイエンティストなどの専門人材が少ない・いない企業では、ディープラーニングモデルの研究開発・実装の内製化をすることは(時には外部委託することすら)、困難です。またデータサイエンス人材育成に取り組んでいる企業であったとしても、人材の育成には時間がかかります。さらには、ディープラーニング自体がまだ成長分野であり、コモディティ化されていないため、個々の企業が最新情報をフォローし、かつ最新技術を実用に取り込み価値を生み出し続けることは大きな労力を要します。
 そのため多くの企業は、AIやディープラーニングに競争源泉をもつ企業がリリースする各種AI関連サービス、特にAIaaSを利用して、自社のデータ(1st party data)を活用するようになっています。

主な特徴

 本記事におけるAIaaSの特徴について、下記に再掲します。

  1. モデル作成が不要
  2. 非構造化データからビジネス価値に直結するデータを抽出・変換
  3. 企業の情報システムへの組み込みが容易

 この特徴について1つずつ解説していきます。

1. モデル作成が不要

 まずはモデル作成の作業が不要であることです。本記事で扱っているような人間の認識・知覚に類似したタスクに対応するAIは、機械学習の中でも高度な技術力、質の高い大量なデータ、大量な計算リソースなどが必要になり、本来そのモデル作成作業は困難であり、また膨大な時間を要します。
 しかし、AIaaSではサービス提供者の作成済みモデルを利用することにより、サービス利用者はその手間を省くことができます。また、モデルのアップデート、メンテナンスはサービス提供者により行われるため、適切なAIaaSを選択することで、最新技術の恩恵を継続して受けられます。

 関連記事:学習済みモデルの活用 -転移学習/ファインチューニングで課題特化型AIを低コストで開発-

2. 非構造化データからビジネス価値に直結するデータを抽出・変換

 2点目の特徴として、元となる音声、テキスト、画像などの非構造化データから価値に繋がるデータ(派生データとも呼びます)を抽出できることです。非構造化データはそのままでは利便性が低いことも多く、AIaaSの利用により、①検索しやすい形にする、②理解しやすい形になる、③使えるシーンが広がる、などのメリットを享受できます。具体例は下表の通りです。

表1. AIaaSのメリット別 機能の例

メリット
サービス機能例
具体例
検索しやすい形にする 自然言語処理(NLP)サービス テキストのキーワード抽出
ドキュメントからの情報抽出 書類の画像から項目・値の抽出(構造化データへの変換)
動画画像分析 どの時間に何が写っているか、誰が話しているかの抽出
文字起こし(STT:Speech To Text) 音声データのテキスト化(NLPサービスとも組み合わせることが可能)
理解しやすい形にする 自然言語処理(NLP)サービス テキスト要約、ポジティブネガティブ判定、トピック分類、自然言語での回答
翻訳 あらゆる言語を日本語に変換
ドキュメントからの情報抽出 手書き文字判定
動画画像分析 動画要約(ダイジェスト)作成、字幕作成
使えるシーンを広げる 翻訳 日本語を利用者に合わせた言語に変換
音声合成(TTS:Text To Speech) データの音声化による音声ユーザインターフェース(VUI:Voice User Interface)の利用

(出所 大和総研作成)

3. 企業の情報システムへの組み込みが容易

 3点目に、企業のエンタープライズ用途として使いやすい特徴があることがあげられます。その具体例について3つ以下に説明します。

開発が容易である

 サービス提供者側が用意しているSDK/APIの利用などにより、エンジニアがコードを数行追加・修正するだけで、AIaaSの機能をサービス利用者側のアプリケーションに組み込むことができます。またディープラーニングモデルを利用するにはしばしば巨大なインフラ資源が必要になりますが、サービス利用者はこの考慮が不要となります。サービス提供者によっては有償サポートなどもあり、問い合わせも可能です。

非機能要件が充実している

 無償版・コンシューマ向けでは稼働率のサービスレベルや、レスポンス性能要件などが保証されていないサービスも多くありますが、エンタープライズ向けとして適切なAIaaSを選択することで、安定したアプリケーションのサービス提供を行うことができます。

コンプライアンス・セキュリティをサービス提供者側が担保している

 エンタープライズ向けであるAIaaSは第三者監査の報告書などが利用者に公開されており、多くの場合、各種業界のレギュレーションに準拠していることをサービス提供者側があらかじめ担保しています。またデータの取り扱いについてもより詳細に確認することができます。たとえば、データの暗号化や地理的所在(どの国にあるか)、受け渡したデータをサービス提供者側が保存する用途・期間、サービスそのもののモデルの学習に利用しないか(流出リスク)、などがあげられます。

導入・検証における注意点

 ここまで紹介してきたAIaaSですが、導入や検証にあたり、いくつかの注意点があります。機械学習・AI関連のプロジェクトや、SaaS利用時と共通する点もありますが、改めて記載します。

1. 非構造化データの調査・収集からはじめる

 まずは「データを集めることが第一歩」ということです。AIaaSのほとんどはテキスト・画像・音声などの非構造化データを使うサービスです。自社のビジネスとそこから発生するデータを整理したうえで、収集・活用の優先度をつけて対応していくことが肝要です。

2. 自社AI活用のシナリオを自分事として考える

 次に「AI活用のシナリオ自体を考えるのはビジネスユーザ自身である」ということです。AI関連のプロジェクトではここも障壁の一つになることがよくあります。しかし、AIaaSについては汎用的な機能・用途に限定されているため、自社のビジネスに適用した際のシナリオ・想定効果を想像・試算することは、一から機械学習モデルをつくるよりは比較的容易であると考えられます。その分導入・利用にかかるリードタイムやコストが抑えられるので、「まず試してみる、早く失敗すればよい(Try Fast, Fail Fast)」という方針でトライアルを進めると良いでしょう。実際に使ってみると、AIそのものと自社のビジネスシナリオとのギャップが、精度や使い勝手などの検証結果として現れるので、それをもとにチューニングやAutoMLなど、AIをより深く活用することの検討に移るとプロジェクトを進めやすいことが多いでしょう。

3. 自社のコンプライアンス要件を満たすかを確認する

 3つ目として「利用規約やサービス仕様を読み込み、自社の従うべきコンプライアンス要件を満たせるかを確認する」ことをあげます。AIaaSはいわゆるSaaSの形態であり、ブラックボックスとなる部分が多くカスタマイズできる範囲は限定されます。提供される情報や、サービス提供者との情報交換などを通して、コンプライアンス要件との適合性を調査しましょう。要件例としては下記などがあります。

  1. 稼働場所(日本国内限定か、国外も許容されるか)
  2. サービス側のデータの取り扱い(保存するか、学習に流用されるか)
  3. サービスレベルが合っているか(稼働率、サポート)
  4. 業界標準に準拠しているか

4. 自社の業界やユースケースに近い垂直統合型サービスを調査する

 最後に「自社の問題を直接解決できる、垂直統合型サービスがあるかを調査し、その活用を検討する」ことです。近年、各サービス提供者は汎用的な機能のみのAIaaSから、業界の具体的な業務課題を解決するAIソリューションサービスを提供することも増えてきています。後者でより実務にマッチするものがあれば、さらにAIの利用は容易になり、その効果も大きくなります。
 たとえばある製造業で、工場の製造ラインにおける品質検査をカメラの画像とAIを用いて自動化したい、というニーズがあったとします。これらは汎用的なパーツであるAIaaSやAutoMLを組み合わせることでも実現可能ですが、開発作業に時間がかかります。一方でこのニーズにそのまま対応できる構成済みAIソリューションサービスが存在することがあります。この例ですと、Amazon Lookout for Visionなどがあげられます。

各社サービスの紹介

クラウドサービスプロバイダ

 各クラウドサービスプロバイダは汎用的なAIaaS一式をサービスとしてラインナップしています。試しに使うには第一候補となるでしょう。

 AIaaSで扱う非構造化データは一般にデータサイズも大きく、実用上はそのデータ転送時間や転送費用などが問題になることがしばしばあります。
 データが蓄積されている場所と、AIaaS、およびそれを用いたソリューション(処理・アプリ)が稼働する場所が同じプラットフォーム上であればその影響を最小限にすることができます。
 この考え方は、データグラビティ(データの重力)と呼ばれることもあります。

 一方で、サービス提供者(クラウドサービスプロバイダ)の視点では、データ関連サービスを戦略的な価格(無料または安価)で提供し、データを自社サービス上に蓄積しやすくすることで、結果としてアプリケーションを含めたユーザの利用が伸びやすくなる、とも捉えられます。
 これは利用者目線で言い換えると、ベンダーロックインとも近い事象です。
 本格的なAIaaSの利用を検討・推進するフェーズでは、AIaaSの性能や使いやすさのメリットだけでなく、そのクラウドサービス上で別アプリを構築・移行する将来も見据えた総コスト(TCO:Total Cost of OwnerShip)の考慮も重要な比較材料の一つとなります。

 以下に各クラウドサービスプロバイダのAIaaSの例を表で示します。(サービス名をクリックすると各社のページが開きます)

表2. AIaaSの製品一覧

サービス説明 Amazon Web Service Azure Google Cloud
自然言語処理(NLP:テキスト) Amazon Comprehend Azure Cognitive Service for Language Natural Language AI
翻訳 Amazon Translate Azure Cognitive Services : Translator Translation AI
ドキュメントからの情報抽出(OCRなど) Amazon Textract Azure Form Recognizer Natural Language AI
動画画像分析 Amazon Rekognition Azure Video Indexer Vision AI, Video AI
文字起こし(STT:Speech To Text) Amazon Transcribe Azure Cognitive Services : Speech To Text Speech-to-Text
音声合成(TTS:Text To Speech) Amazon Polly Azure Cognitive Services : Text to Speech Text-to-Speech
カスタマイズ含めたAI統合開発・構築環境 Amazon SageMaker Azure Cognitive Services Vertex AI

(出所 大和総研作成)

その他各社

 そのほか、特定シナリオ向けのソリューションをもつサービス提供者も存在します。彼らサービス提供者の特徴は、特定の業界・ドメインの経験が豊富であること、AI以外の周辺も含めたシステム実装(SI:システムインテグレーション)や導入を支援してくれる、などがあります。自社の状況も踏まえて、是非検討してみてください。

ドキュメントからの情報抽出(OCRなど)

 「DX Suite」は、AI inside が提供する、あらゆる情報をデジタルデータ化するサービスです。請求書や注文書など、書類からのデータ手入力業務の自動化を実現し、業務効率化・自動化に寄与します。また、カスタマーサクセスとして、「DX Suite」のスムーズな導入・利活用の推進を成功させるオンボーディング支援「Success Program」を提供しています。

 AI-OCRについては、用語解説:AI-OCRで詳しく解説しています。

おわりに

 AIaaS(AI as a Service)は、データ利活用を推進するにあたって有力な施策の一つです。何らかの非構造化データが企業内に存在するのであれば、ディープラーニングの知識がなくても、AIaaSを活用することで派生データを生み出すことができます。まず自社のビジネスと機能が近いサービスを試しに利用して、どの程度自社の実ビジネスの価値を生み出せるかを検証してみましょう。その上で、さらなる利用用途の深堀・チューニング検討や、別の機能を持ったサービスのトライアルなど、次のデータ利活用ステップを検討していくことが成功への近道となります。

関連するウェビナー

ウェビナー|大和証券グループで"ChatGPT"を使ってみた

関連するITソリューション

データ利活用・データ分析基盤構築 | 大和総研

※Amazon Web Service、 Amazon Comprehend、 Amazon Translate、 Amazon Textract、 Amazon Rekognition、 Amazon Transcribe、 Amazon Polly、 Amazon SageMaker、 Amazon Lookout for Visionは、米国および/またはその他の諸国における、Amazon.com、Inc.またはその関連会社の商標です。
※マイクロソフト、 Azure、 Azure Cognitive Services、 Azure Cognitive Service for Language、 Azure Form Recognizer、 Azure Video Indexerは、米国 Microsoft Corporationの米国およびその他の国における登録商標または商標です。
※Google Lens、 Google Cloud、Natural Language AI、 Translation AI、 Vision AI、 Video AI、 Speech-to-Text、 Text-to-Speech および Vertex AI は Google LLC の商標です。