「AIエージェント元年」を振り返る・現時点で最も『がっかりしない』AIエージェント導入手法

RSS

2026年01月22日

  • フロンティア研究開発センター フェロー 坂本 博勝

2025年は、「AIエージェント元年」だったと言われている。
私自身、2025年3月のコラム(※1)でそのように書いた。2024年に広まったAIエージェントというコンセプトが、2025年には企業導入のフェーズに至るだろうと、誰もがそのように感じていた。

2026年に入った今、振り返って見るとどうだろうか。
2025年、確かに非常に多くの企業が、AIエージェントの自社導入を検討し試行していた。その姿を実際に見てきた。
しかし、『AIエージェントのビジネス適用に成功した』と躊躇なく言い切ることができる企業は、「AIエージェント元年」にしては数が少ないと感じないだろうか。非常に多くの企業が、検討に着手しPoCも推進したが、その中で本当に実務での定常的な『成功』と言える地点に手が届いた企業は、非常に非常に少ないと評価している。
「AIエージェント元年」の実態は、【AIエージェント着手元年】だった。

なぜこのような状況になっているのだろう?
AIキャリア20年弱である筆者の視点では、複数の理由をあげて長く語りたくもなるのだが・・・
このコラムではシンプルな視点に焦点を絞ろう。
最大の理由は、「AIエージェントへの期待」に、「AIエージェント技術の現時点での実力」が、追いついていないからだ。

2025年、誰もがAIエージェントの夢と期待を『あおった』。
・AIエージェントは、従来のソフトウェアやRPA(※2)とは違って、ルールによる決定論的動作原理を超え、明示的に指示していない文脈や行間を踏まえた、汎用的で柔軟な判断と動作が可能です。
・うちの会社のAIエージェント製品を使えば、タスクの背景、経緯、目的を伝えるだけで、具体的な実現方法を事細かに教えなくとも、適切な判断をAIエージェントが自分で行い、複数の手順を自律的に遂行して、目的を果たしますよ。
欧米のビッグAIベンダー各社も、国内大手IT各社も、スタートアップ各社も、みんなこぞってこのような生成AIのストロングポイントを宣伝した。
そして世界中のビジネスパーソンが、『昨今のAI技術の進歩はものすごく早いから、そんな素晴らしいこともできるんだろうなあ』と解釈した。AIエージェントへの高い期待が現実的だと、根拠なくイメージ先行で信じた。
技術の実態と根拠から分断された宣伝とイメージが、AIエージェントの夢と期待をあおり、現実とは異なる幻想を、現代ビジネスパーソンの常識に昇華させてしまった。

例えばまさに今、多くのビジネスパーソンが、『今のAI技術なら、3名の出席者にそれぞれスケジュールを聞いて、設定した値段帯のレストランを予約するくらい、わけなくできるでしょ』と、信じて疑わないのではないだろうか。
ITベンダーにもできるかできないか聞いてみよう。『ぜんぜんできますよ』と、答えが返ってくるはずだ。
それならば、実際にこのようなレストラン予約エージェントを、AIエージェント製品上で実装してみよう。
やってみればすぐに分かるはずだ。3人のスケジュール重複が少なく、空き日程が多くて、かつ1軒目のWeb予約操作で予約が成立するような、【スタンダードなケース】では、AIはなんとかつまずきながらも期待に応えるだろう。
しかし、スケジュール重複が多かったり、レストランWeb予約操作の場面で1軒目、2軒目と希望の時間が空いていなかったりする、【ちょっとしたイレギュラーを含むケース】に触れると、とたんに成功シーンが見られなくなる。
自分の手元でできる最良に近いAIエージェントを苦労して作り上げた結果でも、いろいろな現実的なケースの5割6割程度しか、期待通りの成果を残せない実態に気が付くだろう。

日経クロステックの記事等を見ると、現在の生成AIは、東大の入試問題でも合格水準の点数がとれるらしい(※3)。一問一答を大量に寄せ集めたタスクでは、もう人間を超えているのかもしれない。
しかし、5つ6つといった作業を、選択的にかつシーケンシャルに実行し、エンドトゥエンドの全体で正しい成果に至る必要があるようなタスクでは、AIエージェントの性能は脆弱だ。5つ6つのステップのうち、どこかひとつでもミスをすれば失敗になる条件下では、ミスは蓄積することになる。一問一答的なシングルタスクごとの正解率がたとえ90%でも、エンドトゥエンドの全体での正解率は半分程度にまで落ちてしまう。
そして言うまでもなく、現実のビジネスタスクとは、ほとんどがそのような選択的な複合タスクの実行を要求される。
ITベンダーのAIエージェント説明は、半分正しくて、半分は正しくない。現在のAIエージェントは、確かに、自分で事態を判断し、複数タスクの自律実行ができる。目的と背景さえ伝えれば、自分で実行計画を立ててタスクを推進することができる。ここまでは正しい。しかしだからと言って、AIがそのように自律的に働いた結果が、エンタープライズビジネスの水準で合格点を確保できるわけではない。ビジネスに使える水準のパフォーマンスが担保されるわけではない。
MIT(マサチューセッツ工科大学)の研究者グループは、2025年7月発行レポート(※4)で、『95%の生成AIプロジェクトは、ROIを得られていない』と記述した。その衝撃的な内容は全世界でIT業界を震わせ、極端すぎると批判も招いたが、AIエージェントの現状を表す大きなコンテクストとしては正しい。AIエージェントテクノロジーは、まだまだ未成熟で発展途上なのが現状だ。

このような、AIエージェントに対してネガティブな論調のコラムは、実は2025年の8月にも書いた・・・(※5)
とはいえ、筆者からのキーメッセージは、AIエージェントへの注力が徒労に終わり価値がないというネガティブなニュアンスではない。むしろ逆だ。
企業におけるAIエージェントへの注力と投資は、現時点ではおそらく、期待通りにはいかないだろう。しかしながら、だからと言って今、AIエージェントへの注力や投資を、止めるわけにはいかない。その方が、数年後の企業力を犠牲にしてしまう。数年後のビジネス機会損失を拡大させてしまうだろう。期待通りにいかないだろうと、あらかじめ理解しながら、それでもAIエージェントに、注力し投資をしなければいけない。それが、現代企業が逃れることのできない宿命だ。
AIエージェントへの注力と投資を、失敗を覚悟しつつ、進めていきましょう。それこそが、自社の企業力を向上させる最適解となるだろう。

AIエージェントコンサルティングの言い訳みたいな文章ばかり書き連ねてしまっているので・・・
ここからはAIエージェントへの「失望」と「がっかり」を、現時点でもなるべく減らすことができる方法について説明したい。

①チェック処理をこまめにたくさん実装する
AIエージェントのアウトプット精度が上がらない最大の理由は、複数タスクをシーケンシャル実行する必要があるのに、どこかのひとつのタスクでもミスをすると全体が失敗してしまうことだ。
ひとつの解決策として、『各ステップでのミスを極限まで減らす』手法が思い付く。そのために、AIアウトプットをこまめに段階分けして、段階ごとにいちいちミスをチェックし補正する処理を実装する方法は、全体精度の向上に効果がある。チェック処理は、生成AIに依拠して実装しても、その他のテクノロジーで実装しても、どちらでもかまわないが、生成AI活用処理で実装されるケースが多いのではないだろうか。
ただし、生成AIの呼び出し回数や入力トークン数が大きく増える方法であり、全体精度とトレードオフで、生成AI利用コストと処理時間を要してしまう。

②人間への確認をこまめにたくさん実装する
AIに、複数タスクをひとつひとつミスせずに最後まで完遂させるもうひとつの方法は、人間への確認機会をこまめに設定する手法となる。
『AIエージェントがどれほど発達しても、AIに多くをまかせるというよりも、人間の協働パートナーとして利用するべきだ』という議論が、AIエージェント界隈では頻繁に見られる。AIアウトプットをこまめに段階分けして、段階ごとに「人間に問い合わせをさせる」実装方法も、全体精度の向上には有効だ。もしかしたら、現時点におけるAIエージェントビジネス導入の最良の正解は、人間とAIの協働を体現するこの方法なのかもしれない。
ただし、人間の負荷が大きく増え、AIに依頼したタスクの全体スピードが大いに遅くなる方法であり、全体精度とトレードオフで、人間の手間と処理時間を要してしまう。

③ニューロシンボリックAI
生成AIは、確率的に文章を生成する。文章を「途中まで」与えれば、その続きの文章を、確率的に最もありえる内容で書くことができる。研究者はその一環で、生成AIに質問文を与えれば、後続文章として質問への回答が生成されることに気が付いた。面白いと考えてAIに質問文を与える画面インタフェースを作り、ツールとして公開した。この流れが、2022年11月のChatGPTリリースにつながっていく。
この、生成AIによる確率的な文章生成が、人間からは「汎用的能力」や「柔軟性」に見える。そして、この確率的な動作原理が、従来のソフトウェアとは異なる、ルールベースを超えた汎用的な処理能力を、結果として生成AIにもたらしている。生成AIが、具体的に指示していない動作を自律的に判断して実行できる理由が、この確率的動作原理にある。
ただし、そのような生成AI&確率的動作原理による自律的判断が、現時点ではまだまだ未熟であることは、ここまで記述してきた通り。ビジネスの重要部分をそこに全委任するのは心配だ。
そこで、【折衷案】が生まれることになる。これは人間の思考として非常に自然な流れだ。折衷案とは、『AIエージェントには、原則的に確率的動作原理で汎用的に判断や行動をしてもらうんだけど、絶対に間違えてほしくない要所要所だけは、ルールで行動原理や説明性を制御しよう』という考え方だ。最近、【ニューロシンボリックAI】といった表現で、話題となっているコンセプトとなる。
汎用的に状況判断や行動判断を行うAIエージェントなのだけれども、要所要所だけは人間がルールを実装設定して決定論的に制御しよう、という、そんな考え方やAIエージェント実装方法は、AIエージェントの精度向上に効果をあげることは間違いない。2026年に、多く取りざたされる方法になるのではないか。

④失敗の少ないユースケースを選んでAIエージェント化する
AIエージェントコンサルティングの現場において、最も現実的で、最も多く採用されている、AIエージェント精度向上の手法が、おそらくこれになるだろう。最もスタンダードであり、同時に、最も面白くないアイディアでもある・・・
これは、AIエージェント導入のスモールスタートアプローチそのものだ。まずは、実装が可能で、AIエージェントがミスをしにくく、業務の効率化効果が確保しやすい業務ユースケースを探し、ユースケース単位でAIエージェントを構築していく。AIの効果や精度をていねいに見ながら、アジャイルにAIの精度改善を続ける。
複数のユースケースごとに複数のAIエージェントが出現し始めたら、AIエージェントが稼働するプラットフォームの統一や連携を検討し、少しずつ一体連動を実現していく。その過程で、各ユースケースを担当する各AIエージェントの間に、似た機能を持ったサブエージェントが重複して発見され、重複サブエージェントの共通化と統合が図られていく。
その段階まで到達すれば、AIエージェント同士が適切にコミュニケーションし合っていろいろな業務を遂行していく、理想的なマルチエージェントシステムに至るまでもうすぐだ。
地道で段階的な、実現可能なユースケースをひとつひとつ探してつぶしていくAIエージェント導入手法が、実は一番失敗を避けることができ、逆説的に最短方法となりえる。

繰り返しになるが、2025年は【AIエージェント着手元年】だった。
現代企業は、競争力を保ち競合に置いていかれる状況を防ぐために、初めのうちは期待通りにいかないことを認識しつつも、AIエージェントへの注力と投資を避けられない。2026年も、多くの企業がAIエージェントの検討と導入に苦労をすることだろう。

企業AIエージェントの検討と導入には、生成AIの酸いも甘いも経験し理解した、熟練の伴走支援者が必要だ。しかも、特定のAI製品を押し付けてこない、テクノロジースタンスがフリーなAIプロフェッショナルでなければならない。

AIエージェントにお悩みがあれば、ご相談は大和総研まで。

このコンテンツの著作権は、株式会社大和総研に帰属します。著作権法上、転載、翻案、翻訳、要約等は、大和総研の許諾が必要です。大和総研の許諾がない転載、翻案、翻訳、要約、および法令に従わない引用等は、違法行為です。著作権侵害等の行為には、法的手続きを行うこともあります。また、掲載されている執筆者の所属・肩書きは現時点のものとなります。

坂本 博勝
執筆者紹介

フロンティア研究開発センター

フェロー 坂本 博勝