データサイエンス・AI
プロンプトエンジニアリングとは、人工知能(AI)から期待通りの回答を得るために、質問や指示(プロンプト)の記載内容を設計し、最適化するための技術のことです。人工知能の中でも、特に人間が使用している言語(自然言語)を扱う言語モデルに対して用い…
大規模言語モデル(LLM:Large Language Models)とは、テキストデータを対象とする多様なタスクで高い性能を発揮する機械学習モデルです。ニュース記事の生成、トピック分類、チャットボットといったさまざまな用途で活用が進んでいます。
生成AI(ジェネレーティブAI)とは、文章・音声・画像などのコンテンツを、指示文(プロンプト)やデータをもとに自動生成できる人工知能技術の一種です。生成AIの機械学習モデルは、特定の深層学習アルゴリズムを用いて大量データを学習することにより作成…
AutoMLとは、Automated Machine Learningの略で、AI開発のプロセスの一部を自動化すること、あるいはそれを実現するサービスの総称です。 AIを用いた業務効率化は幅広い業界で求められています。一方で、AI開発には機械学習などの専門知識と経験、そして多大…
DX人材とは、DXを進めるために必要なスキルを持ち、ビジネスの変革をリード・実行できる人材のことです。経営課題の解決や付加価値創出のために、企業全体を見渡す視点を持ち、社内外の人材を巻き込みながらプロジェクトを遂行する力が求められます。
データサイエンティストとは、社内外のデータを収集・分析し、潜在的なビジネス課題の解決を推進する、または新規ビジネスに関わる意思決定をサポートする職種です。AIやITに関する知識に限らず、各業界のトレンドや経営など、幅広いスキルが求められます。
データ分析とは、ビジネスにおける課題解決や意思決定の支援を目的として、様々なデータを集計・加工・可視化する一連のプロセスのことを指します。近年では迅速な意思決定を行うために、分析プロセスの一部を自動で行えるサービスが数多く開発されています。
GPUとはGraphics Processing Unitの略称で、画像処理に特化した半導体チップのことです。コンピュータ全体にかかわる計算処理を行うCPUに対して、GPUはCPUの補助演算装置として、3Dグラフィックスなどの画像・映像描写に必要な計算処理を行います。 CPUに内…
GANとはGenerative adversarial networksの略称で、教師なし学習で使用される深層生成モデルの一種です。用意されたデータから特徴を学習し、実在しない疑似データを生成することができます。現在は主に画像処理の分野で活用されています。 関連するウェビナ…
セマンティック(semantic)とは、収集した情報の「意味」を正しくコンピュータが解釈できるように形式化・構造化したデータとして抽出する概念のことです。 元々、Webページの記述内容の意味をタグ付けすることで、意味を理解できるようにする「セマンティ…
プロセスマイニングとは、ユーザのイベントログデータ等を用いて業務プロセスを可視化し、業務効率化に役立てる手法のことです。業務が複雑化・多様化する今日において、プロセスマイニングツールは企業のBPR(Business Process Re-engineering)を支援する…
データ分析人材・組織とは、データ分析を行い、ビジネスへ活用するための人材(いわゆる、データサイエンティスト)と、それを機能させるための組織を指します。 デジタル技術を駆使して企業が価値を生み出し続けるためには、データの利活用が成功の鍵であり…
データガバナンスとは、企業・組織のデータマネジメントが適切に行われるよう監視・統制するための組織活動のことです。データガバナンスは、データの活用ルールの明文化や、ルールが守られているかのチェック機能を持ち、データ活用による効果の最大化とリ…
顧客の閲覧履歴や購入履歴などを元に、各顧客との関連性の高い製品をAIが推薦するシステムのことを指します。CX(顧客体験価値)の向上につながることから、多くのECサイトなどで活用されています。レコメンドの仕組みは、以下のように大きく2つに分類できます…
説明可能AI(Explainable AI、XAI)とは、機械学習のモデルが生み出した結果を、人間が理解できるようにホワイトボックス化するための技術です。 近年、AIは社会の様々な場面で登場し、企業や組織が重要な判断を下す際の判断材料の一つとしてAIの分析結果が…
マルチモーダル(multimodal)AIとは、複数種類のデータ(画像、音声、テキストなど)をインプット情報として、人工知能アルゴリズムを組み合わせて統合的なアウトプットをする深層学習の手法です。 画像データのみをAIのインプット情報とした場合、人間の五…
感情分析とは、AI(人工知能)を用いて、人間の表情や音声、テキストデータ等から感情を読み取ることを指します。例えば顔の表情から感情分析を行う場合、カメラを用いた視線検出や、視線や瞳孔の大きさ等のデータを入力データとして感情の推定を行います。…
音声処理とは、音の周波数や時系列などを入力データとして音声をテキストデータに変換する「音声認識」、話者の音声データをもとにテキストを音声に変換する「音声合成」等の処理の総称です。 近年では言語の複雑な文法を正確に評価するために、ディープラー…
画像データから特徴を抽出することで、画像に映っている対象を認識・判断する技術のことです。学習する画像には、文字や人間の顔の写真などがあり、AI-OCRなどの文字認識や顔認証技術として実社会で活用されています。
自然言語処理(NLP、Natural Language Processingの略)は、人間が日常的に使っている自然言語をコンピュータに処理・解析させる技術です。自然言語処理技術によって、大量のテキストデータを短時間で解析することが可能になり、業務の効率化や価値創造に貢…
ニューラルネットワーク(Neural Network)は機械学習で用いられる手法の一つです。人間の脳内神経細胞(ニューロン)同士のつながりである神経回路網を数理的なモデルで表したものです。 ニューラルネットワークは入力層・中間層(隠れ層)・出力層の3層で…
データを分析に使える状態にするための一連の変換プロセスのことです。データの収集から、クレンジング、結合、構造化、標準化などのプロセスがあります。 データプレパレーションによって高品質な分析データが提供されることで、その後の分析作業の効率化や…
ETLとは、企業内の業務システムなどからデータを抽出し、必要な変換処理を行い、データウェアハウス(DWH)へデータを取り込むという一連のプロセス、またはツールを指します。この一連のプロセスを示した、抽出(Extract)、変換(Transform)、取り込み(L…
データレイクとは、csvやxmlなどの構造化データ、テキストや音声、動画などの非構造化データを加工することなくそのままの形で一元的に格納するレポジトリ(保管庫)のことです。データレイクの特徴として以下の3点が挙げられます。 データレイクの特徴 1…
データウェアハウス(Data Ware House。DWHと略す)とは、企業内の業務システムや外部データソースなどあらゆるデータを収集・整理して保管するシステムです。戦略的な意思決定や業務分析などに活用できる形でデータを提供することが可能です。
データ利活用とは、収集した多種多様なデータから、そこに価値を創造することを指します。リモートワークといった働き方の登場やデジタルサービスの普及、DXを見据えた経営など、時代の変化とともに、利活用の重要性は一層強まっています。
データ分析基盤とは、データ利活用を効率よく推進していくためのITインフラのことです。ビッグデータなどを半永久的に保存できる点、蓄積したデータを様々な用途に活用可能な点がメリットとして挙げられます。
深層学習(ディープラーニング)とは、ニューラルネットワークを用いた機械学習のことで、入力層と出力層の間に中間層を設けることで複雑な分析が可能となります。
AIモデル(機械学習モデル)とは、入力されたデータを分析し、評価した結果を出力するまでの一連の処理を計算式で記述したものを指します。データ分析には3種類の学習手法があり、目的に合わせて最適なものを選択する必要があります。
データサイエンスとは、データを扱う手法に関する学問で、統計学や機械学習などの分野から成るものです。スマートフォンやタブレットの普及、クラウド技術の発展に伴い、データサイエンスは様々な分野で用いられるようになりました。
機械学習とは、コンピュータに大量のデータを学習させることで、データに潜む特徴を見つけて、予測などを行う技術を指します。 本記事では、機械学習の代表的なアルゴリズムや技術の活用方法を分かりやすく解説します。
人工知能(AI)とは、人間のもつ知能をソフトウェアを用いて人工的に再現したものを指すことが多いです。本記事では、AI技術の誕生から現在に至るまでの歴史と今後の動向について解説します。
チャットボットとは、人の質問に対して応答することが可能なコンピュータのことです。定型的な質問に対して、あらかじめ設定したルールを元にして返答するだけでなく、言語モデルを学習することで質問の意図を類推して返答することができるのがAI搭載型チャ…
ビッグデータとは、国や企業が取り扱う構造化データだけでなく、テキストや画像、音声、動画などの非構造化データを含めた膨大で多種にわたるデータの総称です。基本的にはその特性を「Volume」, 「Variety」, 「Velocity」の3つのvで評価します。
予測モデルとは、入力データから結果を推定するための統計学的モデルのことです。例として、線形回帰モデルや一般化線形モデル、ニューラルネットワークモデルなどが挙げられます。 精度の高い予測モデルを構築するためには、データから特徴量を慎重に選定し…