【徹底解説】ビジネスマンが知るべき生成AI用語22選【LLM/AIエージェント他】
この記事でわかること
AI時代にビジネスマンが押さえておくべき基本的な用語をまとめて理解できます。
目次
はじめに
生成AIは、今や世界で最も注目される技術の一つであり、
私たちの働き方やビジネスのあり方を大きく変えつつあります。
マーケティング、営業、製品開発など、さまざまな分野で生成AIの活用が広がっており、
その勢いは増すばかりです。
しかし、
「生成AIは専門用語が多くて、なかなか覚えられない…」
「本当に必要な用語だけを効率よく押さえたい…」
と感じている方も少なくないのではないでしょうか。
そこで本記事では、
ビジネスマンが実務に活用するときに覚えておくべき生成AIの重要用語のみを抜粋してまとめました。
基礎用語はもちろんのこと、
さらに理解を深めるための上級編も用意しましたので、
ご自身のレベルに合わせて、ぜひ最後までご覧ください。
1.知っておくべき用語(基礎用語編)
まずは、ビジネスパーソンであれば知っておきたい基礎用語を13個ご紹介します。
これらの用語を理解するだけでも、生成AIに対する理解が深まずはずです。
生成AI:新しいコンテンツを生み出すAI
生成AIとは、「ジェネレーティブAI(Generative AI)」とも呼ばれ、
文章、画像、音声など、新たなコンテンツを生成するAIのことです。
近年のAI技術の進化によって、
人が作成したコンテンツと遜色ない品質のものを、
誰でも簡単に自動生成できるようになりました。
そのため、既存のビジネスや業務のあり方を大きく変える存在として、注目を集めています。
生成AIには、「ChatGPT」のような対話形式で文章を生成するものや、
「Midjourney」のような画像生成AIなど、さまざまな種類があります。
すでに多くの企業で、業務をサポートするツールとしての活用が進んでおり、
メール作成、記事作成、広告やCMのクリエイティブ制作など、その利用シーンは多岐にわたります。
AI:人間の知能を再現する技術
AI(Artificial Intelligence:人工知能)とは、
人間の知能をコンピューターで再現しようとする技術のことです。
学習、推論、問題解決など、人間が行う知的な活動をコンピューターで実現することを目指しています。
生成AIは、このAIの大きな分野の一つであり、
特に新しいコンテンツを生み出すことに特化したAI技術と言えるでしょう。
LLM:大量のテキストデータを学習したAI
LLM(Large Language Model:大規模言語モデル)とは、
膨大な量のテキストデータを学習したAIモデルのことです。
人間が言葉を理解し、文章を作成するのと同じように、
AIが言葉を理解し、自然な文章を生成するために不可欠な技術です。
「ChatGPT」やGoogleの「Gemini」など、多くの生成AIサービスでLLMが活用されています。
特に、ChatGPTなどは、生成AIというより、LLMに分類されることが多いです。
ChatGPT:OpenAIが開発した対話型LLM
ChatGPTは、OpenAI社が開発した、対話形式でテキストを生成するAIサービスです。
まるで人間と話しているかのように、質問に答えたり、文章を作成したり、翻訳したり、物語や詩を創作したりできるため、
大きな話題となりました。
誰でも手軽に利用できることから、世界中で利用者が急増しています。
現在では、テキスト生成だけでなく、画像やファイルの生成も可能になっているため、
単なるチャットツールを超えたLLMへと進化を遂げています。
Gemini(ジェミニ):Googleが開発したマルチモーダルLLM
Geminiは、Google社が開発した、テキスト、画像、音声など、複数の種類の情報を扱えるAIモデルです。
チャット機能に加え、画像生成、音声認識、動画生成など、さまざまな機能を備えています。
Googleの多様なサービスに統合され、より便利で高度な機能を提供することが期待されています。
Claude(クロード):Anthropicが開発した高性能LLM
Claudeは、Anthropic社が開発した大規模言語モデルの一種で、
大量のテキストデータから学習することで、
人間のように自然な文章を生成したり、質問に答えたり、さまざまなタスクを実行したりできます。
ChatGPTやGeminiと肩を並べるほどの精度でテキスト生成が可能なLLMです。
特に、日本語の理解度やテキスト生成の精度が高く、注目を集めています。
プロンプト:生成AIへの指示
プロンプトとは、生成AIに対して、どのようなコンテンツを生成してほしいかを指示するテキストのことです。
生成AIは、このプロンプトに基づいてコンテンツを生成します。
たとえば、
「夕焼けの富士山を描いて」
や
「100語程度で環境問題に関するエッセイを書いて」
などがプロンプトに該当します。
プロンプトは、生成AIにとっての指示であり、生成されるコンテンツの質や内容を決定づける非常に重要な要素です。
プロンプトエンジニアリング:生成AIからより良い結果を引き出す技術
プロンプトエンジニアリングとは、生成AIから質の高い、
あるいはより望ましい結果を得るために、プロンプトを工夫する技術のことです。
生成AIの性能は日々向上していますが、
それでもプロンプトの質によって、出力結果が大きく変わることがあります。
そのため、プロンプトエンジニアリングは、生成AIを使いこなす上で欠かせないスキルとなっています。
具体的なテクニックとしては、プロンプトに具体的な指示やキーワードを追加したり、
特定の文体で文章を生成させるために、サンプルテキストをプロンプトに含めたりする方法などがあります。
ハルシネーション:事実とは異なる内容を生成する現象
ハルシネーションとは、生成AIが、事実とは異なる内容や、
根拠のない情報を生成してしまう現象のことです。
生成AIはまだ発展途上の技術であり、
時として、事実とは異なる内容を生成してしまうことがあります。
たとえば、
「実在しない歴史上の人物についてChatGPTが詳細な説明を生成してしまう事例」
などがハルシネーションに該当します。
質問の回答に、一見もっともらしいものの、実際には誤った情報が含まれている場合などもハルシネーションと言えます。
特にビジネスでの活用の場合、ハルシネーションは重大な問題を引き起こす可能性があるため、注意が必要です。
ハルシネーションを防ぐためには、AIが出力した情報が正しいかどうかを必ず確認することが大切です。
パラメータ:「学習の量」や「複雑さ」を表す指標
パラメータ(数)とは、AIモデルの学習結果を数値で表したものです。
一般的に、パラメータ数が多いほど、モデルが複雑で表現力が高いと言えます。
(※モデルによって異なる)
初期の深層学習モデルでは数百万パラメータ程度でしたが、
現在では数千億から数兆パラメータを持つ巨大なモデル(ChatGPTなど)が登場しています。
近年のAI技術の進化は、このパラメータ数の増加と密接に関係しています。
トークン(数):LLMがテキストを処理する際の最小単位
トークンとは、LLMがテキストを処理する際の最小単位のことです。
人間が言葉を理解するために単語に分解するように、AIも言葉を理解するためにトークンに分解します。
LLMの処理能力は、トークン数によって制限されます。
そのため、処理できるテキストの長さや複雑さには限界があります。
トークンは、基本的に英単語1文字が1トークンに概要するため、
日本語の場合は、1文字が1トークンにならないため注意が必要です。
概ね、日本語500~700文字が「1000トークン」になるとOpen AI公式から声明が出ています。
AIエージェント:主体的にタスクを実行するAI
AIエージェントとは、ユーザーの指示に基づいて、
または自ら判断して、さまざまなタスクを自動的に実行するAIのことです。
たとえば、
「ユーザーの代わりにメールを送信する」
「スケジュールを管理する」
「情報を収集したりする」
ことができます。
LLMがユーザーの指示によって動く(受動的な)のに対し、
AIエージェントはタスクを自律的に考えて行動する(主体的な)点が特徴です。
まだビジネスの現場での活用例は多くありませんが、
今後、さまざまな分野で人間の活動をサポートする存在として期待されています。
2.さらに詳しくなるための用語(上級編)
ここからは上級編として、
より高度な活用方法や仕組みを理解するための用語について解説していきます。
マルチモーダル:複数の情報を扱えるAI
マルチモーダルとは、複数の種類の情報を統合的に処理できるAIのことです。
たとえば、テキスト、画像、音声といった異なる種類の情報を組み合わせて理解し、出力することができます。
従来のAIは、テキストだけ、画像だけといったように、単一の種類の情報しか扱えませんでした。
しかし、マルチモーダルAIは、複数の情報を組み合わせることで、
より人間に近い形で情報を理解し、より複雑なタスクをこなすことができるのです。
現在、「ChatGPT」や「Gemini」などもマルチモーダルに対応し始めています。
例
- 画像とテキストを組み合わせて入力し、画像の内容を説明するテキストを生成する
- 音声とテキストを組み合わせて入力し、音声の内容を要約するテキストを生成する
ファインチューニング:精度を高めるための追加学習
ファインチューニングとは、既存のAIモデルを
精度を向上させたり、特定のタスクに特化させたりするために行う追加学習のことです。
たとえば、大量のテキストデータで学習済みのLLMを、
医療に関する質問応答に特化させたい場合、
医療に関するテキストデータを使ってファインチューニングを行うことで、
医療分野の専門知識を備えたAIを構築できます。
そのため、LLMを自社業務に特化させるために、ファインチューニングを行うケースも多くあります。
ファインチューニングによって、用途に合わせてAIモデルの精度や性能を向上させることが可能です。
RAG:外部情報を使って最新の情報を生成
RAG(Retrieval-Augmented Generation:検索拡張生成)とは、
生成AIが外部の情報源(データベースやウェブサイトなど)から情報を取得し、
その情報を使って、より正確で最新の回答を生成する技術のことです。
LLMは、学習したデータに基づいてコンテンツを生成しますが、
学習データに含まれていない最新の情報や専門的な知識については、対応できない場合があります。
RAGを用いることで、LLMの知識を最新の状態に保ち、より信頼性の高いコンテンツを生成することができるのです。
たとえば、自社独自の業務マニュアルから情報を得て、回答を生成するなどもRAGに含まれます。
プロンプトインジェクション:機密情報を盗む攻撃
プロンプトインジェクションとは、悪意のあるユーザーが、
生成AIの挙動を操作するために、プロンプトに特別な指示を埋め込む攻撃手法のことです。
たとえば、生成AIに機密情報を開示させたり、
有害なコンテンツを生成させたりする目的で、プロンプトインジェクションが用いられる可能性があります。
プロンプトインジェクションは、生成AIのセキュリティ上の脅威となるため、十分な対策が不可欠です。
機械学習:データから学習するAI
機械学習とは、AIが大量のデータから自動的にルールやパターンを学習し、
それを使って予測や判断を行う技術のことです。
たとえば、大量の画像データから「猫」の特徴を学習したAIは、
新しい画像が猫かどうかを判断することができます。
機械学習は、深層学習を含む、さまざまな学習アルゴリズムを含んでいます。
ディープラーニング:人間の脳を模倣した学習技術
ディープラーニング(深層学習)とは、
人間の脳神経回路を模倣したニューラルネットワークを用いた機械学習の一種です。
ディープラーニングは、大量のデータから複雑な特徴を自動的に学習することができ、
画像認識、自然言語処理、音声認識など、さまざまな分野で高い性能を発揮しています。
生成AIの多くは、このディープラーニング技術を基盤に開発されています。
コンテキストウインドウ:AIが記憶/処理できる情報量
コンテキストウインドウとは、LLMが一度に処理できるテキストの長さの上限のことです。
LLMは、コンテキストウインドウ内の情報を使って、文章を生成したり、質問に答えたりします。
コンテキストウインドウが大きいほど、AIはより多くの情報を記憶し、より複雑な処理を行うことができます。
しかし、コンテキストウインドウが大きくなると、計算コストも増加するため、適切なサイズを設定することが重要です。
ちなみに、Geminiはコンテキストウインドウが200万トークンもあり、
他のLLMと比べても圧倒的です。
AGI:人間レベルの知能を持つAI
AGI(Artificial General Intelligence:汎用人工知能)とは、
人間のように、さまざまなタスクをこなすことができるAIのことです。
現在のAIは、特定のタスクに特化しているものがほとんどですが、
AGIは、人間と同じように、さまざまなタスクをこなすことができるとされています。
AGIの実現は、AI研究の大きな目標の一つですが、まだ実現には至っていません。
ASI:人間を超える知能を持つAI
ASI(Artificial Superintelligence:人工超知能)とは、
AGIを超え、人間の知能をはるかに超える知能を持つAIのことです。
ASIは、人間が理解できないほど高度な思考能力や問題解決能力を持つとされています。
ASIの実現可能性については、さまざまな議論がありますが、
もし実現すれば、人類に大きな影響を与える可能性があると言われています。
まとめ
生成AIは、私たちの働き方やビジネスを大きく変える可能性を秘めた技術と言われています。
本記事でご紹介した用語を理解することで、生成AIに対する理解を深め、
ビジネスへの活用を検討する際に役立つだけでなく、
AI技術の進化を的確に捉え、今後のビジネス戦略に活かしていきましょう。