生成AI基礎用語集

本資料では、生成AIに関する基本的な用語を50パターン紹介します。これからの時代に必要な一般教養として、AIの基礎知識を身につけましょう。

基本概念とモデルの種別
生成AI

画像や文章など新しいデータを作り出すAIの総称。ChatGPT、Claude、Midjourney、Geminiなどが該当する。

モデル

学習済みの脳そのもの。アルゴリズムと重みが詰まったファイル。アプリはこれを呼び出して答えを作る。GPT-4、Claude 3 Opusなど。

LLM(大規模言語モデル)

大量の文章を学習し、人の質問に答えたり文章を生み出したりできる巨大な言語AIモデル。

AGI(汎用人工知能)

人間と同等以上の全ての知的作業をこなす仮想ゴール。現状のAIはまだ達していないとされる。

モデルの学習・最適化手法
知識蒸留

大きなモデルの知識を小さいモデルへ移し、軽量高速化する技術。GPT-4 Miniなどが例。

機械学習・ディープラーニング

データからパターンを学ぶAIの作り方。大規模モデルの土台となる技術。

ファインチューニング

既存モデル全体を再学習し、特定分野に特化させる技術。企業独自のチャットボット開発などで重要。

LoRA

軽い追加パーツだけ学習し、低コストで微調整する技術。Stable Diffusionの画像生成などでよく使われる。

RLHF

「人間からの強化学習」。人の評価でご褒美を与え、AIを訓練する方法。

ゼロショット・フューショット

サンプル事例なしでAIとやり取り(ゼロショット)か、サンプル事例を見せてから行う(フューショット)か。

プロンプト設計と制御技術
プロンプト

AIとの対話や操作のために、ユーザーが入力する指示や質問のこと。

システムプロンプト

AIに絶対守らせる最優先の指示書。敬語で答える、個人情報禁止などの指示。システムインストラクションとも呼ばれる。

プロンプトエンジニアリング

望む振る舞いを引き出す入力設計技法。ロール設定や制約などを組み合わせ、最適な応答を得る方法。

テンプレートプロンプティング

固定ひな形に変数だけ入れて呼び出し、一貫した出力を得る運用方法。

プロンプトインジェクション

悪意ある質問でAIに秘密漏洩などをさせる攻撃手法。入力の検査が必須。

思考フローと対話管理
トークン

単語、句読点、部分単語などモデルが1単位として扱う文字列。AIの処理単位。

コンテキストウィンドウ

AIが1度の会話で覚えていられるトークン数の上限。長すぎると古い部分が切れる。

ハルシネーション

AIが事実確認をせず嘘の答えを自信満々で出す現象。根拠付きや人のチェックで軽減可能。

チェインオブソート(CoT)

AIに考えの途中経過を喋らせて正解率を上げる方法。GPT-3.5などの思考モデルに採用。

エージェント

LLMを目的達成の主体として扱う設計概念。目標を渡すと計画、ツール実行、振り返りを自動で回し結果を届ける。

MCP(モデルコンテキストプロトコル)

ルール、タスク、メモを区分けしてAIに渡す共通フォーマット。「USBCポート」とも表現される。

バイブコーディング

会話で要望しAIが生成、すぐ実行して出力を確認する高速PDCA型の開発スタイル。「雰囲気でコーディング」の意。

検索・知識拡張・データ手法
ナレッジ

AIが持つ一般知識プラス会社のマニュアルなど外部データをまとめた知識ベース。

ナレッジカットオフ

AIが最後に学習した日付。それ以後の出来事は知らない。

ベクトル埋め込み

言葉や画像を多次元の数字の点に変え、意味が近いほど近くに並べる表現手法。似たデータを高速に探せる。

ベクトルデータベース

画像や文章をベクトルに変えて保存し、似たデータをすぐ見つけられるデータの倉庫。

RAG(検索拡張生成)

ベクトル検索で取得した文章をプロンプトに連結し、根拠付き解答を生成する技術。ハルシネーション抑制に有効。

AI検索

AIがユーザーの意図や文脈を理解し、最適な検索結果を提供するシステム。自然な会話で直接的な回答が得られる。

ディープリサーチ

生成AIがWebや論文を自立的に集めて分析し、引用付きレポートを作るAI調査アシスタント機能。

LLMO

生成AIに自分のサイトを正しく理解・引用してもらうためのコンテンツ最適化手法。SEOの次世代版。

マルチモーダルとメディア生成
ビジョンランゲージモデル

画像を見て文章を出すなど、視覚と言葉を合体させたモデル。

T2I(テキストtoイメージ)

テキストを入力すると、その内容に合致する画像を生成するモデル。

I2I(イメージtoイメージ)

既存画像を入力し、別の見え方へ変換・編集する仕組み。GPTのジブリ風変換などが例。

T2V(テキストtoビデオ)

テキストプロンプトだけで、秒単位の動画クリップを生成するモデル。

TTS(テキストtoスピーチ)

文字を読み上げにしてAIが声に変えて読み上げる仕組み。ElevenLabsなどが有名。

音声認識(STT)

マイクで拾った声をAIがリアルタイムで文字に変える技術。字幕表示や音声操作に活用。

マルチモーダル

文字、画像、音声など複数の情報をまとめて理解して生成できるAI。現在のAIの主流。

運用・オペレーション
インテグレーション

複数の異なる要素を組み合わせて統合・連携させるプロセス。アプリ接続機能など。

LLMOps

大規模言語モデルを社内サービスとして安定・安全に運用するためのノウハウとツール群。

AIワークフロー

AI技術を業務プロセスに組み込み、タスクの自動化や意思決定を支援する仕組み。

API

異なるアプリケーションやソフトウェア同士をつなぎ、データや機能を共有するための仕組み。

JSON

データを名前と値で表現する軽量ファイル形式。人が読めてコンピュータもすぐ理解できる。

YAML

インデントとコロンだけで階層を表す、メモ書き風の設定ファイル。リスト形式のデータ表現に便利。

ハードウェアとプラットフォーム
NVIDIA

GPUを主力とする米国企業。AI計算が得意な最新GPUを開発し、世界中のAIスーパーコンピューターを支える。

NPU

脳の仕組みを真似た回路で、1秒に何兆回も演算しAIの重たい計算を低電力でこなす専用チップ。

AI PC

NPUなどAI専用チップを搭載し、ネットに頼らず画像生成や翻訳を即実行できる新世代PC。コパイロットPCとも。

コパイロット

Microsoftが提供するAIアシスタントサービス。Wordなどで下書きを作ったり、PCを音声操作したりできる。

チャットボット

AIと会話するようにテキストや音声で応答するプログラム。ChatGPT、Claude、Geminiなど。

まとめ

生成AIの進化は急速で、新しい概念やワードが次々と登場しています。本資料で紹介した50の基本用語は、これからのAI時代における一般教養として押さえておくべき知識です。東京都の学校でもAI学習が始まるなど、若い世代のAIリテラシーが高まる中、大人もAIの基礎知識を身につけることが重要になっています。企業の生成AI導入率は約40%と高まっており、今後もAIと共存する社会が加速していくでしょう。AIの知識は現代人の必須スキルとなりつつあります。