Azure AI Languageとは？仕組みを図解でわかりやすく解説

解決する課題

テキストデータから意味を引き出す処理、たとえば「この問い合わせは肯定的か否定的か」「文中に出てくる人名・組織名・地名は何か」「この文書はどのカテゴリか」といった分析は、自前で機械学習モデルを構築・運用しようとすると専門知識と大きな手間がかかります。Azure AI Language は、こうした自然言語処理（NLP）の代表的なタスクを、学習済みモデルの API として、あるいは独自データで学習させるカスタムモデルとして提供し、アプリケーションへ手軽に組み込めるようにします。

問い合わせやレビューの 感情・意見を自動で判定したい
文書から 人名・組織・場所・日付などのエンティティを抽出したい
大量のテキストを 要約・分類して下流の処理に渡したい
自社ドメイン固有のラベルで 独自の分類器や固有表現抽出器を学習したい
インフラやモデル運用を抱え込まずに マネージドな NLP を使いたい

主要概念と用語

言語サービス（Language service）: 複数の NLP 機能を束ねた Azure AI services のサービス。1つのリソース・エンドポイントから各機能を呼び出す
感情分析（Sentiment Analysis）: テキスト全体や文単位で肯定・否定・中立とその信頼度を返す機能
オピニオンマイニング（Opinion Mining）: 感情を対象（アスペクト）ごとに分解し、「料理は良いが待ち時間が長い」のような細かい意見を抽出する機能
キーフレーズ抽出（Key Phrase Extraction）: 文書の主題を表す重要な語句を取り出す機能
エンティティ認識（NER）: 人名・組織・場所・日付などの固有表現を検出・分類する機能
エンティティのリンク（Entity Linking）: 抽出したエンティティを Wikipedia などの既知の知識源に結びつける機能
PII 検出（PII Detection）: 個人を特定しうる情報（氏名・電話番号・口座番号など）を検出し、マスキングを支援する機能
言語検出（Language Detection）: 入力テキストが何語かを推定する機能
テキスト要約 / 会話要約: 長文や会話ログから要点を抽出・生成する機能
CLU（Conversational Language Understanding）: 発話から意図（インテント）とエンティティを抽出する、会話理解のためのカスタム機能。旧 LUIS の後継に位置づけられる
カスタムテキスト分類 / カスタム NER: 自社のラベル付きデータで学習する独自モデル
Language Studio: ブラウザ上でデータ投入・モデル学習・テストを行える GUI ツール

仕様・制限・クォータ

事前構築済み機能とカスタム機能の2系統がある。感情分析や言語検出などはそのまま呼べる一方、カスタム分類・カスタム NER・CLU は学習データを用意して訓練する
REST API と各言語の SDK から利用でき、同期呼び出しのほか、要約など一部の機能は 非同期ジョブとして実行する
多言語に対応するが、機能ごとに対応言語や精度が異なるため、対象言語のサポート状況を事前に確認する
1リクエストあたりのドキュメント数・文字数に上限があり、大量データはバッチ分割が必要になる
入力単位は「ドキュメント」で、複数ドキュメントをまとめて1リクエストで処理できる
データレジデンシーやモデルのバージョン指定など、運用上の選択肢がある
具体的な上限値・対応言語・課金単位はリージョンや機能で異なり更新されるため、最新の公式ドキュメントで確認する

内部の仕組み

Azure AI Language は、Microsoft が学習・運用する 学習済みの大規模言語モデルを API の背後に持ち、利用者はモデルそのものを意識せずに結果だけを受け取ります。事前構築済み機能では、入力テキストをモデルに通して感情ラベルやエンティティ、キーフレーズなどの構造化された結果を返します。

事前構築済み機能は、汎用的に学習されたモデルを共有利用する形で提供され、利用者はインフラやモデルの更新を意識せずに使える
カスタム機能では、利用者がラベル付きデータをアップロードして学習（トレーニング）を実行し、生成された独自モデルをエンドポイントへ デプロイして呼び出す
カスタムモデルは 学習用・テスト用にデータを分割して評価でき、適合率・再現率などの指標でモデルの良し悪しを確認する
要約などの重い処理は 非同期ジョブとして投入し、ジョブの完了をポーリングして結果を取得する
機能ごとに モデルバージョンを選べ、再現性を保ちたい場合は明示的にバージョンを固定できる

まず事前構築済みから

感情分析・キーフレーズ・NER・言語検出といった一般的なタスクは事前構築済み機能でほぼ即座に使えます。独自モデルの学習はデータ整備とラベリングの手間がかかるため、まず事前構築済みで要件を満たせるかを確認し、ドメイン固有の精度が必要な部分だけカスタムに切り出すのが効率的です。

横にスクロール

一般タスクは同期の事前構築機能、長い要約は非同期ジョブ、業務固有分類だけをカスタムモデルへ分けます。PIIは保存前に検出・マスクします。

設計パターン / ベストプラクティス

事前構築済みで足りるならカスタムを作らない。学習・評価・再学習の運用コストを避けられる
大量テキストはバッチで分割し、1リクエストあたりのドキュメント数・文字数上限に収める
要約などの非同期機能は ジョブ投入とポーリングを前提に設計し、タイムアウトやリトライを組み込む
PII 検出は マスキングや格納前の前処理として組み込み、機微情報の取り扱い範囲を絞る
カスタムモデルは モデルバージョンを固定して、本番の挙動が予期せず変わらないようにする
他の AI サービス（音声からの文字起こし、翻訳など）と パイプラインで連携し、入力を正規化してから言語サービスへ渡す

運用・監視

Azure Monitor のメトリクスで呼び出し回数・遅延・エラー率・スロットリングを監視する
診断設定でログを Log Analytics へ送り、利用状況やエラー傾向を長期に分析する
スロットリング（レート上限） に備え、リトライとバックオフをクライアント側で実装する
カスタムモデルは 再学習のサイクルを運用に組み込み、入力データの傾向変化に追従させる
モデルバージョン更新時は テストデータでの再評価を経てから本番デプロイを切り替える

コスト

課金は基本的に 処理したテキスト量（テキストレコード単位）に対する従量制で、機能や層によって単価が異なります。無料枠が用意されている機能もあり、検証段階ではコストを抑えやすい一方、カスタムモデルは学習・デプロイ・推論で課金観点が分かれる点に注意します。

観点	事前構築済み機能	カスタム機能
課金の中心	処理したテキスト量の従量	学習・デプロイ・推論で観点が分かれる
初期コスト	ほぼ呼び出すだけで開始できる	データ整備とラベリングの手間がかかる
向いている用途	汎用的な感情・NER・要約など	ドメイン固有の分類・固有表現抽出

コストの落とし穴

同じテキストを複数の機能（感情・NER・キーフレーズなど）で繰り返し処理すると、機能ごとにテキスト量が課金されます。必要な機能だけを選び、前処理で入力を正規化・重複排除してから呼び出すことで無駄を抑えられます。具体的な単価・無料枠は変動するため、最新の料金ページで確認してください。

セキュリティ

Microsoft Entra ID 認証 + RBAC を基本とし、キー認証への過度な依存を避ける
リソースのキーは Key Vault で管理し、コードへのハードコードを避ける
プライベートエンドポイント / 仮想ネットワークで通信を閉域化できる
入力テキストに含まれる 機微情報は PII 検出でマスキングし、保存・ログ出力する範囲を最小化する
保存データはサービス側で暗号化され、要件に応じて カスタマーマネージドキーにも対応する
データレジデンシー（処理リージョン）の要件を満たすリージョンを選ぶ

Well-Architected の観点

オペレーショナルエクセレンス: 事前構築済み機能を優先してモデル運用の負担を減らし、カスタムが必要な箇所だけに学習・再学習サイクルを設ける。モデルバージョンの固定と段階的な切り替えで本番挙動の安定を保つ
監視・診断ログを整備し、スロットリングやエラーをリトライ設計でいなすことで、運用の予測可能性を高める
機微情報の取り扱いを前処理（PII 検出・マスキング）として標準化し、運用とセキュリティを両立させる

試験で問われるポイント

頻出

Azure AI Language ＝テキストの NLP を束ねたサービスで、AWS の Amazon Comprehend に相当する点
事前構築済み機能（感情分析・キーフレーズ・NER・言語検出・PII 検出・要約）と カスタム機能（カスタム分類・カスタム NER・CLU）の区別
CLU は会話の意図とエンティティを抽出するカスタム機能で、旧 LUIS の後継である点
画像や音声ではなく テキストを対象とするサービスである点（音声は Speech、画像は Vision が担う）
オピニオンマイニングは感情を対象ごとに分解して詳細な意見を取り出す機能である点
課金は 処理したテキスト量の従量が基本で、要約など一部は 非同期ジョブとして実行する点

観点	Azure AI Language	AWS の相当サービス
テキスト NLP（感情・NER 等）	Azure AI Language	Amazon Comprehend
医療テキスト解析	Text Analytics for health	Amazon Comprehend Medical
会話の意図理解	CLU（旧 LUIS）	Amazon Lex（意図抽出の領域）
翻訳	Azure AI Translator	Amazon Translate
音声の文字起こし	Azure AI Speech	Amazon Transcribe
権限付与	Entra ID + RBAC	IAM

ハンズオン / CLI例

# リソースグループを作成
az group create --name demo-rg --location japaneast

# 言語サービス（Azure AI services の Language リソース）を作成
az cognitiveservices account create \
  --resource-group demo-rg \
  --name demo-language-0614 \
  --kind TextAnalytics \
  --sku S \
  --location japaneast \
  --yes

# エンドポイントとキーを確認（アプリから呼び出す際に使う）
az cognitiveservices account show \
  --resource-group demo-rg \
  --name demo-language-0614 \
  --query "properties.endpoint" -o tsv

az cognitiveservices account keys list \
  --resource-group demo-rg \
  --name demo-language-0614 \
  --query "key1" -o tsv

# 取得したエンドポイントとキーを使い、REST API で感情分析を呼び出す例
# （ENDPOINT と KEY は上のコマンドの出力に置き換える）
curl -X POST "https://<ENDPOINT>/language/:analyze-text?api-version=2023-04-01" \
  -H "Ocp-Apim-Subscription-Key: <KEY>" \
  -H "Content-Type: application/json" \
  -d '{
        "kind": "SentimentAnalysis",
        "parameters": { "modelVersion": "latest" },
        "analysisInput": {
          "documents": [
            { "id": "1", "language": "ja", "text": "対応が早くてとても満足しています。" }
          ]
        }
      }'

Azure AI Language

解決する課題

主要概念と用語

仕様・制限・クォータ

内部の仕組み

設計パターン / ベストプラクティス

運用・監視

コスト

セキュリティ

Well-Architected の観点

試験で問われるポイント

関連サービス・比較

ハンズオン / CLI例

Azure AI Languageを実務で読む

解決すること

比較で見る軸

導入後に効く点

先に潰すリスク

判断チェックリスト

次に確認する観点