watsonx.governanceのエージェント・モニタリングと洞察、セキュリティー・メトリクス

机に座った2人が、街の窓を背景にノートPCを見ている

著者

Neil Leblanc

watsonx.governance Go-To-Market Lead

IBM

リスクとコンプライアンスのリーダー、セキュリティー・チーム、AIオーナーは、「AIエージェントが本番環境で何をしているのかを正確に確認できるか?」「AIガバナンスとAIセキュリティー体制を統合的に把握できるか?」という2つの疑問によく直面します。

watsonx.governanceを使用すると、その両方に対する答えが「イエス」になります。

  1. エージェントの監視と洞察:企業は、本番環境でのエージェント型AIの動作、アクション、意思決定を可視化できます。
  2. ガバナンス・コンソールのセキュリティー・メトリクス:Guardium AI Securityに関する洞察をガバナンス・ワークフローに直接取り入れることができます。

これらの主要な機能を組み合わせることで、スプレッドシートの追跡やタブの切り替えを必要とせずに、ポリシー、保護、性能など、AIの信頼性のための包括的なソリューションが実現します。

エージェント監視:エージェントの透明性を確保し、自信を持ってデプロイ

企業は、生産性の次のフロンティアとしてAIエージェントに注目しています。単にアウトプットを生成する従来のモデルとは異なり、エージェントはタスクを連鎖させ、複数のシステムを利用するなどのアクションを実行できます。これにより、反復的なワークフローを自動化し、意思決定を加速し、チームがより価値の高い作業に集中できるようになります。

しかし、この約束には新たなリスクが伴います。エージェントはより自律的に動作するため、意思決定がどのように行われるかを把握し、意図したとおりに動作しているかを確認することが難しくなります。今日の監視業務は、時間がかかり、手作業で、細分化されていることが多く、開発者はシステムの信頼性、追跡、ファイン・チューニングに必要なツールを手に入れていません。スケーラブルなガバナンス・インフラストラクチャーがなければ、企業はエージェント型AIを評価、制御し、自信を持って拡張することが困難になります。

この課題に対処するために、watsonx.governanceの今後のリリースでは、watsonx.governanceにエージェント・モニタリングと洞察を導入する予定です。この新しい機能は、本番環境のエージェント・アプリケーションを監視します。エージェント洞察は、意思決定、動作、性能をリアルタイムで追跡し、メトリクスがしきい値を超えたときにアラートを発行します。これにより、プロアクティブな管理、迅速なトラブルシューティング、およびエージェント主導の成果に対する信頼性の向上が実現します。

エージェント・ガバナンスの主な改善

  • ループ内評価:AIエージェントのパフォーマンス(品質と動作)を正確に評価するためにメトリクスを更新します。これにより、会話、インタラクション、ツールの各レベルで集約されたすべてのパフォーマンス・メトリクスが1か所に表示されるため、効率が向上し、エージェントのパフォーマンスの全体像が把握できます。
  • 品質と精度の向上:2026年第1四半期には、根本原因分析を通じて実用的な洞察を導入します。これにより、チームは何が機能しているかを測定し、長期にわたる性能を比較し、AIとエージェントを継続的に最適化してファイン・チューニングできるようになります。
  • リアルタイムの実験追跡:すべての変更、メトリクス、アウトプットを1か所でまとめて、エージェント・アプリケーションの複数の実行を評価・比較できます。これにより、すべての変更、メトリクス、アウトプットに関するエージェント開発プロセスの構造と可視性が得られ、実稼働までの時間が短縮されるだけでなく、カスタム・ランキングを通じてプロジェクトにとって最も重要なメトリクスのみに焦点を当てることで、ノイズが排除され、効率が向上します。これにより、意思決定が迅速化され、エージェントの性能がファイン・チューニングされます。
  • レポート:標準装備のダッシュボードと、AIエージェントが意図した動作範囲から外れた場合に表示される自動アラートにより、チームはエージェントをより迅速にテスト、導入、拡張できるようになります。これにより、エージェント洞察ダッシュボードでの事前対応的な管理が推進され、長期にわたる性能の傾向が追跡されます。また、リアルタイムでリスクを軽減し、エージェントがエラーやハルシネーションを起こした場合に迅速に通知されるため、信頼感が得られ、タイムリーな介入と修正が可能になります。

役立つ方法

  • リスクとコンプライアンスにより、エージェントが承認された範囲内にとどまり、決定が監査可能であることが保証されます。
  • AI/ML運用と開発者は、トラブルシューティングをより迅速に行い、効率を向上させ、信頼性の高い結果を保証します。
  • ビジネス・リーダーは、責任を持ってエージェント型AIプログラムを拡張し、最大のROIを引き出すという自信を深めることができます。

実際の例

調達を自動化するAIエージェントは、範囲外でベンダー契約を承認しようとする可能性があります。監視を有効にすると、そのアクションにリアルタイムでフラグが立てられるため、チームは下流の問題が発生する前に、エージェントの調査、ポリシーの調整、改良を行うことができます。

セキュリティー・メトリクス:リスクを確認し、迅速に意思決定を行う

AIガバナンスとAIセキュリティーは、並行したワークストリームとして扱われることがよくあります。この状況は、Guardium AI Securityをwatsonx.governanceコンソールに新たに統合することで変わります。リスクやコンプライアンスのリーダーは、ユースケースを承認・管理する場所で、ライブのセキュリティー体制を直接確認できます。

ガバナンスとセキュリティを統合する方法:

  • ユースケースごとのセキュリティー・パネル:各AIユースケースで表示されるのは、脆弱性スキャンとペネトレーション・テストの成果、リアルタイム検知(プロンプト・インジェクションの試行など)、7日/30日間の傾向など、簡潔なセキュリティー・カードです。
  • プログラム・レベルのセキュリティー・ダッシュボード:ユースケース全体の集計ビュー、重大度別の未解決の調査結果、経時的な攻撃アクティビティー、修復ステータスについての情報を提供します。
  • 対象範囲拡大のロードマップ:初日のメトリクスは、脆弱性、ペネトレーション・テスト、検知に焦点を当てており、設定ミスやシグナルは今後追加される予定です。

役立つ方法:

  • リスクとコンプライアンスでは、クリティカルな脆弱性をリアルタイムで可視化するライブ・セキュリティー・データを使用してレビューを迅速に実行します。
  • 詳細な検出と保護のためにGuardiumを使用するセキュリティー・チームは、AIガバナンスの利害関係者と主要なメトリクスを簡単に共有できます。AIオーナーは、ユースケースに関連付けられた実行可能なメトリクスを確認し、セキュリティーの脆弱性やリスクの全体像を把握できます。

実際の例

ITチケットを管理するAIエージェントはガバナンスに登録され、ガバナンス内でリスクが階層化されます。Guardiumは、不正使用や漏洩がないかを継続的にテストします。現在では、重大度の高い調査結果、ペネトレーション・テストの日付、ブロックされた試行がリスク・レコードの横に直接表示されるため、完全なコンテキストで承認を迅速に行えるようになりました。

1つのロードマップ、1つの信頼できる情報源

どちらの新機能も、AIプログラムは信頼できる唯一の情報源上で実行されるべきであるという、同じ原則に基づいています。エージェントの監視は、AIエージェントの信頼性、説明責任、整合性を維持するために、管理されたエージェント・カタログ、きめ細かな制御、より豊富なオブザーバビリティーによって進化します。

セキュリティー・メトリクスは、脆弱性や設定ミスの検知を超えて、Guardiumとのより深い統合へと拡大し続けます。

セキュリティーとガバナンスを統一したフローに統合することで、企業は迅速、安全に、かつ自信を持ってAIを管理・拡張できるようになります。

管理され、安全で、信頼できるAIの構築に備える

すでにwatsonx.governanceをご利用の場合は、リリースに注目し、これらの主要な機能が利用可能になり次第、最もクリティカルなAIユースケースで有効化できるようにご準備ください。

IBMチームは、お客様が進むべき道を特定し、これらの今後の機能を活用して管理された安全で信頼できるAIを構築するための準備を支援します。

watsonx.governanceで信頼できるAIを拡張