NTTドコモR&Dの技術ブログです。

AutomationからAutonomyへ ― エージェントは6Gネットワーク管理をどのように変革するのか ―

はじめに

こんにちは。私たちはRefik、Hamza、Oguzです。

私たちはミュンヘンにあるDOCOMO Euro-Labs(ドコモユーロ研)で、仮想化・自動化・データ駆動型のモバイルネットワーク管理について研究しています。EULは、docomoにおけるグローバル通信標準化の中核拠点です。私たちの活動は研究から3GPPやO-RANにおける国際標準化まで多岐にわたり、将来世代に向けた実用的で信頼できるネットワーク自律化を形づくることを目的としています。

本ブログでは、ネットワーク管理システムにおける自律型エージェントについて、それらがどのような影響を与えるのか、またネットワーク上で自律型エージェントを動作させるためにオペレータにどのような要件が求められるのかについて、私たちの考えを共有します。本記事は、モバイルネットワークの運用、設計、標準化に関わるすべての方で、6Gネットワーク管理における「真の自律性」がオペレータにとって何を意味するのかを理解したい方を対象としています。

私たちはYouTube動画にも出演しています。ぜひご覧ください。

www.youtube.com

www.youtube.com

www.youtube.com

今日のマルチベンダネットワークにおいて、自動化とは、作業はこなすものの、何をするにも人の指示を必要とするロボットを所有しているようなものです。さらに、自動化プラットフォームごとに異なる言語を話し、ネットワークはスクリプトよりも速く変化し、ハードウェアからクラウドに至る各レイヤが、必ずしも噛み合わない新たなパズルのピースを追加していきます。

5Gネットワーク管理システムには、私たちネットワークオペレータ向けの自動化機能は存在しますが、真の自律性を実現するには、オペレータの期待を理解し、自ら適応し、常に人が付き添わなくても安全に意思決定できるシステムが必要です。しかし、これは現時点ではまだ実現されていません。ネットワークがエンドツーエンドで、かつ信頼できる形で自ら考えられるようになるまでは、運用エンジニアはネットワークを維持するための「カフェイン過多な翻訳者」であり続ける必要があります。だからこそ、6Gネットワーク管理システムでは共通標準を適用し、スムーズで信頼性の高い自律運用を可能にし、オペレータがシステムに信頼を持てるようにすることが重要なのです。

1. 現在の状況:ネットワーク管理の自動化

3GPPは、モバイルネットワークと端末が世界中で円滑に動作するための技術的な「ルール」を合意するために企業が集まるグローバル組織です。これは、スマートフォンの“魔法”が機能することを保証する国際的な設計者の一つと考えることができます。3GPPの作業グループの一つであるSA1は、AIエージェントを「他のエンティティに代わって、環境との相互作用、コンテキスト情報の取得、推論、自己学習、意思決定、タスク実行(単独または他のAIエージェントとの協調)などを通じて、特定の目標を達成する自動化された知的エンティティ」と定義しています。この定義は、6Gネットワーク向けAIエージェントの理解と標準化を3GPP作業グループ間で整合させるのに役立っています。この定義を用いたAIエージェント間の相互作用の例が、以下の図に示されています。

図1: ネットワーク内エージェントの連携の例

3GPP SA5は、モバイルネットワークの管理および保守を担当し、ネットワークを管理・制御し、効率的に機能させるための標準を策定しています。そのため、6Gに向けた準備として、3GPP SA5は効率的で信頼性の高い運用を実現するために、知的なネットワーク管理者としてAIエージェントを活用することを検討しています。3GPP SA1によるAIエージェントの定義を考慮すると、いくつかの管理サービス(MnS)の仕様はすでにこの定義を満たしています。例えば、Rel-17以降で規定されている3GPP SA5のIntent Handling Function(IHF)は、別のエンティティ(MnSコンシューマと呼ばれる)に代わって特定の目標を達成します。これらの目標は、無線ネットワーク期待、コアネットワーク期待、無線サービス期待、ネットワーク保守期待といった意図(intent)として正式に定義されています。そのため、IHFは、意図を達成するために協調して動作する単一または複数のエージェントと見なすことができます。さらに、IHFは他のエージェントと連携することも可能です。3GPP SA5で規定されている管理サービスプロデューサの中で、AIエージェントの説明に当てはまる別の例がClosed Control Loop(CCL)です。CCLは、監視、分析、計画、実行を行い、単一または複数のエージェントとして実装することができます。また、Management Data Analytics(MDA) MnSプロデューサも、特定のタスクに対する推論や推定を提供するため、AIエージェントと見なすことができます。

ネットワーク管理の自動化に取り組んでいるのは3GPP SA5だけではありません。従来のモバイルネットワークを、オープンで、インテリジェントかつ仮想化され、相互運用可能なRANネットワークへと変革することを目的とした国際的な業界コンソーシアムであるO-RAN Allianceも、RANネットワーク内のサービス管理およびオーケストレーションの標準化に取り組んでいます。その一環としてO-RANは、非リアルタイム最適化、ポリシー管理、AI/MLベースの分析を行う、非リアルタイムRAN Intelligent Controller(RIC)アプリケーションであるrAppsを導入しました。

では、5Gネットワーク管理システムですでにこれらの機能やアプリケーションが実現されている中で、6Gでは何が本当に異なるのでしょうか。その答えは、より効率的で最適化されたネットワーク運用を実現するための「完全な自律性」です。多くの場合、これらの自動化機能やアプリケーションは高度なAI/MLモデルを活用します。それらは内部知識を更新し、変化する状況に動的に適応する必要があります。これにより、運用における人の介入を最小限に抑えつつ、一定レベルの自律性を実現することが可能になります。

しかし、すべてが自律化したからといって、オペレータの課題が消えるわけではありません。自律ネットワークを運用するオペレータにとって最大の課題は「可視性の喪失」です。特に緊急対応時には、オペレータは即時の制御を必要とします。適切なツールがなければ、自律ネットワークは連鎖反応のシットコムのような状況に陥るリスクがあります。エージェントAがエージェントBに影響を与え、エージェントBがエージェントCをトリガーし、エージェントCがKPIを誤って解釈し、バタフライ効果が発生するのです。

2. 6Gネットワーク自律化に対するオペレータの要件

図2:6Gネットワーク自律化に対するオペレータの要件

説明可能性(Explainability)

説明可能性とは、AI/MLモデルを神秘的な「ブラックボックス」から、人間が理解できるシステムへと変えることです。AIエージェントにおける説明可能性は、オペレータがエージェントの意思決定を理解するのに役立つべきです。適切な説明可能性があれば、オペレータはアルゴリズムの振る舞いの背後にある論理を追跡でき、その出力を「魔法」として受け取る必要はなくなります。3GPP SA5におけるML推論の説明可能性属性を定義する最近の取り組みは良い出発点ですが、動的で複雑な自律型6G管理システムにおける実運用の説明可能性ニーズには、まだ不十分です。特に、以下のようなより詳細な情報が求められます。

  • どのような相互作用や因果関係が判断に影響を与えたのか(例えば、他のAIエージェントとの相互作用)
  • コンテキストによってモデルの振る舞いが異なったかどうか

6Gネットワーク管理システムにおける自律型AIエージェントは、動的な条件、複数モデル、マルチベンダのパイプライン全体にわたって判断を正当化しなければなりません。自律型6Gネットワーク管理における意思決定の追跡可能性には、どのエージェントやモデルが起動され、どのような中間判断が行われ、どのようなネットワークへのアクション(例えば設定変更)が導き出されたのかという、完全な推論チェーンを再構築できる能力が求められます。

トラブルシューティング

ネットワーク管理におけるトラブルシューティングとは、サービスレベル目標を満たし、正常なサービス運用を回復または維持するために、ネットワーク内の問題を検出、診断、切り分け、解決する体系的なプロセスです。オペレータはアラームや異常な性能低下といった手がかりをたどり、不具合を起こしているコンポーネントを特定して修正し、ネットワーク全体を通常運用に戻します。自律型エージェントはリアルタイムデータや学習済みの振る舞いに基づいて意思決定を行うことが期待されるため、トラブルシューティングの第一歩は、それらが環境を正しく理解しているかどうかを確認することです。オペレータは、入力、データパイプライン、テレメトリフィード、センサーを検証する必要があります。自律型エージェントが予期せぬ動作をしている場合、モデルドリフトやデータ破損の兆候を探す必要があります。

また、自律型エージェントは他のエージェントと連携して動作することが想定されているため、オペレータはそれらの間でポリシーの衝突が発生していないかを確認し、必要に応じて、サービス継続性を維持しながらセーフモード運用へ移行する判断を行います。

信頼性(Trustworthiness)

信頼できる機械学習は、MLの学習、テスト、推論フェーズ(3GPP TS 28.105で規定)全体にわたって、オペレータ視点で非常に重要な要件であり、自律型エージェントに組み込まれる場合には、さらに重要性が高まります。これらの自律型エージェントは、人の継続的な介入なしに意思決定を行い、さまざまなレベルの自律性で動作します。その行動はネットワーク運用に直接影響を与えるため、それを支えるMLコンポーネントは、説明可能で、公平で、頑健でなければなりません。EU AI ActやISO/IEC標準などの規制ガイダンスでは、透明性、非差別性、技術的堅牢性、人による監督といった主要な信頼要素が示されており、これらはMLライフサイクル全体を通じて一貫して適用される必要があります。そのため、オペレータは説明可能性指標、公平性指標、頑健性指標といった標準化された信頼性指標に依存します。公平性指標は、エージェントの判断が特定の集団や特定ベンダの製品に不均衡な影響を与えていないかを、ディスパレートインパクトや平均オッズ差などの指標を用いて評価します。頑健性指標は、欠損データ、ノイズ、環境変化といった条件下でもエージェントが信頼性高く動作できることを保証します。オペレータとしては、自律型エージェントをネットワーク運用に任せるのであれば、最も信頼しているエンジニアと同じくらい信頼できるよう、明確で標準化された信頼性指標を持ちたいと考えています。

マルチベンダ相互運用性

5Gでは、管理機能、ポリシー、データモデルがベンダごとに異なる形で公開されているため、マルチベンダ環境における自動化は苦戦しています。現在の標準があっても解釈の違いが残り、ドメイン間で信頼性のある連携ができない非互換なデータスキーマやプロセスが生じています。ネットワークがクラウドネイティブかつAI駆動型のアーキテクチャへ進化するにつれ、この分断はさらに顕著になります。異なるベンダの自律型エージェントは、ネットワークを一貫した形で認識し、その判断を理解可能な形式で交換する必要があります。このレベルの相互運用性がなければ、エージェントは協調者ではなく孤立したコンポーネントとして振る舞い、ネットワークの競合動作や予測不能な挙動を引き起こします。また、エコシステム全体で一貫したライフサイクル管理、ガバナンス、運用制御を確保するため、標準化された方法で管理される必要があります。

セキュリティ・バイ・デザイン

ネットワークが自律化に向かうにつれ、セキュリティは後付けではなく、最初から組み込まれる必要があります。6Gでは、自律型エージェントがデータを分析し、意思決定を行い、人の継続的な介入なしに行動するため、データ、モデル、通信チャネルのいずれかに問題があれば、それが即座に運用リスクとなります。攻撃者はもはや従来のネットワークノードを直接狙う必要はなく、学習データの改ざん、入力の操作、エージェント間通信のなりすましだけで混乱を引き起こすことが可能になります。そのため、すべてのエージェントには、強力な認証、完全性チェック、アクセス制御、継続的な信頼検証が求められます。

データガバナンスとプライバシー遵守

自律型エージェントが6Gネットワークにおいて重要な存在になるにつれ、それらが利用するデータの量と機密性は飛躍的に増加します。そのため、強固なデータガバナンスが不可欠となります。オペレータは、データの収集、ラベリング、共有、保持方法について明確なルールを持ち、標準化されたメタデータ、データフローの追跡、厳格なアクセス制御を必要とします。これらのルールは、機密情報を露出させたり、組織境界を越えたりすることなく、エージェントが信頼性の高い高品質なデータを受け取ることを保証します。プライバシー遵守も同様に重要であり、GDPR、EU AI Act、通信分野固有のデータ保護規則などに対応する必要があります。自律型エージェントは、データ最小化、匿名化、目的制限を適用しなければなりません。また、生データへの直接アクセスが制限されている場合でも、フェデレーテッドラーニング、差分プライバシー、セキュアアグリゲーションなどの手法を用いて、効果的に機能する必要があります。

パフォーマンス制約

6Gにおける自律型エージェントは、新しい6Gユースケースを支えるため、現在のネットワーク管理システムよりもはるかに厳しい遅延要件の下で、ミリ秒単位の意思決定を求められる可能性があります。精度も同様に重要であり、誤った予測は不要なアクションを引き起こしたり、サービス品質を悪化させたりします。信頼性も強固なAIフレームワークを構成する重要な要素です。エージェントは、負荷変動、障害イベント、予測不能な状況下でも一貫した挙動を示さなければなりません。

3. 配置オプション:エージェントはどこで動作するのか

ネットワークが自律化に向かうにつれ、実務的に最も大きな問いの一つが「これらのエージェントは実際にどこで動作すべきか」です。その配置場所は、反応速度、取得できる情報、システム全体との安全な連携方法を左右します。6Gでは、目的に応じて異なる場所にエージェントが存在すると想定されます。全体計画を担うもの、超高速応答を担うもの、そしてそれらを調整するものです。適切な配置モデルの選択は、自律性、安全性、透明性、そしてオペレータが制御を維持できるかどうかに直接影響します。

集中型エージェント

集中型エージェントは、オペレータのクラウドや中央管理システム上で動作し、ネットワーク全体を可視化できる戦略的プランナーとして機能します。より多くの計算資源を活用でき、ドメイン、ベンダ、レイヤをまたいだ意思決定を調整できます。

分散型エージェント

分散型エージェントは、RANノード、エッジクラウド、あるいはネットワーク機能に組み込まれるなど、現場に近い場所で動作し、状況変化に即座に対応するための速度と文脈を提供します。中枢的な知能を提供する集中型エージェントと組み合わせることで、分散型エージェントはネットワークの神経系として機能し、ローカルで迅速かつ状況に応じたアクションを可能にします。

その他の配置に関する考慮事項

さらに、エージェントはフェデレーテッド方式やプライバシー保護手法を通じてオペレータ間で協調したり、実ネットワークに適用する前にデジタルツイン内で意思決定を学習・検証したりすることも可能です。これらの配置オプションにより、オペレータは自律化の導入方法をより細かく制御でき、パフォーマンス、ガバナンス、安全性のバランスを現実的に取ることができます。

4. 6Gに向けて:オペレータから完全に信頼される自律ネットワーク管理

結論として、現在のルール駆動型自動化から、真に自律的な6Gネットワーク管理へ移行するには、単にアルゴリズムを高度化するだけでは不十分です。明確な説明可能性、容易なトラブルシューティング、信頼性、パフォーマンス要件に沿ったセキュリティ・バイ・デザイン、そしてより厳しい性能要件の下で、ベンダやネットワークレイヤをまたいで一貫して動作する基盤が必要です。自律型エージェントが本当に有用になるのは、オペレータがその意思決定の理由を理解し、他のエージェントとの相互作用を追跡でき、その判断が公平で安全であり、期待に沿っていると信頼できる場合に限られます。そのためには、3GPPやO-RANといった標準化団体(SDO)が、エージェントの推論を可視化し、その挙動を検証し、ネットワーク進化に合わせて安全に適応できる、意味のある標準化ソリューションを提供する必要があります。

私たちが6Gネットワーク管理に期待しているのは、完全な自律性を、謎めいたブラックボックスから、日々の運用における透明で信頼できるパートナーへと変えることです。AIエージェントが自らの行動を明確に説明し、現実世界の複雑性に対処し、マルチベンダ環境でもシームレスに連携できるようになったとき、自律性はオペレータが本当に頼れるものになります。オペレータの要件に対応した明確な6G標準が整えば、自律型エージェントは予測不能な相棒から、協調的な同僚へと成長し、ネットワークをより賢く、より安全に、そしてカフェインに頼らず運用できるよう支援してくれるでしょう。

翻訳:たなかいつま(英語原文はこちら