手当たり次第に書くんだ

飽きっぽいのは本能

パブリッククラウドで NFV は成立するのか – 仮想アプライアンスを置く前に考えること

NFV 型のネットワーク機能をパブリッククラウドへ持ち込めるかどうかは、単に VM が起動できるか、仮想アプライアンスのイメージが Marketplace にあるか、という話ではありません。

問題になるのは、そのネットワーク機能が前提としているアンダーレイ、オーバーレイ、帯域、遅延、可用性、観測、障害切り分け、責任分界です。オンプレミス NFV の設計感覚をそのままクラウドへ移すと、見た目は同じでも成立条件が変わります。

結論として、パブリッククラウド上で NFV 型 NF は成立する場合があります。ただし、それはオンプレミス NFV をそのまま移植できるという意味ではありません。クラウドの制約を前提に、ネットワーク機能の責務を再設計できる場合に成立します。

参考
書籍
参考書籍

Amazon Web Services 基礎からのネットワーク&サーバー構築 改訂 4 版

AWS VPC、サブネット、ルーティング、VPN、Direct Connect など、クラウドネットワークの基礎を確認したい場合の参考書籍です。NFV 型の構成をクラウドへ持ち込む前提整理として紹介します。

Amazon で見る

このリンクは Amazon アソシエイトリンクです。

まず結論

パブリッククラウドで NFV 型 NF を評価するときは、次のように分けて考えるのがよいです。

観点見ること判断
VM として動くか仮想アプライアンスイメージ、対応インスタンス、ライセンスこれは入口であり、成立性そのものではない
dataplane が成立するか帯域、pps、single-flow、暗号処理、セッション数NFV としての実効性能を左右する
経路に自然に入るかVPC Route Table、TGW、GWLB、ENI、対称経路無理に挟むと非対称通信や切り分けが重くなる
クラウド標準機能で足りるかSecurity Group、NACL、ALB/NLB、NAT Gateway、Network Firewall など仮想アプライアンスが過剰な場合がある
責任分界が明確かクラウド事業者、利用者、製品ベンダー、回線事業者障害時にどこを見るかを事前に決める

つまり、重要なのは「その製品がクラウドで動くか」ではなく、そのネットワーク機能をクラウド上のどの責務として置くのかです。

NFV 型 NF とは何を指すのか

ここでいう NF は Network Function、つまりネットワーク機能です。Firewall、Router、VPN、NAT、IDS/IPS、Load Balancer、Proxy など、物理アプライアンスで提供されていた機能を、汎用サーバー上の VM やソフトウェアとして動かす考え方が NFV です。

分類主な関心事
ルーティング系仮想 Router、BGP Router、VyOS経路制御、冗長化、収束、対称経路
セキュリティ系仮想 Firewall、IDS / IPS、DPI検査性能、セッション維持、ログ、スケール
接続系VPN、IPsec、NAT暗号処理、throughput、single-flow、片方向障害
負荷分散系Load Balancer、ProxyL4 / L7 処理、ヘルスチェック、証明書、セッション

オンプレミスであれば、これらを VM として載せるだけでなく、物理 NIC、スイッチ、VLAN、LAG、NUMA、CPU ピニング、SR-IOV、DPDK なども合わせて設計できます。パブリッククラウドでは、利用者が直接握れる範囲がもっと上位の抽象に寄ります。

アンダーレイとオーバーレイを分ける

パブリッククラウドで NFV 型 NF を考えるとき、最初に分けるべきなのはアンダーレイとオーバーレイです。

意味利用者ができること
アンダーレイクラウド事業者が管理する物理ネットワーク、物理サーバー、物理回線、SDN 基盤基本的には直接制御できない
オーバーレイVPC、Subnet、Route Table、ENI、Security Group、NACL、TGW、VPN、Direct Connect などクラウドが公開する API と制約の範囲で設計できる

この点は、AWS VPC に L2 はあるのか で整理した話とつながります。クラウドでは L2 の自由度が消えたというより、利用者の設計対象から外れ、クラウド事業者の責任境界内に封じ込められます。

オンプレミス NFV では、アンダーレイを自分で設計し、その上に NF を載せる発想になります。パブリッククラウドでは、アンダーレイを直接握らず、クラウドが提供する到達性モデルの中に NF を置くことになります。

成立性を決めるのは VM の有無ではない

クラウド Marketplace には、多くの仮想 Firewall や仮想 Router があります。そのため、表面的には NFV 型 NF はクラウド上でも成立しているように見えます。

しかし、運用上の成立性は、VM として起動できるかでは決まりません。見るべきなのは、dataplane と責務分界です。

  • 想定した帯域を継続的に処理できるか
  • single-flow や暗号処理で詰まらないか
  • 片系障害時に経路とセッションをどう維持するか
  • Route Table、TGW、GWLB、ENI の制約と矛盾しないか
  • スケールアウトできる構成になっているか
  • 障害時の切り分け責任が利用者側に残りすぎないか
  • クラウド標準機能で代替できる部分を過剰に仮想アプライアンス化していないか

NFV 型 NF は、クラウド上に置けるから成立するのではありません。クラウドのネットワーク抽象化、可用性モデル、帯域制約、運用モデルの中で、その NF が自然な責務を持てる場合に成立します。

EC2 の帯域は物理ポートの感覚で読まない

オンプレミスでネットワーク機器を設計する場合、物理ポート、LAG、スイッチ容量、NIC、PCIe、CPU、メモリ、NUMA などを積み上げて性能を見積もります。

一方、EC2 ではインスタンスタイプごとのネットワーク性能、baseline、burst、single-flow、AZ 間通信、NAT や Load Balancer などのマネージドサービス制約が絡みます。AWS 公式ドキュメントでも、特定サイズ以下のインスタンスは baseline bandwidth を持ち、一定時間 burst bandwidth を使えると説明されています。

観点オンプレミス NFVパブリッククラウド
物理 NIC自分で選定、交換、冗長化できるインスタンスタイプとクラウド仕様に依存する
CPU / NUMACPU ピニング、HugePages、NUMA を強く意識できる専有ホスト等を除き抽象化される部分が大きい
帯域物理ポートや LAG から見積もるbaseline / burst / flow 制約を読む
経路制御物理 Router、VRF、VLAN を直接扱えるVPC、Route Table、TGW、VPN、Direct Connect で扱う
障害切り分け自分の設備範囲を直接調査できるクラウド側ブラックボックスとの境界が残る

この点は AWS EC2 のネットワーク帯域をどう読むか で扱った内容と同じです。NFV 型 NF では、EC2 の「最大何 Gbps」だけではなく、継続帯域、flow、暗号処理、アプライアンス製品側の処理能力を合わせて見る必要があります。

Gateway Load Balancer は NFV の万能解ではない

AWS には Gateway Load Balancer があります。AWS 公式ドキュメントでは、GWLB は Firewall、IDS/IPS、DPI などの仮想アプライアンスを deploy、scale、manage するためのサービスとして説明されています。GWLB は OSI Layer 3 で動作し、GENEVE protocol を使って target appliance へ traffic を転送します。

これは、クラウド上で仮想アプライアンスを扱うための非常に重要な部品です。ただし、GWLB があるからオンプレミス NFV をそのまま再現できる、という意味ではありません。

  • GWLB は仮想アプライアンスをスケールさせやすくするが、アプライアンス本体の処理能力は別に評価する必要がある
  • TGW と組み合わせる場合、flow symmetry や appliance mode の理解が重要になる
  • TLS 復号、DPI、IDS/IPS などは CPU 負荷やセッション管理の影響を受ける
  • 経路設計、戻り通信、AZ 障害、cross-zone の扱いを設計しないと事故りやすい

GWLB は NFV 型 NF をクラウドの到達性モデルへ載せるための部品です。低レイヤーの自由度を取り戻すものではありません。

仮想アプライアンスを置くべき場面

仮想アプライアンス型の NF を置くこと自体が悪いわけではありません。むしろ、次のような場合は合理的です。

  • 既存の監査要件やセキュリティポリシー上、特定製品を通す必要がある
  • オンプレミスと同じ Firewall policy、ログ形式、運用手順を一定期間維持したい
  • IPsec、BGP、NAT、Firewall policy などで既存拠点との互換性が重要になる
  • クラウド標準機能だけでは満たせない検査、制御、可視化がある
  • 移行期間中の中継点として、物理アプライアンス相当の責務を一時的に置きたい

ただし、この場合でも「オンプレミス機器をクラウドに置き換えた」と考えるより、「クラウド上に特定責務を持つネットワーク制御点を置いた」と考える方が安全です。

仮想アプライアンスを避けた方がよい場面

逆に、クラウド標準のネットワーク機能で自然に実現できることまで仮想アプライアンスへ寄せると、構成が不自然になります。

  • 単純な通信許可をすべて仮想 Firewall に集約する
  • クラウドの Load Balancer で足りる処理を VM 上の L4 / L7 装置に寄せる
  • NAT、routing、Security Group、NACL、IAM と重複する制御点を増やす
  • 高可用性をクラウドの managed service ではなく自前クラスタだけで組もうとする
  • 性能問題の原因がクラウド側の帯域モデルなのに、NF のチューニングだけで解決しようとする

クラウドでは、ネットワーク機能を VM として動かすことよりも、クラウドが提供する制御面とデータ面に合わせて責務を分けることの方が重要です。

Direct Connect や VPN はラックの延長ではない

Direct Connect や VPN を使えば、オンプレミスとクラウドを接続できます。しかし、それによってクラウドがオンプレミスラックの延長になるわけではありません。

接続回線ができても、クラウド側の VPC、Route Table、TGW、Security Group、NACL、仮想アプライアンス、managed service はクラウドの制約の中で動きます。オンプレミスの L2 / L3 設計をそのまま引き伸ばす感覚で扱うと、経路制御、非対称通信、障害切り分けで苦しくなります。

クラウド接続は、物理ネットワークの延長というより、異なる運用モデルを持つネットワーク同士の接続点として考える方が自然です。

成立する構成と成立しにくい構成

構成成立性理由
クラウド標準機能を中心にし、必要な箇所だけ仮想アプライアンスを使う高い責務が分かれ、クラウドの運用モデルに乗りやすい
GWLB / TGW を使って inspection VPC を設計する条件付きで高いflow symmetry、appliance mode、AZ 障害、戻り通信を設計できるなら有効
拠点接続や監査要件のために特定 NF を通過点として置く条件付きで成立目的が明確で、処理範囲を限定できるなら有効
オンプレミス NFV の構成をほぼそのまま VM として移植する低いアンダーレイ制御、性能見積もり、障害切り分けで無理が出やすい
高帯域、低遅延、物理制御前提の NF をそのまま置く成立しにくいクラウドの抽象化とアンダーレイ非制御性が問題になる

設計判断の軸

パブリッククラウド上で NFV 型 NF を使うかどうかは、次の軸で判断すると整理しやすくなります。

判断軸見るべきこと
性能必要帯域、pps、flow 数、暗号処理、遅延、burst 特性
可用性AZ 障害、片系障害、経路切替、セッション維持
経路対称経路、戻り通信、TGW、GWLB、Route Table
運用監視、ログ、障害切り分け、アップデート、バックアップ
責務クラウド標準機能、仮想アプライアンス、オンプレミスの分担
移行性既存機器、既存ポリシー、既存監査との接続性

この判断軸を置くと、仮想アプライアンスを使うこと自体が目的ではないことが見えてきます。目的は、クラウド上のネットワーク責務をどこで処理するのが最も自然かを決めることです。

まとめ

パブリッククラウド上で NFV 型 NF は成立します。ただし、成立するのはオンプレミス NFV をそのまま持ち込めるからではありません。クラウドのアンダーレイ非制御性、VPC の到達性モデル、EC2 の帯域制約、GWLB / TGW の経路設計、運用責任を理解した上で、NF の責務を再定義できる場合に成立します。

パブリッククラウドでは、低レイヤーを握ることよりも、クラウドが提供する抽象化の中で責務を正しく切ることが重要です。仮想アプライアンスは便利な選択肢ですが、万能の置き換え先ではありません。

NFV 型 NF をクラウドで使うなら、最初に考えるべきなのは「その製品がクラウドで動くか」ではなく、「そのネットワーク機能をクラウド上のどの責務として置くのか」です。

参考資料

関連記事

パブリッククラウドで NFV は成立するのか – 仮想アプライアンスを置く前に考えること

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)

トップへ戻る