Skip to content

Load Balancing und Gateway

Kernfrage

Wenn ein einzelner Server die Last nicht mehr tragen kann, wie verteilt man Traffic "intelligent" auf mehrere Server-Instanzen? Load Balancing ist der "Verteiler" moderner verteilter Systeme. Dieser Artikel verwendet reale Beispiele (Milchtee-Kassen, Paketsortierung, Verkehrssteuerung), um die Designphilosophie und Engineering-Praxis von Load Balancing zu erklaeren.


1. Warum "Load Balancing"?

1.1 Ein reales Beispiel: Die Architektur-Evolution einer Website

Ein Startup hatte bei schnell wachsenden Nutzerzahlen ernsthafte Performance-Probleme:

Szenario-Rekonstruktion:

Phase 1: Einzelner Server
Nutzer -> Server (1 Kern, 2 GB)
         |
   1000 DAU -> 1000 gleichzeitige Besucher zu Spitzenzeiten
         |
Problem: CPU 100%, langsame Antwort, haeufige Abstuerze

⚠️ Fatale Probleme eines einzelnen Servers

  • Performance-Engpass: CPU 100%, Antwortzeit > 5 Sekunden
  • Single Point of Failure: Server faellt aus -> gesamte Website nicht erreichbar
  • Schwierige Skalierung: Nur vertikales Upgrade moeglich (CPU, Speicher hinzufuegen) - teuer und begrenzt

Verbesserte Architektur (mit Load Balancing):

Phase 2: Mehrere Server + Load Balancer
Nutzer -> Load Balancer (Nginx)
         |
       ├-> Server 1 (1 Kern, 2 GB)
       ├-> Server 2 (1 Kern, 2 GB)
       └-> Server 3 (1 Kern, 2 GB)

✨ Verbesserte Ergebnisse

  • Hoehere Performance: 3 Server verarbeiten parallel, Antwortzeit < 1 Sekunde
  • Hohe Verfuegbarkeit: Ein Server faellt aus, die anderen weiter im Dienst
  • Horizontale Skalierung: Mehr Performance? Einfach Server hinzufuegen

1.2 Alltags-Analogie fuer Load Balancing

Die Milchtee-Kassen

Stell dir vor, du betreibst einen trendigen Milchtee-Laden:

  • 1 Kasse: Kunden warten, die hinteren werden ungeduldig - schlechte Bewertungen
  • 3 Kassen: Mitarbeiter weisen Kunden verschiedenen Kassen zu - 3x effizienter

Load Balancer ist der "Kassenzuteiler":

  • Nutzer (Kunden) -> Service anfragen
  • Load Balancer (Zuteiler) -> Anfragen auf verschiedene Server verteilen
  • Server (Kassen) -> Anfragen verarbeiten
负载均衡器类型
从四层到七层,从硬件到软件的演进
传统架构单点
🖥️
Web Server
负载: 95% 🔥
负载均衡架构分布式
⚖️L4 Load Balancer
🖥️
S1
🖥️
S2
🖥️
S3
📦四层负载均衡 (L4)
工作原理

基于传输层信息(IP地址+端口)进行流量分发。不关心应用层内容,只做"快递分拣",因此性能极高。

典型产品
LVS (Linux Virtual Server)HAProxy (TCP模式)AWS NLBAzure Load Balancer
适用场景
  • 需要极高吞吐量的场景
  • TCP/UDP流量分发
  • 不需要内容识别的场景
  • 微服务间通信
性能对比一览
类型
处理层
性能
灵活性
成本
硬件负载均衡
L4/L7
$$$$$
四层负载均衡
L4 (传输层)
$$
七层负载均衡
L7 (应用层)
$$$
软件负载均衡
L4/L7
$

2. Was ist Load Balancing?

2.1 Layer-4-Load-Balancing (L4): Nur die Hausnummer betrachten

Arbeitet auf der Transportschicht (TCP/UDP), wie ein Paketbote, der nur deine Hausnummer (IP-Adresse + Port) ansieht, sich nicht dafuer interessiert, was in deinem Haus passiert.

Eigenschaften:

  • Extrem schnell: Nur einfache Adress-Weiterleitung, keine Paketinhaltsanalyse
  • Anwendungsfaelle: Datenbankverbindungen, Redis-Cache, Long-Polling-Game-Server
  • Repraesentative Produkte: LVS (Linux Virtual Server), AWS NLB, Azure Load Balancer

2.2 Layer-7-Load-Balancing (L7): Den Paketinhalt pruefen

Arbeitet auf der Anwendungsschicht (HTTP/HTTPS), wie ein Paketbote, der nicht nur die Hausnummer prueft, sondern auch das Paket oeffnet und den Inhalt untersucht, um basierend auf dem Inhalt zu entscheiden, wie es zugestellt wird.

Eigenschaften:

  • Intelligentes Routing: Kann basierend auf URL-Pfaden, HTTP-Headern, Cookies usw. praezise routen
  • Erweiterte Funktionen: SSL-Offloading, Inhalts-Caching, Komprimierung, WAF-Sicherheit
  • Anwendungsfaelle: Web-Anwendungen, API-Gateways, Microservice-Architektur
  • Repraesentative Produkte: Nginx, HAProxy, AWS ALB, Envoy

2.3 L4 vs L7 im Vergleich

DimensionLayer-4 (L4)Layer-7 (L7)
SchichtTransportschicht (TCP/UDP)Anwendungsschicht (HTTP/HTTPS)
EntscheidungsgrundlageIP-Adresse + PortURL, Header, Cookie, Body
VerarbeitungsgeschwindigkeitExtrem schnell (Kernel-Mode)Schnell (User-Mode-Analyse)
FunktionsumfangGrundlegende WeiterleitungSSL-Offloading, Caching, Komprimierung, WAF
Typische SzenarienDatenbank, Gaming, Long-PollingWeb-Anwendungen, API-Gateway, Microservices
Repraesentative ProdukteLVS, AWS NLBNginx, HAProxy, AWS ALB

3. Kernproblem 1: Wie verhindert man, dass "kaputte" Server weiter Anfragen bekommen?

3.1 Health Checks: "Kranke" Server nicht das System belasten lassen

Stell dir vor, eine deiner Kassen ist ploetzlich defekt, aber der Zuteiler weiss es nicht und schickt weiterhin Kunden dorthin. Die Schlange wird immer laenger, die Kunden sind unzufrieden.

Health Checks (Gesundheitspruefungen) sind der "Wachposten", der dieses Problem verhindert. Sie fuehren regelmaessig "Gesundheitsuntersuchungen" bei jedem Server durch, entdecken "kranke" sofort und entfernen sie aus der Rotation. Wenn sie "genesen" sind, werden sie wieder aufgenommen.

3.2 Aktive vs. Passive Health Checks

Aktive Health Checks: Der Load Balancer klopft aktiv an und fragt "Bist du noch da?"

  • Regelmassig Pruef-Anfragen senden (z. B. HTTP /health, TCP ping) | Bei Zeitueberschreitung oder Fehler-Response als ungesund eingestuft
  • Vorteil: Genaue und zuverlaessige Ergebnisse
  • Nachteil: Erzeugt zusaetzlichen Probe-Traffic

Passive Health Checks: Der Load Balancer "beobachtet" die Antworten des echten Business-Traffics

| Antwortzeit und Fehlerrate tatsaechlicher Anfragen statistisch erfassen

  • Bei mehrfachen aufeinanderfolgenden Fehlern als ungesund eingestuft
  • Vorteil: Kein zusaetzlicher Traffic
  • Nachteil: Benoetigt ausreichend Traffic-Samples fuer eine zuverlaessige Bewertung

Haeufige Falle: Zu "empfindliche" Schwellenwerte

Ein Team hat den Schwellenwert fuer die Antwortzeit beim Health Check auf 100 ms gesetzt, waehrend die durchschnittliche Antwortzeit der Anwendung zwischen 80-120 ms schwankte. Das Ergebnis: Server wurden haeufig als "ungesund" markiert, was dazu fuehrte, dass der Traffic zwischen "gesund" und "ungesund" hin und her sprang - die Gesamtverfuegbarkeit des Systems sank tatsaechlich.

Richtige Vorgehensweise: Der Schwellenwert sollte auf das 2-3fache der P99-Antwortzeit gesetzt werden, um genuegend Puffer fuer normale Schwankungen zu lassen.


4. Kernproblem 2: Wie gewaehrleistet man, dass "Stammkunden" immer denselben "Kassierer" finden?

4.1 Session-Persistenz: "Stammkunden" immer denselben "Kassierer" bedienen lassen

Stell dir vor, du bist Stammkunde in einem Milchtee-Laden und wirst jedes Mal von derselben Bedienung bedient. Sie kennt deine Vorlieben (halber Zucker, kein Eis), der Service ist schnell und persoenlich. Aber wenn du jedes Mal jemand Neues bekommst, musst du deine Wuensche immer wieder wiederholen - ineffizient.

Session-Persistenz (Session Persistence / Sticky Session) loest genau dieses Problem: Es stellt sicher, dass Anfragen desselben Benutzers immer an denselben Backend-Server geroutet werden.

会话保持机制
Cookie、IP哈希与粘性会话的技术对比
应用场景:
👤
用户A
👥
用户B
👨‍💼
用户C
请求
⚖️负载均衡器
🍪
Cookie 插入
通过HTTP Cookie保持会话
会话映射表
sess_abc123Server 1
sess_def456Server 2
sess_ghi789Server 1
🖥️
Server 1
10.0.1.10
选中
🖥️
Server 2
10.0.1.11
🖥️
Server 3
10.0.1.12
三种会话保持机制对比
🍪Cookie 插入
不受客户端IP变化影响
首次请求即可保持会话
客户端需支持Cookie
存在Cookie被禁用的风险
#️⃣IP Hash
无需客户端支持任何机制
无状态,LB重启不影响会话
客户端IP变化会丢失会话
难以做到真正的负载均衡
📝粘性会话
结合Cookie和IP两种方式优势
支持会话复制和故障转移
实现复杂,需要应用支持
会话复制带来性能开销

4.2 Drei Mechanismen der Session-Persistenz im Vergleich

MechanismusImplementierungVorteileNachteileAnwendungsfall
Cookie-EinfuegungLB fuegt Cookie in Response ein, nachfolgende Anfragen tragen dieses CookieUnabhaengig von IP-Aenderungen, ab der ersten Anfrage persistentClient muss Cookies unterstuetzen, koennten deaktiviert seinEinkaufswagen, Login-Status
IP-HashHash-Berechnung der Client-IP, Zuordnung zu einem bestimmten ServerKeine Client-Unterstuetzung erforderlich, zustandslosBei IP-Aenderung geht die Session verloren, schwer gleichmaessig zu verteilenOhne Cookies, WebSocket
Sticky-Session-TabelleLB verwaltet eine Zuordnungstabelle Session -> ServerUnterstuetzt Session-Replikation und FailoverVerbraucht LB-Speicher, erfordert zusaetzliche SynchronisationHochverfuegbarkeits-Anforderungen

5. Kernproblem 3: Wie realisiert man Zero-Downtime-Deployments?

5.1 Blue-Green Deployment: Zero-Downtime-Release durch "Umschalten per Knopfdruck"

Kerngedanke: Gleichzeitig zwei identische Produktionsumgebungen unterhalten (Blaue und Gruene Umgebung), aber nur eine Umgebung ist nach aussen hin aktiv.

蓝绿部署
零停机发布的经典策略,两套环境瞬间切换
🔵
蓝环境
v1.0.0
100% 流量
🟢
绿环境
v1.1.0
0% 流量
用户流量
👤
👤
👤
👤
👤
⚖️
负载均衡器
当前指向: 🔵 蓝环境
🔵蓝环境v1.0.0
🖥️B1
🖥️B2
🖥️B3
🟢绿环境v1.1.0
🖥️G1
🖥️G2
🖥️G3
蓝绿部署流程
1
绿环境部署
在绿环境部署新版本,进行冒烟测试
2
切换流量
将负载均衡器指向绿环境,流量瞬间切换
3
监控观察
观察绿环境运行状态,确认无异常
4
蓝环境升级
在蓝环境部署新版本,为下次切换做准备
蓝绿部署优缺点
优点
  • 零停机时间:流量切换在毫秒级完成,用户无感知
  • 快速回滚:发现问题可立即切回原环境,风险可控
  • 完整的预发布测试:新环境可完整测试后再接管流量
  • 数据一致性:无需处理新旧版本同时运行时的兼容问题
缺点
  • 资源成本高:需要同时维护两套完整环境,服务器成本翻倍
  • 数据库兼容性挑战:如果涉及数据库Schema变更,需要特别处理兼容性
  • 预热问题:新环境启动后可能需要时间预热缓存、连接池等
  • 不适合有状态服务:对于长连接、会话保持要求高的场景处理复杂

Workflow:

  1. Initialzustand: Blaue Umgebung laeuft mit v1.0 (Produktion), Gruene Umgebung steht bereit.
  2. Neue Version bereitstellen: Auf der Gruenen Umgebung v1.1 deployen und internen Smoketest durchfuehren.
  3. Traffic umschalten: Den Load Balancer auf die Gruene Umgebung umleiten - Traffic schaltet sofort auf v1.1 um.
  4. Ueberwachen und beobachten: Die Gruene Umgebung beobachten und sicherstellen, dass keine Anomalien auftreten.
  5. Alte Version behalten: Die Blaue Umgebung bleibt mit v1.0 fuer einige Zeit (z. B. 24 Stunden) als Versicherung fuer schnelles Rollback.

5.2 Canary Release: "Kleine Schritte" als schrittweise Rollout-Strategie

Der Name stammt von den historischen "Bergbau-Kanarienvoegeln" - Bergarbeiter nahmen einen Kanarienvogel mit in die Mine. Zeigte der Vogel Anomalien, bedeutete das Giftgas und die Bergarbeiter evakuierten sofort. Beim Software-Release bedeutet Canary Release: Zunaechst einen kleinen Teil der Nutzer die neue Version testen lassen und nach Beobachtung schrittweise den Anteil erhoehen.

金丝雀发布
灰度发布策略,小流量先行验证新版本
流量分配比例拖动滑块调整新旧版本流量占比
稳定版 v1.0.090%
金丝雀 v1.1.010%
实时流量模拟 总请求: 0 | 稳定版: 0 | 金丝雀: 0
用户请求
负载均衡器
⚖️
Canary:10%
后端服务
稳定版 v1.0.0
📦S1
📦S2
📦S3
金丝雀 v1.1.0
🧪C1
🧪C2
金丝雀发布最佳实践
📊渐进式放量
  • 1% → 5% → 10% → 25% → 50% → 100%
  • 每个阶段观察至少15-30分钟
  • 关键指标:错误率、延迟、吞吐量
🎯精准用户选择
  • 内部员工/测试用户先行
  • 按地域:选择特定区域用户
  • 按用户属性:VIP用户或普通用户
  • 按设备类型:iOS/Android/Web
🛡️自动回滚机制
  • 错误率超过阈值自动回滚
  • P99延迟异常触发告警
  • 关键业务指标下降自动回滚
  • 一键回滚:30秒内恢复旧版本
📈监控与指标
  • 基础设施:CPU、内存、磁盘、网络
  • 应用指标:QPS、错误率、延迟分布
  • 业务指标:转化率、订单量、收入
  • 用户体验:页面加载时间、交互延迟

Kerngedanke:

  1. Kleiner Traffic zuerst: Zunaechst 1% des Traffic auf die neue Version leiten.
  2. Metriken beobachten: Kontinuierlich Fehlerrate, Latenz und geschaeftliche Kennzahlen ueberwachen.
  3. Schrittweise erhoehen: Wenn alles normal, den Anteil schrittweise auf 5%, 10%, 25%, 50%, 100% erhoehen.
  4. Schnelles Rollback: Sobald Anomalien entdeckt werden, sofort den gesamten Traffic zurueck auf die alte Version schalten.

6. Kernproblem 4: Wie bringt man das System dazu, selbst zu "atmen"?

6.1 Auto-Scaling: Das System wie ein Restaurant "flexibel besetzen" lassen

Stell dir vor, du betreibst ein Restaurant:

  • Mittagsspitze: 10 Kellner benoetigt, aber um 15 Uhr braucht man nur 2
  • Wenn immer 10 Kellner da sind: Personalkosten explodieren
  • Wenn immer nur 2 da sind: Zur Spitze warten die Kunden zu lange und gehen

Auto-Scaling laesst das System wie ein Restaurant "flexibel besetzen" - bei viel Traffic automatisch Server hinzufuegen, bei wenig Traffic automatisch abbauen.

自动扩缩容
基于CPU、内存、QPS的智能弹性伸缩
扩容指标:
实时监控 实时
💻CPU使用率
45%
扩容阈值: 70%缩容阈值: 30%
🧠内存使用率
60%
扩容阈值: 75%缩容阈值: 40%
QPS
650req/s
扩容阈值: 1000/s目标: 800/s
🖥️运行实例
3个实例
最小: 2最大: 10
1
2
3
4
5
6
7
8
9
10
扩缩容历史最近 5 次操作
📈
扩容: 2 → 3 实例
CPU使用率超过70%
10:23
📉
缩容: 4 → 3 实例
CPU使用率低于30%
09:15
📈
扩容: 3 → 4 实例
QPS达到1000/s
08:42
📈
扩容: 2 → 3 实例
内存使用率超过75%
07:30
📉
缩容: 5 → 4 实例
流量下降
06:20
自动扩缩容最佳实践
⏱️
冷却时间
设置适当的冷却时间(通常3-5分钟),避免扩缩容操作过于频繁导致的震荡
📊
多指标综合
不要依赖单一指标,结合CPU、内存、QPS、连接数等多维度进行综合判断
🎯
目标利用率
设置合理的资源目标利用率(如70%),预留足够的缓冲应对突发流量
快速扩容
扩容操作应该比缩容更激进,确保系统能快速应对流量增长

6.2 Wahl der Skalierungsmetriken

Der Kern des Auto-Scaling ist die Beantwortung einer Frage: Wann sollte man Server hinzufuegen? Wann sollte man sie abbauen?

MetrikHochskalieren beiHerunterskalieren beiAnwendungsfall
CPU-Auslastung> 70%< 30%Rechenintensive Anwendungen
Speicherauslastung> 75%< 40%Speicherintensive Anwendungen
QPS (Anfragen pro Sekunde)> 1000/s< 400/sAPI-Gateway, Web-Services
Verbindungszahl> 5000< 1000Datenbank, Message-Queue
Benutzerdefinierte MetrikJe nach GeschaeftJe nach GeschaeftSpezifische Geschaeftsszenarien

Haeufige Fallen und Loesungen

Falle 1: Skalierung reagiert zu langsam, die Traffic-Spitze hat das System bereits gelaehmt

Loesung:

  • Praeventiv skalieren: Basierend auf historischen Daten Traffic-Spitzen vorhersagen und 30 Minuten frueher skalieren
  • Mehrstufige Schwellenwerte: 60% Warnung (neue Instanz vorwaermen), 70% offiziell skalieren, 80% Notfall-Skalierung
  • Schnelles Hochskalieren: Containerisierung nutzen, neue Instanzen in 30 Sekunden starten (vs. 3-5 Minuten bei VMs)

Falle 2: Zu aggressives Skalieren, Kosten explodieren

Loesung:

  • Cooldown-Zeit nach Skalierung: Nach einer Skalierung mindestens 5 Minuten warten, bevor erneut skaliert wird
  • Maximale Instanzanzahl festlegen: max = aktuelle Instanzen x 2, um unkontrolliertes Wachstum zu verhindern
  • Spitzen von Trends unterscheiden: Nur wenn 3 aufeinanderfolgende Perioden ueber dem Schwellenwert liegen, skalieren

Falle 3: Zu schnelles Herunterskalieren, gerade hochskalierte Instanzen sofort wieder abgebaut

Loesung:

  • Konservativeres Herunterskalieren: Hochskalierung bei 70%, Herunterskalierung bei 25%, ausreichender Puffer dazwischen
  • Laengere Cooldown-Zeit fuer Herunterskalierung: Nach Hochskalierung mindestens 10 Minuten warten, bevor herunterskaliert wird
  • Schrittweises Herunterskalieren: Immer nur 1 Instanz abbauen, beobachten, dann entscheiden

7. Praxis: Welchen Load Balancer waehlen?

7.1 Vergleich der wichtigsten Load Balancer

EigenschaftNginxHAProxyEnvoyCloud Load Balancer
PositionierungHochleistungs-Reverse-Proxy/Load-BalancerOpen-Source-Load-BalancerCloud-Native-ProxyManaged Load Balancer
PerformanceSehr hoch (C, Event-Driven)Hoch (Event-Driven)Hoch (C++/Rust)Sehr hoch
FunktionsumfangGrundlegendes LB, statische Dateien, CachingUmfangreiche LB-AlgorithmenErweitertes Routing, ObservabilityVollumfaenglich
KonfigurationKonfigurationsdatei (nginx.conf)Konfigurationsdatei (haproxy.cfg)API/KonfigurationsdateiUI-Konsole
ErweiterbarkeitC-Module/Lua-SkripteLua-SkripteWASM/FilterPlugins
AnwendungsfallStatische Ressourcen, L7-LB, SSL-TerminierungL7-LB, HochverfuegbarkeitService Mesh, Multi-CloudSchneller Start

Auswahl-Empfehlung

Entscheidungsbaum:

Load Balancer auswaehlen:
|
├─ Nur grundlegendes L4-Load-Balancing noetig?
│  ├─ Ja -> LVS (Open Source) oder Cloud NLB
│  └─ Nein -> Weiter

├─ Service Mesh, Multi-Cloud noetig?
│  ├─ Ja -> Envoy
│  └─ Nein -> Weiter

├─ Extrem komplexe Konfiguration und Plugins noetig?
│  ├─ Ja -> HAProxy
│  └─ Nein -> Weiter

├─ Hohe Performance + einfache Konfiguration?
│  ├─ Ja -> Nginx (erste Wahl)
│  └─ Weiter

├─ Managed Betrieb gewuenscht?
│  ├─ Ja -> Cloud Load Balancer (AWS ALB, Alibaba SLB)
│  └─ Nginx selbst betreiben

8. Zusammenfassung: Die Kerngedanken des Load Balancing

8.1 Zusammenfassung der Kernprinzipien

PrinzipBedeutungPraktische Hinweise
SchichtenL4 fuer "Paketsortierung" (schnell aber einfach)L4 fuer Datenbank, Gaming; L7 fuer Web, API
RedundanzSingle Points of Failure sind der Feind der ArchitekturMehrere Instanzen, Multi-Region-Deployments erhoehen Verfuegbarkeit
SchrittweiseNeue Versionen nicht "mit einem Schlag" ausrollenBlue-Green fuer Zero Downtime; Canary fuer kontrolliertes Risiko
ElastizitaetDas System sollte wie ein Lebewesen "atmen"Bei hohem Traffic automatisch hochskalieren, bei wenig automatisch herunter

8.2 Design-Checkliste

Vor der Einfuehrung von Load Balancing folgende Fragen stellen:

  • [ ] Wird Load Balancing wirklich benoetigt? (Reicht die Einzelleistung wirklich nicht aus?)
  • [ ] L4 oder L7? (Nach Geschaeftsszenario entscheiden)
  • [ ] Wie wird Session-Persistenz behandelt? (Cookie, IP-Hash, Session-Tabelle)
  • [ ] Wie werden Health Checks implementiert? (Aktiv, Passiv, Schwellenwerte)
  • [ ] Wie wird Zero Downtime erreicht? (Blue-Green Deployment, Canary Release)
  • [ ] Wie wird Elastizitaet erreicht? (Skalierungsmetriken, Cooldown-Zeit, maximale Instanzen)

9. Glossar

BegriffEnglischErklaerung
Load BalancerLoad BalancerGeraet oder Software, das Traffic auf mehrere Backend-Server verteilt
L4-Load-BalancingL4 Load BalancingLoad Balancing basierend auf der Transportschicht (TCP/UDP)
L7-Load-BalancingL7 Load BalancingLoad Balancing basierend auf der Anwendungsschicht (HTTP/HTTPS)
Health CheckHealth CheckMechanismus zur regelmaessigen Pruefung der Gesundheit von Backend-Servern
Session-PersistenzSession PersistenceStellt sicher, dass Anfragen desselben Benutzers immer an denselben Server geroutet werden
Sticky SessionSticky SessionAlternative Bezeichnung fuer Session Persistence
Blue-Green-DeploymentBlue-Green DeploymentZero-Downtime-Release-Strategie mit zwei Umgebungen
Canary-ReleaseCanary ReleaseSchrittweise Rollout-Strategie mit kleinem Traffic-Anteil zuerst
Auto-ScalingAuto ScalingAutomatische Anpassung der Server-Anzahl basierend auf der Last
Horizontale SkalierungHorizontal ScalingVerarbeitungskapazitaet durch Hinzufuegen weiterer Server erhoehen
Vertikale SkalierungVertical ScalingLeistung durch Erhoehung der Einzelkonfiguration (CPU, Speicher) steigern
Multi-RegionMulti-RegionServices in mehreren geografischen Regionen bereitstellen
Active-ActiveActive-ActiveMehrere Regionen gleichzeitig im aktiven Betrieb
Active-StandbyActive-StandbyNur eine Region aktiv, die anderen stehen bereit
RTORecovery Time ObjectiveMaximal zulaessige Wiederherstellungszeit nach einem Ausfall
RPORecovery Point ObjectiveMaximal akzeptabler Datenverlust bei einem Ausfall