Infrastructure as Code(インフラストラクチャ・アズ・コード)
はじめに
このような悪夢を経験したことがありますか:本番サーバーがダウンしたが、当初どのように設定されたか誰も覚えていない? サーバーに手動でログインし、記憶を頼りにコマンドを打ち込み、タイプミスをしないよう祈る——これが従来の運用の日常でした。Infrastructure as Code(IaC)はこれを完全に変えました:コードを使ってインフラを定義・管理し、サーバー設定をソフトウェアのようにバージョン管理可能、再現可能、監査可能にします。
この記事で学べること
この章を終えると、次のことが身につきます:
- コア概念:IaC とは何か、なぜそれがモダンな運用の基盤なのかを理解
- ワークフローの理解:Terraform の Write → Plan → Apply → Destroy の4段階ワークフローを習得
- ツール選定:Terraform、Pulumi、CloudFormation などの主流ツールの長所と短所を理解
- リスク認識:設定ドリフトの危険性と検出方法を理解
- ベストプラクティス:IaC プロジェクトのエンジニアリング管理手法を習得
| 章 | 内容 | コア概念 |
|---|---|---|
| 第1章 | IaC の概念 | 手動運用 vs コード管理 |
| 第2章 | Terraform ワークフロー | Write → Plan → Apply |
| 第3章 | ツール比較 | Terraform、Pulumi、CDK |
| 第4章 | 設定ドリフト | 検出、予防、修復 |
| 第5章 | ベストプラクティス | モジュール化、状態管理、CI/CD |
0. 全体像:なぜインフラにも「ソースコード」が必要なのか?
あなたがシェフだと想像してください。すべての料理を感覚で作っていたら——今日は塩をスプーン1杯、明日は2杯——味は常に不安定です。しかし、レシピを書き留めれば——各調味料のグラム数まで正確に指定すれば——誰でも同じ味を再現できます。
インフラ管理も同じ問題に直面しています。1台のサーバーの設定には、OS、ネットワークルール、セキュリティグループ、ストレージボリューム、環境変数など数十のパラメータが関わる可能性があります。手動設定はエラーが起こりやすいだけでなく、再現不可能、監査不可能、ロールバック不可能です。
IaC のコアバリュー
- 再現可能:同じコードは何回実行しても同じ結果になる(冪等性)
- バージョン管理可能:インフラの変更が Git で管理され、誰が何を、なぜ変更したかが一目でわかる
- 監査可能:すべての変更が記録され、コンプライアンス要件を満たす
- 自動化可能:CI/CD パイプラインによる自動デプロイで、人的エラーを排除
- 協調可能:チームメンバーが Pull Request でインフラの変更をレビュー——コードレビューと同じように
1. IaC の概念:「手動クリック」から「コード宣言」へ
従来の運用のやり方は次の通りです:クラウドプラットフォームのコンソールにログインし、手動でクリックしてサーバーを作成し、ネットワークを設定し、セキュリティグループを設定します。このアプローチは数台のサーバーを管理する場合には対応できますが、数十、数百台にスケールすると悪夢になります。
IaC の中心的な考え方は:宣言型コードで望むインフラの状態を記述し、ツールに自動的に実現させることです。ツールに「まず VPC を作成し、次にサブネットを作成し、次にセキュリティグループを作成する」(命令型)と指示する必要はありません。単に「このようなネットワーク環境が欲しい」(宣言型)と言えば、ツールが必要なステップを自動的に計算します。
| 对比维度 | 手动运维 | 基础设施即代码 |
|---|---|---|
| 可重复性 | 每次操作可能不同 | 代码保证完全一致 |
| 速度 | 分钟到小时级 | 秒到分钟级 |
| 审计追踪 | 依赖人工记录 | Git 历史自动记录 |
| 协作 | 口头传达、截图 | Code Review、PR 流程 |
| 回滚 | 几乎不可能 | git revert 一键回滚 |
| 次元 | 手動運用 | Infrastructure as Code |
|---|---|---|
| 操作方法 | コンソールにログインしてクリック | コードファイルを作成 |
| 再現性 | ドキュメントと記憶に依存 | コードがドキュメント、100% 再現可能 |
| 変更追跡 | 記録なしまたは不完全 | Git バージョン管理、完全な履歴 |
| 協力方法 | 口頭コミュニケーション、ドキュメントの受け渡し | Pull Request レビュー |
| ロールバック機能 | 手動の逆操作 | git revert + 再 apply |
| 一貫性 | 環境間の差異が大きい | 開発/テスト/本番が完全に同一 |
宣言型 vs 命令型
- 宣言型(Declarative):「何が欲しいか」を記述し、ツールが「どうやるか」を自動計算。Terraform、CloudFormation がこのアプローチを採用。長所は冪等性が高いことで、短所は柔軟性が制限されること。
- 命令型(Imperative):「どうやるか」を記述し、段階的に実行。Ansible、シェルスクリプトがこのアプローチを採用。長所は柔軟性で、短所は冪等性の保証が困難なこと。
- ハイブリッド:Pulumi、AWS CDK は汎用プログラミング言語で記述し、宣言型の状態管理と命令型の柔軟性を併せ持つ。
2. Terraform ワークフロー:Write → Plan → Apply
Terraform は現在最も人気のある IaC ツールで、HashiCorp が開発しています。そのワークフローは明確で直感的で、ソフトウェア開発の「コーディング→レビュー→デプロイ→クリーンアップ」のように4つの段階に分かれています。
用声明式语言(HCL)描述你期望的基础设施状态。代码就是文档,可以提交到 Git 进行版本管理和 Code Review。
4段階ワークフロー
- Write(記述):HCL(HashiCorp Configuration Language)でインフラ定義ファイル(.tf)を作成。必要なリソースを宣言:サーバー、データベース、ネットワークなど。
- Plan(計画):
terraform planを実行。Terraform が現在の状態と目標状態を比較し、「実行計画」を生成——作成、変更、削除するリソースを表示。実際に実行する前に変更を確認できるセーフティネット。 - Apply(適用):計画が正しいことを確認した後、
terraform applyを実行。Terraform が計画に従ってリソースを作成または変更。実行完了後、現在の状態が状態ファイル(terraform.tfstate)に保存される。 - Destroy(破棄):不要になったら、
terraform destroyを実行してすべてのリソースをクリーンアップし、不要なコストを回避。
| コマンド | 目的 | インフラを変更するか | 使用場面 |
|---|---|---|---|
terraform init | プロジェクトの初期化、プロバイダーのダウンロード | いいえ | 初回使用または新しいプロバイダーの追加時 |
terraform plan | 変更のプレビュー、実行計画の生成 | いいえ | 毎回の変更前に必ず実行 |
terraform apply | 変更の実行、リソースの作成/変更 | はい | plan を確認後に実行 |
terraform destroy | すべてのリソースの破棄 | はい | テスト環境のクリーンアップ、サービスの廃止 |
terraform state | 状態ファイルの表示/管理 | 操作による | 状態の移行、リソースのインポート |
3. ツール比較:あなたに合った IaC ツールの選択
IaC 分野には複数のツールがあり、それぞれ異なる重点を持っています。ツールの選択時には、チームの技術スタック、クラウドプラットフォーム、プロジェクトの規模などを考慮する必要があります。「最高」のツールはなく、あなたのシナリオに最適なツールだけがあります。
| 特性 | Terraform | CloudFormation |
|---|---|---|
| 厂商 | HashiCorp | AWS |
| 配置语言 | HCL | YAML / JSON |
| 声明式/命令式 | 声明式 | 声明式 |
| 多云支持 | 原生多云 | 仅 AWS |
| 状态管理 | State 文件 | AWS 托管 |
| 学习曲线 | 中等 | 中等偏高 |
| 社区生态 | 非常活跃 | AWS 生态 |
| 最佳场景 | 多云/混合云 | 纯 AWS 环境 |
| ツール | 言語 | クラウドサポート | 学習曲線 | 使用ケース |
|---|---|---|---|---|
| Terraform | HCL | マルチクラウド(AWS/Azure/GCP) | 中程度 | マルチクラウド環境、チームコラボレーション |
| Pulumi | Python/TS/Go | マルチクラウド | 低い(馴染みのあるプログラミング言語) | 開発者フレンドリー、複雑なロジック |
| AWS CloudFormation | JSON/YAML | AWS のみ | 中程度 | 純粋な AWS 環境 |
| AWS CDK | Python/TS/Java | AWS のみ | 低い | AWS + プログラミング言語の好み |
| Ansible | YAML | マルチクラウド + ベアメタル | 低い | 設定管理、ハイブリッド環境 |
どう選ぶ?
- スタートアップ / 単一クラウド:CloudFormation(AWS)または対応するクラウドプラットフォームのネイティブツールが最適なエコシステム統合を提供
- マルチクラウド / 中〜大規模チーム:Terraform —— 最大のコミュニティ、最も豊富なプロバイダー、採用が最も容易
- 開発者主導のチーム:Pulumi または CDK —— 馴染みのあるプログラミング言語でインフラを記述、IDE サポートが良好
- 設定管理が必要:Ansible —— サーバー内部の設定(ソフトウェアのインストール、設定ファイルの変更)に優れている
4. 設定ドリフト:サイレントな時限爆弾
設定ドリフト(Configuration Drift)は IaC プラクティスにおける最も隠れた敵です。これは実際のインフラ状態とコード定義の状態の間に徐々にずれが生じることを指します。
このずれは通常どのように発生するのでしょうか?ある人が「迅速な修正」のために、コンソールに直接ログインしてセキュリティグループルールを手動で変更した。ある人がデバッグのために、あるサーバーの設定を一時的に増やしたが、元に戻すのを忘れた。これらの「小さな変更」が蓄積し、最終的にコードと実際の環境が大きく乖離します。
团队使用 Terraform 部署了 3 台 Web 服务器,配置完全一致:Nginx 1.24、端口 443、2GB 内存。代码和实际状态完美匹配。
設定ドリフトの危険性
- 再現不可能:コードが記述する環境と実際の環境が一致せず、新しい環境を作成する際に問題が発生
- ロールバックの失敗:前のバージョンにロールバックすれば復旧できると思っても、実際の環境は手動で変更されている
- セキュリティリスク:手動で開かれたポート、緩和された権限が忘れられ、攻撃の入口になる可能性
- 監査の失敗:コンプライアンス監査はコードに基づいているが、コードが実際の状態を反映していない
| 予防措置 | 説明 |
|---|---|
| 手動変更の禁止 | IAM ポリシーでコンソール操作権限を制限 |
| 定期的なドリフト検出 | 定期的に terraform plan を実行して差異を確認 |
| 自動修復 | ドリフトを検出したら自動的に apply を実行して整合性を回復 |
| 変更監査 | CloudTrail などの監査ログを有効にし、すべての変更ソースを追跡 |
5. ベストプラクティス:IaC プロジェクトを持続可能にする
IaC コードもアプリケーションコードと同様に、良いエンジニアリングプラクティスによって保守性を確保する必要があります。インフラの規模が拡大するにつれて、秩序のない IaC コードは別の形の「技術的負債」になります。
# 忽略本地状态文件
*.tfstate
*.tfstate.backup
.terraform/
# 忽略敏感变量文件
*.tfvars
!example.tfvars6つのコアベストプラクティス
- モジュール化:再利用可能なインフラをモジュール(VPC モジュール、データベースモジュールなど)として抽象化し、コピー&ペーストを避ける。関数を書くように——一箇所で定義、複数箇所で呼び出し。
- 環境の分離:開発、テスト、本番は独立した状態ファイルと変数ファイルを使用し、workspace またはディレクトリ構造で分離。
- リモート状態管理:状態ファイル(tfstate)をリモートバックエンド(S3 + DynamoDB)に保存し、チームコラボレーションと状態ロックをサポートし、並行競合を防止。
- 機密情報の管理:パスワード、鍵などの機密情報はコードに書き込まない。Vault、AWS Secrets Manager などのツールで管理。
- CI/CD 統合:terraform plan を PR プロセスに統合し、apply はパイプラインを通じて自動実行し、ローカルの手動操作を排除。
- コードレビュー:インフラの変更はアプリケーションコードと同様に Code Review が必要。特にセキュリティグループや IAM ポリシーに関わる変更について。
まとめ
Infrastructure as Code はモダンなクラウドネイティブ運用の基盤です。「記述不可能な手動操作」を「バージョン管理可能なコード」に変え、インフラ管理を「芸術」から「エンジニアリング」へと転換させます。
この章の重要ポイントを振り返ります:
- IaC の本質:コードでインフラの望ましい状態を宣言し、ツールに自動的に実現させる
- Terraform ワークフロー:Write → Plan → Apply の3ステップ、Plan がセーフティネット
- ツール選定:マルチクラウドなら Terraform、単一クラウドならネイティブツール、開発者チームなら Pulumi
- 設定ドリフト:最も隠れたリスク、プロセスとツールの両面からの防護が必要
- エンジニアリング管理:モジュール化、環境分離、リモート状態、CI/CD 統合がすべて不可欠
参考文献
- Terraform 公式チュートリアル - ゼロから Terraform を学ぶ
- Pulumi ドキュメント - プログラミング言語でインフラを書く
- AWS CDK Workshop - AWS CDK のハンズオンチュートリアル
- Infrastructure as Code (O'Reilly) - IaC 分野の古典的な書籍
- Spacelift Blog - IaC のベストプラクティスと業界トレンド