【チートシート】LPIC3 306 頻出用語集前500単語|DRBD・GlusterFS・Ceph・Pacemakerを全範囲で徹底整理/Version 3.0対応

最終更新日 2025年10月17日

はじめに

LPIC-3 306(High Availability and Storage Clusters)は、高可用性クラスタとストレージ冗長化技術の最上級資格です。

DRBD、GlusterFS、Ceph、Pacemaker、Corosync などの構成管理を体系的に理解していなければ合格は難しく、「どの技術がどの章で出題されるのか」「どのコマンドを覚えればよいのか」を明確に整理することが重要です。

本記事では、LPIC-3 306 Version 3.0 の最新試験範囲に完全対応した全6章・約500用語を紹介します。

スポンサーリンク

第1章:361 High Availability Cluster Management(高可用性クラスタ管理)

暗記のポイントは以下の通りです。

  • 「Pacemaker+Corosync構成」「STONITH」「Quorum」は最重要キーワード。
  • crm_moncrm_resourcecrm_simulate を実際に叩いて挙動を覚える。
  • Order / Colocation / Location constraint の違いを説明できるように整理。
  • Split-brain対策(STONITH・quorum維持)とフェイルオーバー制御が理解の軸。
用語意味主な使い方や構成要素試験でのポイント
High Availability (HA)高可用性。サービス停止を最小化する設計手法冗長化、フェイルオーバー、監視、クラスタ構成クラスタの目的とHA設計の基本理解
Cluster複数ノードをまとめて1つのサービス単位として動作させる仕組み共有ストレージ、通信リンク、リソース管理Active-Active / Active-Passiveの違い
Nodeクラスタを構成する個々のサーバメンバーとして参加、フェンシング対象にもなるノードの役割とフェイルオーバー関係を理解
Pacemaker高可用性クラスタを制御するコアコンポーネントCIB(XML設定), CRM管理, Corosync連携Pacemakerの役割と主要設定コマンド
Corosyncクラスタ通信とメンバーシップ管理を担当心拍監視(heartbeat)、トークンベース通信Pacemakerと併用される標準クラスタ基盤
CIB (Cluster Information Base)クラスタ構成情報を格納するXMLデータベースcibadmin, crm configure で編集可能設定変更はトランザクション的に反映される
crm_monクラスタ状態をモニタリングするコマンドノード状態、リソース、フェイルオーバー確認状態監視コマンドの出力形式を理解
crmshPacemaker設定用シェルcrm configure, crm resourceなど設定変更操作と出力例を把握
Resourceクラスタが管理するサービスやデバイスIPアドレス、FSマウント、サービスなどリソース依存関係の設定が重要
Resource Agentリソースの起動/停止/監視を行うスクリプトOCF, LSB, SystemdベースなどOCF(Resource Agent)仕様を理解
OCFOpen Cluster Framework/usr/lib/ocf/resource.d/ に格納OCF標準の構造(start/stop/monitor)を暗記
STONITHShoot The Other Node In The Head、ノード強制停止機構フェンシングデバイス(IPMI, iLO等)Split-Brain防止に必須。無効化は危険
Split Brainクラスタ通信が断絶し、双方がマスターになる状態STONITH設定・Quorum設計で防止対策方法(フェンシング・クォーラム)理解
Quorum過半数ノードが合意している状態を表す指標expected-votes, two_node設定などQuorum loss時の動作を理解
Fencingノードを強制的に隔離または停止させる手段Power fencing, Storage fencingSTONITHとの違いを明確に
Heartbeatクラスタノード間の生存確認信号UDPマルチキャストまたはユニキャスト通信心拍監視間隔・タイムアウト設定理解
Failover障害発生時にサービスを別ノードへ移行自動/手動での制御が可能フェイルオーバー発生条件と動作確認
Failback障害復旧後にサービスを元ノードへ戻す自動/手動設定可能自動フェイルバック設定の注意点
Cluster Stackクラスタの構成層(通信・管理・リソース)Corosync + Pacemaker + Resource Agent各レイヤの役割を区別して覚える
HA Policyフェイルオーバー動作や依存性を定義order, colocation, constraintsConstraint設定の優先度理解
Constraintリソースの動作条件や優先度を定義crm configure order等で設定colocation/orderの違いを暗記
Order Constraint起動順序の制御例:FS → IP → サービスリソース依存の順序制御問題に頻出
Colocation Constraint同一ノード上で動作する依存関係を定義例:ApacheとIPを同一ノードに固定colocation vs orderの違いを理解
Location Constraintリソース配置を制御するルールnode属性・スコアによる重み付けprefer, avoidの動作理解
Cluster Property全体設定値(stonith-enabled, no-quorum-policy等)crm configure propertyで設定no-quorum-policyの効果を理解
no-quorum-policyクォーラム喪失時の動作stop / freeze / ignore / suicidedefaultはstop。変更例を理解
Maintenance Modeメンテナンス時に自動制御を一時停止crm configure property maintenance-mode=true障害試験や保守時に使用
Resource Stickinessリソースを現ノードに残す度合いを定義正数で優先維持、負数で移動促進リソース移動制御の細かい調整に出題
Score各ノードに対する優先度スコアlocation制約で使用負スコア=禁止設定の意味を理解
TicketGeoクラスタ等で使われるトークンDRシナリオなどで権限を制御Geoクラスタ構成の理解に出題
Geo Cluster地理的に離れたクラスタ間の同期booth, ticketを用いた制御DR構成と標準クラスタの違い
BoothGeoクラスタ管理デーモンTicket配布・ノード協調booth動作と設定の概要を理解
Cluster Rejoin障害復旧後にノード再参加crm node online再参加時の状態遷移を理解
crm_reportクラスタ診断ログ収集ツールトラブル時の状況再現に使用解析ツールとして頻出
cibadminCIBを直接操作する低レベルコマンドXML操作、差分出力直接編集の危険性と用途理解
pcsPacemaker/Corosync統合管理ツール(RedHat系)pcs cluster setup, pcs statuscrmshとの違いと使い分け理解
Two-Node Cluster2台構成クラスタ。Quorumがないため特別設計必要stonith+quorum設定を適切に行うSplit-brainリスクと対策
Watchdogハードウェア監視機構/dev/watchdog, systemd watchdogノードフェンシング補助機構として理解
Corosync.confクラスタ通信設定ファイルtotemセクション、nodelist、transportファイル構造と主要パラメータを暗記
ring_idCorosync内の通信識別子multi-ring構成時に使用複数ネットワーク利用時の冗長性理解
tokenCorosyncトークン通信のタイムアウト設定デフォルト10000ms程度通信断検知と再選出の挙動理解
votequorumクォーラム管理モジュールexpected_votes設定ノード数減少時の影響を理解
totemCorosync通信モジュールトークンリングベース通信UDP/マルチキャスト構成と冗長性理解
CMAN旧RedHatクラスタマネージャcorosync/pacemakerに統合済現行では非推奨である点を覚える
DLMDistributed Lock ManagerGFS2/OCFS2等と連携クラスタFSでのロック管理理解
quorumd外部クォーラムデーモン仲介ノードでvote提供witnessノードとの違いを理解
Witness Node仲裁ノード。2ノード構成で過半数維持に利用軽量ノードとして動作quorum維持に重要な概念
Cluster Logging/var/log/pacemaker.log 等PCMK_logfile, syslog設定障害時のログ解析に頻出
Resource Fail Countリソース失敗回数カウンタ自動再起動制御crm resource cleanupの必要性
Resource Recoveryフェイルオーバー後のリカバリ手順自動再起動/ノード除外Recoveryポリシーの違いを理解
node attributeノード特性(region, typeなど)location制約に利用属性スコア設定問題に頻出
crm_simulateフェイルオーバー動作を事前検証シナリオ確認に利用実行計画の検証手段として出題
cluster shellcrmshの対話シェル自動補完、config編集CLI運用スキルが問われる
resource defaultsデフォルト動作設定migration-threshold, stickiness設定適用範囲の理解
migration-thresholdフェイルオーバー発生までの許容失敗数デフォルト3数値調整とリソース安定性理解
monitoring intervalリソース監視間隔ms単位で設定短すぎると誤検知、長すぎると遅延
fencing topologyフェンシング優先順位構成複数デバイス併用設定実運用向け設計として出題
cluster redundancy冗長性設計の考え方多重通信経路、二重電源等設計問題として問われる
load distribution負荷分散設計Active-Active構成で利用サービスレベルの可用性指標理解
failover domain特定ノードへの優先割当旧Heartbeat構成に多い概念Pacemakerではlocation制約に相当
standby node待機ノードフェイルオーバー対象状態遷移の確認問題に出やすい
cluster startupクラスタ起動シーケンスcorosync → pacemaker順起動順序問題で頻出
corosync-cfgtoolcorosync設定確認ツールcorosync-cfgtool -sトークン/リング状態確認
crm_nodeノード状態確認ツールcrm_node -l, -pノードID確認コマンドとして出題
cluster resource moveリソース手動移動crm resource moveトラブル時の一時対応で使用
pacemaker_remoteリモートノード統合機能SSHを利用しクラスタ外ノードを管理分散管理で出題あり
watchdog timeoutハードウェア監視間隔BIOS設定・OS設定両方値設定の意味を理解
HA cluster log levelログ出力レベルPCMK_logpriority設定デバッグ時の設定例を覚える
fencing delayフェンシング遅延設定同時実行防止目的race condition防止の仕組み
quorum policyクォーラム関連設定まとめno-quorum-policy等複数設定値の意味を暗記
スポンサーリンク

第2章:361-2 Load Balanced Clusters(ロードバランスクラスタ)

暗記のポイントは以下の通りです。

  • LVS・IPVS・keepalived・HAProxy の4要素を区別して説明できるように。
  • VRRPの priority / preempt / advert interval の意味を暗記。
  • HAProxyの frontendbackend 構造と balance アルゴリズムを押さえる。
  • TCP(L4) と HTTP(L7) のモード切替、option redispatch など設定構文の正確さが重要。
用語意味主な使い方や構成要素試験でのポイント
Load Balancing複数ノードで負荷を分散する技術LVS, HAProxy, keepalived などActive-Active 構成で高可用性を確保
LVS (Linux Virtual Server)Linux 標準のロードバランサ機構kernel モジュール ip_vs による実装NAT/DR/TUN の3 方式を理解
IPVSLVS のカーネルモジュール部分/proc/net/ip_vs などで確認ipvsadm コマンドと併せて暗記
ipvsadmLVS 管理コマンドipvsadm -A/-a/-L など設定内容の保存・復元操作に注意
Director Serverクライアント要求を分散するサーバLVS の制御ノード冗長構成(keepalived)と併用
Real Server実際に処理を行うバックエンドWeb / DB / App サーバ等ヘルスチェック監視対象
LVS-NATNAT モードによる負荷分散方式Director が宛先変換・戻り通信も仲介スループットが低いが汎用的
LVS-DRDirect Routing 方式MAC 書換で応答を直接返す高速だが同一L2 セグメント必須
LVS-TUNIP トンネリング方式異セグメントノード間通信を許可トンネル設定の理解が必要
keepalivedVRRP と LVS 管理を統合するデーモン/etc/keepalived/keepalived.conf 設定VRRP バックアップ制御問題に頻出
VRRPVirtual Router Redundancy Protocol仮想IP を共有し Active/Backup 切替優先度(priority) と preempt 理解
vrrp_instancekeepalived 内のVRRP設定ブロックstate, priority, interface など定義状態遷移 MASTER/BACKUP を把握
virtual_serverLVS 設定ブロックprotocol, real_server 定義ポート単位で仮想サービス定義
ldirectordLVS 構成を管理する補助デーモンheartbeat と連携keepalived との違いを区別
healthcheckバックエンド生存監視ICMP, TCP, HTTP, SSL 等障害検出と削除動作を理解
HAProxy汎用ロードバランサ/リバースプロキシL7 対応、細かいルール設定LVS との比較と機能差
HAProxy.cfgHAProxy 設定ファイルglobal, defaults, frontend, backendfrontend/backend 構造理解
frontendHAProxy でクライアント受付定義bind アドレス, ACL などACL でルーティング制御
backend実際に接続先を定義server パラメータ, balance 方式ラウンドロビン設定確認
balance algorithm負荷分散アルゴリズムroundrobin, leastconn, source 等特徴と用途を暗記
stickinessセッション固定化機能cookie や source IP で維持ステートフル通信に必須
check intervalバックエンド監視間隔check inter 2s など頻度と負荷のバランスを理解
weight各ノードの重み付けserver backend1 weight 2 など負荷分散比率制御に頻出
fall/rise障害検出・復帰閾値fall 3 rise 2 などflapping 防止設定を理解
maxconn最大同時接続数サーバの過負荷防止connection limit 設定問題
x-forwarded-forクライアントIP 転送ヘッダproxy経由アクセス解析に利用セキュリティ考慮も出題あり
SSL TerminationSSL 終端をLB側で実施HAProxy や Nginx LB で対応CPU負荷軽減効果を理解
TCP modeL4 レベルでの転送mode tcp 設定SSL/TLS 透過構成に使用
HTTP modeL7 レベルでの転送mode http 設定ACL で高度な制御可能
backend healthバックエンド健全性監視失敗で自動除外出題頻度高い監視項目
keepaliveTCP 接続の維持設定長寿命セッション対策timeout 設定と併用理解
timeout connect接続タイムアウト設定HAProxy の defaults 内過負荷時挙動に影響
timeout serverサーバ応答タイムアウト応答遅延時の切断制御実運用値を把握
timeout clientクライアント待機時間idle 接続切断に利用短すぎると誤切断リスク
stats socketHAProxy 制御用ソケット/run/haproxy/admin.sockCLI 操作で動的設定確認
HAProxy stats page統計情報閲覧画面/stats URL を設定監視UI の利用方法出題
systemd unitkeepalived/HAProxy の起動制御systemctl enable keepalived自動起動設定を確認
Firewall 設定LB ポート通信許可iptables/nftables 使用NAT/DR 方式でルール差異あり
IP HashクライアントIP に基づく分散セッション維持に利用スティッキー設定との違い
Round Robin順番に振り分ける方式デフォルトの負荷分散法均等分散に使用
Least Connection接続数の少ないノードに優先転送balance leastconn長時間接続で有効
Source AlgorithmクライアントIP 固定分散一貫性のあるルーティングスティッキー構成で使用
Layer 4 Load BalancingTCP/UDP レベルで分散LVS, IPVS で実装L7 より高速・単純
Layer 7 Load Balancingアプリ層での分散HAProxy, Nginx などコンテンツベース制御可能
Failover Pair2 台のLB間の冗長構成VRRP で VIP を切替keepalived で構成
Virtual IP (VIP)仮想的なサービスIPActive LB が所有VRRP と組み合わせ出題
Preempt Mode高優先度ノードが復帰時に主導権奪取preempt true 設定優先度制御挙動を理解
PriorityVRRP の優先度値0〜255 範囲数値が高いほど MASTER 優先
Advert IntervalVRRP 広告間隔デフォルト1秒応答遅延調整に利用
garp_master_delayGratuitous ARP 送信遅延IP 引継ぎの安定化IP 重複防止策として出題
vrrp_script状態監視スクリプト設定script "pidof nginx"条件でMASTER切替を制御
script_uservrrp_script 実行ユーザroot / 非特権 指定可セキュリティ強化の一環
notify_masterMASTER 昇格時に実行外部スクリプト起動フックポイント出題あり
notify_backupBACKUP 遷移時に実行冗長機側スクリプト呼出し状態変化監視理解
notify_fault障害時呼出しスクリプトログ通知・自動復旧運用監視と連携
sysctl net.ipv4.ip_nonlocal_bindVIP バインド許可設定0→1 で 非所属IP 利用可keepalived 利用時に必須
sysctl arp_ignoreARP 応答制御1 or 2 に設定DR 方式のARP 競合防止
sysctl arp_announceARP 送信制御2 で送信元IP 制御DR 構成で重要設定
Persistence Timeoutセッション保持時間persistence_timeout 60短すぎるとセッション切断
SYN ProxySYN フラッド対策iptables / HAProxy 内機能セキュリティ対策知識必要
conntrackNetfilter 接続追跡状態保持・NAT 管理L4 LB と連動確認
nftables新世代 ファイアウォール フレームワークnft コマンドで制御iptables との関係理解
keepalived daemon常駐プロセスsystemctl status 確認状態とPID監視
check_daemonバックエンド監視プロセスscript または MISC_CHECKカスタム監視作成出題あり
ipsetIP アドレス集合管理DDoS 防御・アクセス制御LB 連携で出題あり
NAT Hairpin内部からVIP 接続を処理SNAT/DNAT 併用内部通信動作の理解
Multi-VIP複数 VIP 割当構成複数サービス分散keepalived 複数 instance 設定
Interface BondingNIC 冗長化で帯域確保mode 0〜6 指定LB サーバ冗長構成関連出題
conn_limit接続上限設定DoS 対策LB 防御設定に出題
DSR (Direct Server Return)LVS-DR と同義応答を直接返す方式ARP 抑制が必要
HTTP Health CheckHTTP ステータス監視GET /healthz正常判定条件を理解
SSL PassthroughSSL を終端せず中継L4 モードで構成オフロードとの違い理解
Reverse Proxyクライアントとバックエンドの中継HAProxy / Nginx 実装セキュリティ・キャッシュ両面問われる
Weighted Round Robin重み付き分散高性能ノード優先weight パラメータ設定
Connection Tracking状態管理conntrack で処理TCP セッション保持理解
TCP Resetタイムアウト切断時の応答不要接続即断高速回復制御
Layer 7 InspectionHTTP ヘッダ解析ACL / ルール分岐コンテンツ制御理解
stick-tableHAProxy のセッション記録機能stick-table type ipACL 連携で高難度出題
http-request denyACL で拒否制御WAF的制御に利用L7 セキュリティ関連問題
global sectionHAProxy.cfg 最上位設定user/group, chroot など安全運用設定確認
defaults section共通設定定義timeout, option 設定frontend/backend 継承構造理解
option redispatchサーバ失敗時再接続制御負荷分散再試行冗長化設定として問われる
option httplogHTTP ログ出力形式Apache互換ログ生成監視・解析設定で出題
log globalsyslog 送信設定/dev/log など外部ログ転送理解
failover testingLB 冗長構成のテストMASTER切替・サービス確認実環境試験理解問題
スポンサーリンク

第3章:361-3 Failover Clusters(フェイルオーバークラスタ)

暗記のポイントは以下の通りです。

  • Pacemakerの制約設定(Order・Colocation・Location)が出題の中核。
  • フェイルオーバーとフェイルバックの違いを具体例で説明できるように。
  • crm_resource cleanupcrm_simulatestonith_admin はコマンド構文ごとに暗記。
  • DR構成を想定した booth + ticket + geo cluster は Version 3.0 から重要テーマ。
用語意味主な使い方や構成要素試験でのポイント
Failover Cluster障害時にサービスを別ノードへ自動切替Pacemaker, Corosync で構成Active-Passive構成の基本理解
Active-Passive1台稼働+1台待機の構成フェイルオーバーで切替Active-Activeとの違いを理解
Active-Active両ノード同時稼働型クラスタ負荷分散も兼ねるデータ同期が課題になる構成
Pacemakerフェイルオーバーを制御するマネージャCRM, CIB, STONITH と連携306試験の中核技術
Corosyncクラスタ通信レイヤ心拍監視、メンバー管理通信障害時の挙動理解
Resource Agentサービス起動/停止スクリプトOCF準拠スクリプト/usr/lib/ocf/resource.d/ に配置
Cluster Resource管理対象の個別リソースIP, FS, サービスなど定義・依存関係設定の理解
Failover Domain優先ノード指定特定ノードへの自動移行制御PacemakerではLocation Constraintで管理
Constraintリソース依存・配置ルールorder, colocation, locationリソース動作関係を制御
Order Constraint起動順序指定例: FS → IP → サービス障害復旧時にも順序適用
Colocation Constraint同一ノード上での動作指定IPとWebを同居高可用性設計に必須
Location Constraint配置制御ルールscore値でノード優先度指定INFINITY-INFINITY の意味理解
Migration Thresholdフェイルオーバー許容失敗数例: migration-threshold=3過剰切替防止に利用
Stickiness現ノード維持度合い高値で移動抑止不安定時の安定稼働に関係
Failback元ノードへの復帰自動/手動制御可能自動復帰時のタイミング理解
Maintenance Modeクラスタ管理を一時停止crm configure property maintenance-mode=true構成変更・点検時に使用
STONITHノード強制停止(fencing)Split-brain防止機構無効化は原則禁止
Fence DeviceSTONITHデバイスIPMI, iLO, power switchなど設定手順と種類を理解
Split Brainクラスタ通信断による二重稼働STONITHで防止対策と症状を理解
Quorumクラスタ過半数投票quorumd, votequorum利用失効時の動作を理解
No-Quorum-Policyクォーラム喪失時動作stop/freeze/ignore/suicideデフォルトはstop
crm_mon状態監視コマンドcrm_mon -1r状態出力の見方を覚える
crm_resourceリソース操作コマンドmove, cleanup, restart実運用操作問題に頻出
crm_simulate設定検証ツール障害シナリオをシミュレーション変更前テストで使用
crm_report障害時ログ収集ツール/var/lib/pacemaker/reportsトラブルシュート問題に出やすい
pcsRedHat系クラスタ管理コマンドpcs cluster setupcrmshとの違いを理解
crmshSUSE系クラスタ管理ツール対話型CLI操作構文と主要サブコマンド理解
cibadminCIB直接操作コマンドXML編集・差分適用誤操作の危険性に注意
Cluster Propertyクラスタ全体設定stonith-enabled, no-quorum-policyなど全体動作制御に関係
Node Attributeノード属性値設定region=tokyoなどLocation制約条件に使用
Resource Defaults全リソースの共通設定resource-stickiness, migration-thresholddefault設定の作用を理解
Fail Countリソース失敗カウンタcrm resource cleanupでリセットフェイルオーバー条件に関係
Recovery Policy障害発生時のリカバリ戦略自動再起動 or 移動設定例の違いを暗記
Pacemaker RemoteSSH接続で外部ノード管理仮想/リモートノードも管理可能軽量クラスタ構成で出題あり
Watchdogハードウェア監視機能/dev/watchdogを利用ハードフェンス補助に使用
Fencing Topologyフェンシング優先順位設定複数デバイス併用構成優先順理解と実用性
Fence Delayフェンシング遅延設定同時実行競合防止stonith-action=off等設定例
Node Stateノード状態管理online/offline/standby状態変更コマンドを覚える
Standby Node待機ノード障害時にActive化状態遷移理解
Rejoin障害復旧後のノード再参加crm node onlineクォーラム再計算との関係
Resource Clone同一リソースを複数ノードで稼働Apacheなどの並列起動に使用clone-max, clone-node-maxを理解
Master/Slave Resource主従制御リソースDRBD, Galera Clusterなどマスタ昇格制御の理解
Meta Attributeリソース特性設定target-role, is-managed等制御状態の切替
Target Roleリソースの動作役割設定Started, Stopped, Master等状態操作に利用
Cluster LoggingPacemakerログ出力設定PCMK_logfile, syslog連携トラブル調査時の必須知識
Cluster Rejoinノード再参加再同期・再投票処理クォーラム復帰動作理解
Geo Cluster拠点間冗長構成boothで制御遠隔地フェイルオーバー理解
BoothGeoクラスタ制御デーモンチケット配布でリソース制御306試験新範囲要素
TicketGeoクラスタでの権限トークンboothサーバで管理一方のみアクティブ化制御
Fencing Agent外部フェンス実行プログラムfence_ipmilan, fence_ilo等コマンドの使い分け理解
fence_ipmilanIPMI経由フェンスコマンド電源制御実環境でも多用される重要項目
fence_iloHP iLO フェンスデバイスXMLAPIで制御実装手順を把握
fence_vmware_soapVMware ESXi フェンスvSphere経由制御仮想環境対策問題あり
DRBDデータ同期ブロックデバイスマスタ/スレーブ制御failover構成で連携出題
Cluster Filesystem複数ノードで共有アクセスGFS2, OCFS2failover時のFS再マウント理解
fs_resourceファイルシステムリソースocf:heartbeat:Filesystemmount/unmount動作を理解
IPaddr2仮想IPリソースocf:heartbeat:IPaddr2failover時のIP移動動作
systemdリソースsystemdユニットをクラスタ管理ocf:heartbeat:systemd近年頻出リソースタイプ
apacheリソースWebサービス管理用ocf:heartbeat:apache設定ファイル位置と起動確認
clone-min/max複製リソースの制限clone-max=2等負荷分散リソース構成
quorumdクォーラム補助デーモンvote追加で過半数維持2ノード構成時に有用
Witness Node軽量投票ノード外部クラウドに配置可能Split-brain防止策として出題
Node Weightノード優先スコアlocation制約で使用スコア演算方式理解
Cluster Redundancy冗長化の設計概念多重経路・電源二重化等設計論的出題に注意
heartbeat linkノード間通信リンク2重化推奨通信断時split-brain対策
fencing race同時フェンス競合delay設定で防止実運用の安全策理解
quorum witness外部仲裁ノードDR構成で活用ネットワーク障害時判定補助
failover timing切替までの遅延時間timeoutsで制御故障検知設定値理解
start timeoutリソース起動タイムアウトmeta属性で指定遅延設定と誤検知防止
stop timeoutリソース停止タイムアウト長めに設定複雑依存リソースで重要
monitor interval状態監視周期interval=10s過短設定による誤検知注意
clone-statecloneリソースの稼働状況active/passive ノード表示出力解釈問題あり
crm_resource cleanup失敗カウンタリセットフェイルオーバー再試行許可再起動試験時に利用
pacemaker alertイベント通知機能email, script通知アラート機構を理解
fencing verifyフェンス動作テストstonith_admin --list-targets本番前確認手順理解
cluster shutdownクラスタ安全停止pcs cluster stop --all順序とリソース停止理解
failover testフェイルオーバー試験ネットワーク遮断・プロセスkill実務的手順が出題される
recovery sequence障害復旧順序node再join→リソース起動再構成時動作理解
failover logging障害発生ログ/var/log/pacemaker.log解析に頻出パス
スポンサーリンク

第4章:362 High Availability Cluster Storage(高可用性クラスタストレージ)

暗記のポイントは以下の通りです。

  • /etc/drbd.conf の構成と、同期モード(A/B/C)の違いは暗記必須。
  • Primary/Secondary 切替、after-sb-0pri など競合解決設定を理解。
  • GFS2/OCFS2/CLVM/DLM の関連をマッピングして整理。
  • iSCSI と multipath の設定を組み合わせた実運用パターンが頻出。
用語意味主な使い方や構成要素試験でのポイント
Shared Storage複数ノードで共有するストレージFC, iSCSI, NFS などクラスタ構築に不可欠な共有資源
Shared-Nothing各ノードが独立ディスクを持ち同期DRBD などHA構成でよく採用される方式
DRBD (Distributed Replicated Block Device)ネットワーク経由でブロックレベル同期Primary/Secondary モードLPIC306の中心テーマの1つ
drbdadmDRBD 管理コマンドcreate-md, up, status などCLI操作を暗記しておく
drbdsetup低レベル構成コマンド同期モード・ネット設定詳細制御問題に頻出
/etc/drbd.confDRBD 設定ファイルglobal, common, resource セクションresource 名の指定を理解
drbd kernel moduleカーネルモジュールmodprobe drbd で読み込み起動時自動ロード設定を確認
Primary Node書き込みを担当するノードSecondary と同期手動昇格コマンド drbdadm primary
Secondary Node読み取り専用の待機ノードPrimary と同期維持手動切替時の動作を理解
Protocol A/B/CDRBD 同期モードA=非同期, B=半同期, C=同期Cモードが最も安全
drbd-meta-dataメタデータ領域デバイス末尾に作成同期情報を保持
drbdadm status同期状態表示UpToDate / SyncSource / SyncTargetステータス値の意味を覚える
drbdadm roleノードの役割確認Primary/Secondary 表示状態変化を確認できる
SyncSource同期元ノードデータ送信側同期再構築時に出題あり
SyncTarget同期先ノード受信側進捗%の確認方法を理解
Initial Sync初期同期初回のデータコピー長時間かかる特性を理解
Resync再同期障害復旧後の差分同期自動再開の条件理解
Split Brain (DRBD)両ノードがPrimary化手動復旧が必要drbdadm connect --discard-my-data
Disk Stateディスク状態UpToDate, Inconsistent 等正常状態の組み合わせ理解
Connection State接続状態Connected, WFConnection 等切断・再接続挙動を理解
drbdadm disconnect接続切断コマンド手動テストに使用再接続時の注意点理解
fencing resource-onlyDRBD 用フェンシングモードResource単位の制御Split-brain防止に有効
fencing resource-and-stonithDRBD + STONITH 両方利用高信頼構成高難度構成として出題あり
after-sb-0priSplit Brain 発生時ポリシーdiscard-younger-primary等設定競合解決ポリシー暗記
disk-barrier書き込み整合性機能no-disk-barrier設定時の危険性理解パフォーマンスと整合性トレードオフ
al-extentsActivity Log 範囲設定同期効率向上設定値の意味を理解
bitmap同期差分管理機能変更ブロック追跡効率的再同期の要
quorum-deviceDRBDクォーラム機構tie-breaker として機能2ノード構成で重要
drbdsetup events2状態変化イベント監視スクリプト連携可能運用監視で使用
drbd-status状態確認ツール統合的に状態表示cat /proc/drbdの代替
cat /proc/drbdDRBD 状態情報参照kernelレベル出力試験でも頻出コマンド
LVM (Logical Volume Manager)論理ボリューム管理pvcreate, vgcreate, lvcreateDRBDやGFS2と連携
LVM2 metadataボリューム構成情報/etc/lvm/lvm.confクラスタ環境で共有可否理解
CLVM (Cluster LVM)クラスタ対応LVMDLMと連携共有ボリュームのロック制御
lvmlockdLVMロック管理デーモンdlmロック使用Clustered LVM構成で必須
DLM (Distributed Lock Manager)クラスタ間ロック制御GFS2, CLVMと連携分散FS運用の基盤
dlm_controldDLM制御デーモンsystemdで起動管理GFS2と併用理解
GFS2 (Global File System 2)Red Hat系クラスタファイルシステム複数ノードから同時アクセス可能fencing設定が必須
OCFS2 (Oracle Cluster FS 2)Oracle開発のクラスタFSDRBDやiSCSIと併用可能GFS2との比較を理解
mkfs.gfs2GFS2ファイルシステム作成-jでジャーナル数指定ジャーナルの意味理解
mount -t gfs2GFS2マウントコマンドlockproto, locktable指定ノード識別設定を覚える
lockprotoロックプロトコル指定lock_dlmなどクラスタ同期制御
locktableクラスタ内のFS識別名clustername:fsname 形式一意性が必要
gfs2_toolGFS2診断ツールjournal情報, stat確認廃止予定、gfs2_edit等へ移行
gfs2_editGFS2メタデータ編集構造確認に使用直接変更は危険
gfs2_fsckGFS2整合性チェックファイルシステム修復クラスタ停止中に実行
ocfs2consoleOCFS2 GUI管理ツールボリューム設定可視化CLI設定と比較理解
o2cbOCFS2クラスタスタックノード検出と通信管理pacemaker併用設定理解
mkfs.ocfs2OCFS2フォーマットコマンドジャーナル数・ノード数指定クラスタ構成時の注意
mount.ocfs2OCFS2マウントコマンド/etc/ocfs2/cluster.conf利用設定ファイルの重要性
ocfs2_hb_ctlハートビート制御ツールノード監視と再起動制御failover時の挙動確認
iSCSIネットワークベースの共有ブロックtargetd, initiator使用DRBDやGFS2と併用
tgtadmiSCSIターゲット管理target, lun設定コマンド構文を理解
iscsiadmiSCSIイニシエータ制御discovery, login操作永続接続設定を覚える
multipathdマルチパスI/Oデーモン/etc/multipath.confパス障害時フェイルオーバー制御
device-mapper-multipathマルチパスデバイス管理multipath -llで確認冗長経路設計理解
udevデバイス管理サブシステム動的デバイス命名クラスタ環境のデバイス競合対策
Persistent Device Name永続デバイス名/dev/disk/by-id/フェイルオーバー時の安定識別
UUIDファイルシステム識別子blkidで確認fstab設定で推奨
mount options noatimeアクセス時刻更新無効化性能向上クラスタFSでの最適化設定
journaling書き込みログ保持機構GFS2, OCFS2等で利用故障時リカバリの仕組み理解
quorumd (storage)ストレージクォーラム制御iSCSI共有ロックなどCLVMとの連携理解
snapshotストレージの時点コピーLVM snapshotで実現DRBD併用時の整合性注意
thin provisioning薄プロビジョニング実容量より多く割当LVMのthin pool設定出題
RAID冗長ディスク構成mdadmで構築RAID10/5などの特性理解
mdadmLinux ソフトウェアRAIDツールcreate, detail, monitorRAID障害検知と修復
bitmap (RAID)RAIDの差分同期機能/sys/block/mdX/md/bitmap再同期高速化機能理解
filesystem fencingFSレベルのフェンシングlock失敗時FS停止GFS2/OCFS2で必須設定
SANストレージエリアネットワークFibre Channel接続FC構成とiSCSI比較出題
WWN (World Wide Name)FCデバイス識別子HBA固有IDマッピング設定理解
HBAホストバスアダプタFC接続用NICマルチパス構成で使用
multipath.confマルチパス設定ファイルpath_grouping_policy等設定policy値の意味を理解
path checker経路監視機構tur, readsector0等検証方式の違い理解
drbd-utilsDRBD管理パッケージdrbdadm, drbdsetup含むバージョン一致が重要
fencing resource-onlyDRBD専用フェンス設定ノード停止せずI/O停止高速フェイルオーバー構成
スポンサーリンク

第5章:363 High Availability Distributed Storage(分散ストレージ)

暗記のポイントは以下の通りです。

  • GlusterFS と Ceph を比較して構成とコマンドを整理。
  • GlusterFSは Volumeタイプ(Replicated / Distributed / Disperse / Arbiter) を覚える。
  • Cephは OSD・MON・MGR・MDS・CRUSH Map・Pool・PG の関係を図で理解。
  • ceph -sceph osd treeceph df の出力を読めるように。
用語意味主な使い方や構成要素試験でのポイント
Distributed Storageデータを複数ノードに分散して保存GlusterFS, Ceph などスケールアウトと冗長性を両立
GlusterFSオープンソース分散ファイルシステムブリックを束ねてボリューム構成LPIC306 の中心テーマの1つ
BrickGlusterFS の最小ストレージ単位各ノードのディレクトリボリューム構成の基本単位
VolumeGlusterFS の共有領域Distributed / Replicated / Disperseボリュームタイプを区別
glusterdGlusterFS 管理デーモン各ノードで動作クラスタ構築時に常駐
gluster peer probeノード追加コマンドクラスタへの参加登録双方向認識が必要
gluster peer statusクラスタノード状態確認Connected / Disconnected通信異常確認に使用
gluster volume createボリューム作成gluster volume create vol1 replica 2 ...コマンド構文を覚える
gluster volume startボリューム起動開始後にマウント可能状態確認も可能
gluster volume stopボリューム停止メンテナンス時に実施停止前にクライアント切断
gluster volume infoボリューム情報確認設定・構成確認管理コマンド頻出
gluster volume statusブリック状態確認Online/Offline 表示トラブルシュートに使用
Distributed Volumeデータを分割して保存負荷分散重視冗長性なしに注意
Replicated Volume同一データを複製保存データ冗長性重視一般的HA構成
Distributed Replicated Volume分割+複製の混合構成スケールと冗長性両立出題頻度高い
Disperse VolumeErasure Coding方式パリティ付き冗長容量効率重視の構成
Arbiter Volume調停ノード付き複製構成少容量ノードで整合性維持Split-brain防止に有効
Split-brain (Gluster)ノード間でデータ不整合heal コマンドで修復自動heal設定を理解
Self-heal自動同期修復機能gluster volume healヒール対象状態を確認
gluster volume heal info修復対象ファイル確認split-brain検出にも使用実務的コマンド
gluster volume heal full強制全体修復再同期完了まで監視必要データ損失防止
quorum-typeクォーラム動作設定auto/fixed/none不整合対策に関係
transport-type通信方式指定tcp / rdmaパフォーマンス差異理解
performance.cache-sizeクライアントキャッシュ設定メモリ調整I/O性能最適化理解
gluster volume setボリューム設定変更performance, auth設定等key-value形式を理解
gluster volume reset設定初期化デフォルト状態へ戻す誤設定時の回復手段
gluster volume deleteボリューム削除停止後に実施データ削除に注意
gluster volume replace-brickブリック置換障害ディスク交換時再同期手順を覚える
gluster volume rebalanceデータ再配置ノード追加後に実施スケールアウト時に重要
gluster volume geo-replication遠隔レプリケーション設定master/slave 構成災害対策構成で出題
glusterfs-fuseFUSE 経由マウント方式/mnt/glusterfsクライアント側設定理解
mount.glusterfsマウントコマンドserver:/volume 形式fstab設定方法理解
gluster volume quotaクォータ制限設定ディレクトリ単位で設定可制限値設定構文覚える
gluster volume geo-rep statusレプリケーション状態確認Active/Passive 表示ステータス確認に頻出
gluster volume topブリックI/O統計表示read/write ops 表示負荷分析で利用
gluster volume tierホット/コールドデータ分離SSD+HDD階層化試験では参考レベル
gluster volume snapshotボリュームスナップショットスケジュール可能保護・復旧機能理解
glusterfsd各ブリックプロセスブリック単位で動作デーモンの役割理解
auth.allowアクセス許可設定クライアントIP指定セキュリティ設定で頻出
cluster.server-quorum-typeサーバクォーラム設定server モード指定複数ノード環境で重要
disperse redundancy冗長データ数指定例: redundancy 2構成式 (n+k) 理解
gluster-mgmt管理ネットワーク通信用独立NICネット分離設計問題
heal daemon自動修復デーモンglustershd常駐必須。止めないこと
brick multiplexing複数brickを1プロセスで管理メモリ削減cluster.brick-multiplex設定
metadata cachingメタデータキャッシュlookup回数削減パフォーマンス改善要素
AFR (Automatic File Replication)自動複製機構replica volumeの基礎整合性維持に重要
shardingファイルを小片化保存大容量ファイル分散効率化Gluster新機能として出題あり
I/O thread count並列I/Oスレッド数performance.io-thread-count性能最適化設定
Ceph分散オブジェクト/ブロック/FSストレージOSD, MON, MGR, MDS 構成Glusterと並ぶ主要範囲
OSD (Object Storage Daemon)データ実体を保持するプロセス各ディスクに1つ配置冗長性と回復速度に関係
MON (Monitor)クラスタの状態監視Quorum維持, MAP配布常に奇数台推奨
MGR (Manager)管理機能とメトリクス収集Web Dashboard 提供MONとの役割分担理解
MDS (Metadata Server)CephFS メタデータ管理ファイルシステムで使用RADOS層とは独立
RADOS基盤オブジェクトストア層OSDを束ねる論理層Cephの中心概念
libradosRADOSアクセスライブラリrbd/rgw/cephfsで利用API層として理解
CRUSH Mapデータ配置アルゴリズムバケット・ルール構成Ceph特有の出題重点
ceph.confCeph設定ファイルMON, OSD, MGR, MDS設定各セクションを理解
ceph -sクラスタ全体状態確認health OK / WARN / ERRステータス解釈に頻出
ceph osd treeOSD階層構造確認host, rack, root 表示配置ポリシー理解
ceph osd df使用容量確認利用率・残容量を表示負荷分散確認に使用
ceph osd crush rule dumpCRUSHルール出力placement group定義確認冗長構成理解に必須
ceph healthヘルスステータス表示OSD障害検知出力値OK/WARN/ERRを覚える
Placement Group (PG)OSD間のデータ分散単位データの小単位クラスタ再配置と回復理解
Poolデータ論理グループPGの集合体RADOS Pool設計問題に出題
ceph dfプール使用状況確認オブジェクト数と容量表示rados df との違い理解
ceph osd repairOSD修復コマンド一部データ再同期ノード障害後の対応
ceph mgr modulesMGRモジュール一覧dashboard, prometheus拡張機能把握
ceph fs statusCephFS状態確認MDS数, セッション数MDS障害時挙動理解
ceph fs volume createCephFS作成volume+subvolume概念コマンド構文暗記
radosgw (RGW)S3/Swift互換API提供HTTPアクセス対応Cephオブジェクトゲートウェイ
ceph auth認証設定keyring管理安全な通信確立理解
keyringCeph認証鍵ファイル各デーモン別配置場所と用途
ceph balancer自動負荷再配置機能PG再配置を自動化実運用設定理解
ceph orchOrchestratorツールcephadm経由で構築新試験範囲として要確認
cephadmコンテナベース構築ツールsystemd統合現行標準導入方式
ceph-volumeOSD作成補助ツールlvm / raw形式指定可作成構文を理解
rbd (RADOS Block Device)ブロックデバイス提供VMストレージとして使用rbd map/unmapコマンド理解
rbd snapRBDスナップショット管理作成・削除・復元コマンド構文出題あり
ceph-fuseCephFSユーザ空間マウント/mnt/cephfsfstab設定理解
ceph-mgr dashboardWebベース管理画面クラスタ監視・操作GUI確認問題あり
recovery/backfillデータ再同期プロセスOSD復旧時に実施状態変化メッセージ理解
backfill_toofullディスク容量逼迫警告OSD使用率高チューニング項目出題
replication sizeレプリカ数設定poolごとに指定size=3 が一般的
min_size最小稼働レプリカ数quorum維持条件書込み制限条件理解
ceph osd set nooutOSD除外フラグメンテナンス時に利用自動再構成防止
ceph osd unset noout除外解除復旧再開運用時手順出題あり
ceph statusクラスタ全体の簡易状態ceph -sと同義出力構造理解
ceph versions各デーモンバージョン確認MON/MGR/OSD別表示互換性確認に利用
ceph logログ出力設定debug_osd等障害調査時に重要
ceph crash lsクラッシュログ一覧ceph-mgr監視機能最新バージョン要素
スポンサーリンク

第6章:364 Single Node High Availability(単一ノード高可用性)

暗記のポイントは以下の通りです。

  • RAID/LVM/NIC Bonding が中心。特に mode 1 (active-backup) は頻出。
  • lvcreate --type raidlvextend --resizefs の構文を覚える。
  • systemdRestart=alwaysWatchdogSec による自己修復を理解。
  • UPS/SMART/mdadm監視など、予防的HAの考え方も試験範囲。
用語意味主な使い方や構成要素試験でのポイント
Single Node HA単一サーバ内での可用性向上RAID, LVM, NIC冗長化などクラスタを使わずに冗長性を確保
Hardware Redundancy物理構成の冗長化電源二重化・FAN二重化など可用性設計の基礎
Power Supply Redundancy電源ユニットを2系統化PSU 1 + 1構成データセンター設計に関連
Hot-Swappable Component稼働中交換可能パーツHDD, PSU, FANなどダウンタイム削減効果を理解
ECC Memory誤り訂正機能付きメモリSingle Bit Error訂正サーバ向け標準仕様
UPS (Uninterruptible Power Supply)無停電電源装置短時間電力供給停電時の安全停止を理解
RAID (Redundant Array of Independent Disks)ディスク冗長化技術RAID1, 5, 6, 10 など冗長性と性能特性を暗記
mdadmLinux ソフトウェアRAID管理mdadm --createRAID構築コマンド頻出
RAID 0ストライピング高速だが冗長性なし業務用途では非推奨
RAID 1ミラーリング冗長性高い障害復旧時間が短い
RAID 5パリティ分散1台障害まで許容書込性能低下を理解
RAID 6ダブルパリティ2台障害まで許容大容量構成で有効
RAID 10ミラー+ストライプ高速かつ冗長最も実用的構成
Hot Spare待機ディスク障害発生時に自動置換自動再構築を理解
RebuildRAID再構築処理ディスク交換後に実施再構築中の性能低下を理解
mdstatRAID状態確認cat /proc/mdstat同期進行率など確認
bitmap (RAID)差分同期管理再構築高速化状態保持に重要
LVM (Logical Volume Manager)論理ボリューム管理PV, VG, LV構成柔軟な拡張・スナップショット機能
pvcreate/vgcreate/lvcreateLVM構築コマンド群ボリューム生成操作基本コマンドを暗記
lvextend –resizefsLV拡張とFS拡張を同時実行容量追加に使用設問で頻出
LVM Snapshot特定時点のデータコピーlvcreate -s差分管理方式を理解
LVM Mirrorボリューム冗長化lvconvert --mirrorRAID1類似構成
LVM RAIDLVMでのRAID構築RAID1/5/10対応mdadmとの違い理解
Thin Provisioning必要分だけ実領域割当lvcreate --type thinストレージ効率化を理解
lvdisplay/vgdisplay構成確認コマンド残容量や属性を確認状態確認問題に頻出
pvmove物理ボリューム移動ディスク交換時利用冗長環境で安全移動
RAID + LVM多層冗長構成md上にLVMなど実務的HA設計
filesystem check (fsck)ファイルシステム検査ext4, xfs 対応障害復旧時の定番ツール
Journaling FS書込ログ保持FSext4, xfs, btrfs障害後リカバリ時間短縮
ext4 journalext4のジャーナル領域metadata/orderedモードジャーナル方式の違い理解
XFS LogXFSのトランザクションログ外部log deviceも可高速リカバリ特性を理解
fsfreezeFSを一時凍結スナップショット時使用DRBD/LVM連携で重要
SMART (Self-Monitoring Analysis Reporting Tech)ディスク自己診断smartctlで監視早期障害検知の基礎
smartctlSMART管理コマンドsmartctl -a /dev/sdX温度・再代替セクタ確認
badblocks不良セクタ検査badblocks -v /dev/sdX物理障害診断
iostatI/O統計確認sysstat パッケージディスク負荷把握に重要
vmstatメモリ/CPU/I/O統計定常監視ツールトラブル解析で利用
uptime稼働時間・負荷確認HA稼働指標確認平均負荷の解釈理解
sysstat packageiostat, sar等を含むパフォーマンス監視運用監視知識
bonding (リンクアグリゲーション)NIC冗長化mode 0–6 指定可高可用ネットワーク設計に必須
mode 0 (balance-rr)ラウンドロビン方式スループット向上スイッチ設定依存
mode 1 (active-backup)片系待機最も安定したHA構成デフォルト推奨構成
mode 2 (balance-xor)MAC/XOR方式負荷分散性能高スイッチ連携必要
mode 4 (802.3ad LACP)ダイナミックリンクアグリゲーションスイッチ対応必要企業LANでよく採用
mode 5 (balance-tlb)転送負荷分散受信側制御なし環境依存挙動に注意
mode 6 (balance-alb)送受信両方分散スイッチ非依存小規模環境で有用
/etc/sysconfig/network-scripts/ifcfg-bond0bonding設定ファイルRHEL系設定設定例問題で頻出
MII Monitoringリンク監視miimon=100 などフェイルオーバー検知間隔
arp_monitorARP応答監視方式miimon代替高度な冗長検出に出題
VLAN Tagging仮想LAN分離ip link add link eth0 name eth0.10 type vlanHA NIC構成で重要
ethtoolNIC設定確認・変更スピード/デュプレックス変更障害診断に使用
IP Bonding with VRRPNIC + 仮想IP冗長化keepalived と組み合わせLB構成応用として理解
NetworkManagerネットワーク管理デーモンnmcli, nmtui で設定bonding/VLAN連携理解
redundant gatewayゲートウェイ冗長化VRRPやOSPF利用ネットワークHA設計問題
multipath I/Oストレージ経路冗長化device-mapper-multipath経路障害対策に出題
/etc/multipath.confマルチパス設定path_checker設定などpolicy値を覚える
path_grouping_policy経路グループ化方式failover/multibus方式の違い理解
watchdogハードウェア監視タイマーsystemd watchdog設定自動再起動メカニズム
systemd-watchdogサービス監視機能WatchdogSec=30sプロセス停止時自動再起動
service Restart=alwayssystemd単位の自動再起動Unit設定で利用単一ノードHAの基本設定
tmpfiles.d一時ファイル再生成再起動時整合性維持冗長性設計で補助的
backup rotation定期バックアップ世代管理logrotate, cron等データ保全と復旧性評価
snapshot backupLVMスナップショット利用オンラインバックアップ差分保存方式理解
rsync –link-dest差分バックアップ実装ハードリンク方式増分保存と世代管理
cron + anacron自動バックアップ実行定期ジョブ設定可用性維持の運用対策
systemctl enable自動起動登録永続化設定サービス継続稼働確認
sysctl kernel.panicカーネルパニック時再起動sysctl -w kernel.panic=10自動復旧設定に頻出
kdumpカーネルクラッシュダンプ/var/crash出力障害解析準備もHA要素
rsyslog remoteログを外部送信冗長ロギングログ保全と可用性関連
SMART AlertHDD障害検知通知smartd.confメール通知設定理解
temperature monitorハード温度監視lm-sensors使用予防保守対策
lm-sensorsハードウェアセンサ監視sensorsコマンドCPU温度, FAN速度確認
RAID monitormdadm監視mdadm --monitor自動通知設定を理解
fail-safe kernel予備カーネル設定grubエントリ保持起動失敗対策
dual-boot system複数OS環境バックアップ用途単一障害点削減策理解
firmware update automation自動FW更新fwupd利用セキュリティ維持策
redundant network path複数経路通信NIC bonding + ルーティング可用性向上設計
hot plug support稼働中デバイス追加USB, SAS, NVMeサービス継続性に関係
SMART self-test cron定期自己診断smartd自動実行定常監視問題
RAID check cronRAID整合性定期検査/etc/cron.d/mdadmスケジュール設定確認
failover script自動復旧スクリプトsystemd ExecStartPre等単体サーバでも実装可
kernel softlockupCPUハング検知watchdog連携再起動高可用監視理解
graceful shutdown正常停止処理UPS信号で実行データ保護の観点
dracut rescue救援initramfs起動不能時対応冗長ブート構成関連
BIOS Redundancy二重BIOS搭載一部サーバ機能自己修復機能理解
firmware watchdogBIOS内蔵監視機能ハードリセット実施Linux側設定連携
bootloader redundancyGRUB複製複数ディスクにMBRブート障害対策
スポンサーリンク

その他補足情報

LPIC306に関する試験の補足情報を以下に記載します。

概要・前提条件

項目内容
試験コード306-300
試験時間90分
試験提供機関Pearson VUE / Linux Professional Institute (LPI)
問題数60問(選択式+記述式)
認定の有効期間5年
前提条件LPIC-2 の認定を保持していること
試験テーマHigh Availability and Storage Clusters(高可用性およびストレージクラスタ)
試験バージョンVersion 3.0
注意事項旧LPIC-3 304(仮想化+高可用性)はVersion 3.0から分割され、305(仮想化/コンテナ)と306(高可用性/ストレージ)に改定されました。
スポンサーリンク

    出題範囲

    試験範囲は大きく 4 つのトピック(Topic 361~364)に分かれ、それぞれの重み(Weight)があります。

    トピック主な内容重み(試験での比率目安)
    361:High Availability Cluster Management高可用性クラスタの基本概念、クラスター設計、フェンシング、分割脳(split-brain)、冗長性、フェイルオーバー/フェイルバック制御など6
    361-2:Load Balanced ClustersLVS/IPVS、keepalived、ldirectord、HAProxy のインストール・設定・保守・トラブル対応、VRRP 概念など8
    361-3:Failover Clustersフェイルオーバークラスタの構成、リソース管理、クラスタの再編成、フェイルオーバー動作、クラスタ通信8
    362:High Availability Cluster StorageDRBD(分散レプリケーション)、クラスターでのストレージアクセス(共有ストレージ方式)、クラスタファイルシステム(例:GFS2、OCFS2 など)DRBD:6、Cluster Storage Access:3、Clustered FS:4
    363:High Availability Distributed Storage分散ストレージ技術:GlusterFS のクラスタリング、Ceph クラスタ(OSD, MON, MGR, MDS 等の構成と運用)GlusterFS:5、Ceph:8
    364:Single Node High Availability単一ノードでの可用性確保、ハードウェア障害対策、RAID 上級設定、LVM 上級設定、ネットワーク可用性(冗長 NIC、bonding、フェイルオーバー等)Hardware/Resource HA:2、Advanced RAID:2、Advanced LVM:3、Network HA:5
    スポンサーリンク

    各トピックの補足説明・要注意点

    トピック主な内容・キーワード
    361:クラスタ管理(管理手法・設計)– クラスタ構成モデル(Active-Passive/Active-Active/Shared-Disk/Shared-Nothing)
    – Shared-Nothing vs Shared-Disk 比較
    – フェンシング(ノードフェンシング/リソースフェンシング)の手法- Split-Brain(分割脳)発生時の対策- クラスタのリソース/サービス/監視・健全性チェック
    361-2 & 361-3:ロードバランス/フェイルオーバークラスタ– LVS/IPVS:負荷分散方式、プロトコル、設定- keepalived:VRRP による冗長構成
    – ldirectord:バックエンドノード管理
    – HAProxy:ロードバランサ/プロキシとしての設定
    – フェイルオーバークラスタにおけるノード管理、フェイルオーバー/フェイルバック動作
    362:クラスタストレージ– DRBD:ノード間データレプリケーション、同期モードと非同期モード
    – 共有ストレージアクセス:FC、iSCSI、共有ディスク方式の概念と利用時の注意点
    – クラスタ対応ファイルシステム:GFS2、OCFS2 などの構成と運用
    363:分散ストレージ– GlusterFS:ノード追加、レプリケーション、ブリック構成、ボリュームタイプ
    – Ceph:MON/OSD/MGR/MDS 構成、CRUSHルール、スケーラビリティ、フェイルオーバー、再構築、モニタリング
    364:単一ノードの高可用性技術– RAID(RAID5/6/10など)の高度構成・パラメータ
    – LVM 高度設定:RAID併用、スナップショット、高度パラメータ調整
    – ネットワーク可用性:NIC 冗長化、bonding、冗長経路設計
    スポンサーリンク