PART 05 - ボトルネックの特定

PART 05 — ボトルネックの特定・FAQ・まとめ

5 ステップで効率的に問題箇所を絞り込む — サーバー別の症状と対策、よくある質問、シリーズ総まとめ。

あくろぽりす

Engineer

アクセスログから始めてvmstatで全体を俯瞰し、詳細ツールで絞り込む——この順序を守らないと、調査が思わぬ方向へ迷走します。5ステップのフローとサーバー別の症状・対策、よくある質問をシリーズの締めとしてまとめました。

ボトルネック特定 5 ステップフロー

図1: ボトルネック特定 5ステップ — 全体把握からログ解析・DB追跡・改善まで

ボトルネックを効率よく特定するには、全体 → 詳細 の順で確認します。最初から特定のリソースを深堀りすると、別のサーバーが根本原因だったというケースを見逃しがちです。

アクセスログ — いつ・どの URL が遅いかを特定

レスポンスタイムが悪化している時刻・URL を特定する。この「いつ」が他サーバーのデータと対照する基準になる。

vmstat — 全体状況確認（r / b / si / so / wa）

問題の時刻帯に r（実行待ち）・b（I/O 待ちブロック）・スワップ・wa が上昇していないか確認する。

サーバー別ボトルネック症状と対策

Web サーバー

症状	考えられる原因	対策の方向性
レスポンスタイム上昇	APL/DB が遅い（Web 自体は正常）	APL・DB サーバーを優先確認
CPU 使用率が高い	SSL 処理・大量同時接続	SSL オフロード・ロードバランサー検討
5xx エラーが増加	APL サーバーが過負荷・タイムアウト	タイムアウト設定見直し・APL スケール

症状

考えられる原因

対策の方向性

レスポンスタイム上昇

APL/DB が遅い（Web 自体は正常）

APL・DB サーバーを優先確認

CPU 使用率が高い

SSL 処理・大量同時接続

SSL オフロード・ロードバランサー検討

5xx エラーが増加

APL サーバーが過負荷・タイムアウト

タイムアウト設定見直し・APL スケール

APL サーバー

症状	考えられる原因	対策の方向性
CPU が継続的に高い	ロジックの非効率・スレッド不足	プロファイリング・スレッドプール調整
メモリが増加し続ける	メモリリーク・GC 不足	ヒープダンプ解析・GC ログ確認
DB 待ちが長い	N+1 クエリ・インデックス不足	スロークエリログ確認・SQL 改善

症状

考えられる原因

対策の方向性

CPU が継続的に高い

ロジックの非効率・スレッド不足

プロファイリング・スレッドプール調整

メモリが増加し続ける

メモリリーク・GC 不足

ヒープダンプ解析・GC ログ確認

DB 待ちが長い

N+1 クエリ・インデックス不足

スロークエリログ確認・SQL 改善

DB サーバー

症状	考えられる原因	対策の方向性
ディスク I/O が高い（%util 高）	フルスキャン・バッファプール不足	インデックス追加・バッファプール増量
await（待機時間）が長い	ディスク飽和・書き込み集中	SSD 化・RAID 見直し・I/O 分散
CPU は低いが遅い	ロック競合・I/O 待ち	ロック競合確認・クエリチューニング

症状

考えられる原因

対策の方向性

ディスク I/O が高い（%util 高）

フルスキャン・バッファプール不足

インデックス追加・バッファプール増量

await（待機時間）が長い

ディスク飽和・書き込み集中

SSD 化・RAID 見直し・I/O 分散

CPU は低いが遅い

ロック競合・I/O 待ち

ロック競合確認・クエリチューニング

よくある質問（FAQ）

Q. vmstat の最初の行がおかしい？

最初の行はシステム起動からの累計値です。2 行目以降を分析対象にしてください。

Q. free の free 列が少なくても問題ない？

はい。「available」列を重視してください。buff/cache は必要時に解放されるため、free が少なくても available が十分あれば正常です。

Q. 収集間隔・時間の目安は？

5 秒間隔でテスト中 10〜30 分間収集するのが一般的です。負荷テストのシナリオに合わせて調整してください。

Q. 複数サーバーのデータをどう比較する？

各サーバーのデータを「時刻」でそろえてから比較します。性能劣化が始まった時刻に他サーバーで何が起きていたかを確認します。NTP での時刻同期が前提です。

シリーズのまとめ

Webシステム性能評価ガイド（全5回）の要点を振り返ります。

アクセスログで「いつ・どこが遅いか」を確認するのが出発点
vmstat でシステム全体を俯瞰してから、mpstat / iostat / free で詳細を掘り下げる
しきい値（%idle・%util・await・available・Swap）を定期的にモニタリング
テスト中は全サーバーで同時・継続的にデータを収集する（5 秒間隔を推奨）
ボトルネックは「症状 → サーバー → リソース」の順に絞り込む

ボトルネック特定 5 ステップフロー

サーバー別 ボトルネック症状と対策

Web サーバー

APL サーバー

DB サーバー

よくある質問（FAQ）

シリーズのまとめ

参考・公式ドキュメント

サーバー別ボトルネック症状と対策