The Art of SLOs

イントロダクション

The Art of SLOsは、GoogleのCustomer Reliability Engineeringチームによって開発されたワークショップです。このワークショップの目的は、Googleがサービスの信頼性を計測する方法 サービスレベル指標(SLI) とサービスレベル目標 (SLO)を参加者に紹介し、実際にこれらの計測方法を作成することを体験してもらうことです。これらは重要で土台となる概念です。サービスの信頼性を客観的に測定する方法があれば、サービスの信頼性について有意義な会話をすることがはるかに簡単になります。

ワークショップの理論編では、開発チームと運用チームの間でしばしば生じる組織的な緊張を、サービスの望ましい信頼性を表す目標値を設定することで解決する方法を学びます。また、SLOとエラーバジェットを使って、データ駆動で、客観的、かつユーザー重視の方法でサービスの信頼性を測定・管理する方法についても紹介します。ワークショップでは、技術的な側面から、良いSLIを作るための品質について簡単に紹介します。最後に、SLI開発の4ステッププロセスを、架空のモバイルゲームのサーバー側インフラとユーザーとの簡単なやりとりに適用して、セッションは終了します。

ワークショップの実践編では、学んだことをゲームのユーザーとインフラとのより複雑なインタラクションに応用してもらいます。それぞれのインタラクションには特別な工夫が凝らされており、ユーザーが何を期待しているのか、そしてサービスがその期待にどれだけ応えているかを示す良い代替指標を見つけるにはどうしたらよいのか、真剣に考えなければなりません。最後に回答例が提示され、自分の進捗状況や推測と比較することができます。

対象参加者

ワークショップの内容は比較的技術的なもので、主に開発・運用エンジニアとその直属の管理職を対象としています。しかし、技術志向の高い製品担当者やビジネスリーダーも参加できれば、最良の結果を得ることができるでしょう。SLOの目標値はユーザーを念頭に設定する必要があります。またエラーバジェットは、それを使い果たした場合に、経営陣の後ろ盾があって初めて、組織の緊張を解くことができるのです。

チーム全体を教育する必要がない場合は、Courseraの「Measuring and Managing 」コースのほうがより適しているかもしれません。このコースでは、SLI、SLO、エラーバジェットの世界について、より詳しく、自分のペースで学ぶことができます。

ワークショップ資料

プレゼンテーションとワークショップの骨子となるものです。参加者が実践的な演習を行うための準備となるトレーニング内容が含まれています。プレゼンターのための詳細なスピーカーノートがあり、最小限の準備でワークショップを実施することができます。

研修当日にワークショップ参加者全員にお渡しする30ページほどの印刷用ハンドブックです。ワークショップ中はもちろん、一般的にサービスのSLOを作成する際に役立つ参考資料や、実習に必要な架空のモバイルゲームの背景や技術的な詳細が記載されています。

SLOワークシートSLOワークシート

ワークショップを企画・運営するためのファシリテーターハンドブックです。ネタバレになりますが、参加者がSLOを作成するよう求められる、より複雑で難しい2つのインタラクションについて、決定事項の詳細な理由とともに長文のSLOの例が掲載されています。

ライセンス

上記の4つの文書は、クリエイティブ・コモンズ CC-BY-4.0 ライセンスの下で公開されており、Google が原著者としてクレジットされている限り、誰でも自由に使用・再利用することができます。もし、改善を提案したいコンテンツに問題がある、または単に質問をしたい場合は、私たちのイシュートラッカーのコンポーネントでバグを作成してください。