2020-05-03から1日間の記事一覧

Site Reliability Engineering #3

SRE

第Ⅱ部 原則 3章リスクの受容 3.1 リスクの管理 3.2 サービスリスクの計測 3.3 サービスのリスク許容度 3.4 エラーバジェット 参考 第Ⅱ部 原則 トイルを撲滅することはSREにとって最も重要なタスクの一つである。 トイルの定義は日常的に繰り返される価値を生…

Site Reliability Engineering #2

SRE

2章 SREの観点から覽たGoogleのプロダクション環境 2.1 ハードウェア 2.2 ハードウェアを「組織化」するシステムソフトウェア 2.3 他のシステムソフトウェア 2.4 Googleのソフトウェアインフラストラクチャ 2.5 Googleの開発環境 2.6 シェークスピア:サンプ…

Site Reliability Engineering #1

SRE

GoogleのSRE本を読み始めました。 www.oreilly.co.jp 1章イントロダクション 1.1 サービス管理へのシステム管理者のアプローチ 1.2 サービス管理者へのgoogleのアプローチ:サイトリライアビリティエンジニアリング 1.3 SREの信条 1章イントロダクション 1.1…