hideb

多分技術系の話をするところ。

ポストモーテム読書会というものをしている話

はじめに

今日は、弊社 SRE 組織の中のとあるチームにて行われている「ポストモーテム読書会」という活動を紹介します。

TL; DR

  • 社内の障害対応時のポストモーテムをエクストリームリーディングする活動をしています。
  • O'Reilly Japan - SREの探求 のより身近なバージョンと言える。
  • 規模が似た組織の事例を追えるし、社内ゆえに情報は包み隠されることなく読める。

3行でまとまってしまってますが詳細は以下。

ポストモーテム読書会とは

その名の通り、ポストモーテムを読む会です。

エンジニアのチームでは、システムで障害が発生した際に「ポストモーテム」と呼ばれる文書をよく作成すると思います。

ポストモーテムには、障害に関する原因や影響範囲をまとめたり、暫定対応・恒久対応のアクションを時系列順に記録しておきます。 障害の収束後、ポストモーテムを活用してその障害に関する振り返りを開催し、 GKPT や YWT を共有しあい、得られた学びを今後に活かします。

弊社ではこのポストモーテムは社内ナレッジベースに載り、別チームからも自由に閲覧できます。

ポストモーテム読書会では、この情報体制を活用して、他チームのポストモーテムを エクストリームリーディング 形式で読んでいます。

何が良いのか

SREng であれば耳にしたことがあるかもしれない O'Reilly Japan - SREの探求 という有名な本がありますが、この本で紹介されている事例は GoogleFacebook といったいわゆるビッグテックと呼ばれる大規模組織の話だったり、あるいは書籍として出版するが故に若干「生々しさ」が隠されていたりして、イマイチ身近に感じにくいように私は感じています。 (それでも学べることはたくさんあるのですが)

社内のポストモーテム読書会では、より自分たちに近い規模の組織の、身近な情報が入ってくるというのが美味しいポイントです。 社内の情報共有であるため、生々しい情報もそのまま閲覧できます。

またエクストリームリーディング形式にすることで、主観だけではスルーしてしまう情報を誰かが拾ってくれたり、自分とは違った視点・感じ方でのコメントを出し合って、お互いに批評しあったりできます。

参加している感想

一人でただ読むだけよりも(モチベ的に)息切れしにくく、また単純に楽しく、程よい刺激を得られて嬉しいと感じています。

こうして文章にすると「まぁ、そりゃそうだよね」という内容かもしれませんが、それでわかった気になってやらずにおくのはもったいないことで、 実際にこういった活動を行ってみると得られるものがたくさんあるんだなーというのがリアルな学びでした。

ところで

弊社弊社と言っているけど書いたことが無かった事実

株式会社はてなにアプリケーションエンジニアとして入社してました。5月に。

現場からは以上です。