Studyplus Engineering Blog

スタディプラスの開発者が発信するブログ

SRE NEXT 2023 参加レポート

SREグループの菅原です。 9/29(金)に九段会館テラスにて開催されたSRE NEXT 2023に参加しました。 ちょっと遅くなってしまいましたが、カンファレンスやセッションの感想についてレポートします。

SRE NEXT 2023とは

信頼性に関するプラクティスに深い関心を持つエンジニアのためのカンファレンスです。 同じくコミュニティベースのSRE勉強会である「SRE Lounge」のメンバーが中心となり運営・開催されます。 (公式Webサイトより引用)

感想

菅原

今年は九段下会館テラスということでレトロモダンに統一され、とても素敵な会場でした。 会場で視聴したのですが、登壇者の紹介やセッション前のカウントダウン映像などスタイリッシュで過去1番カッコいいカンファレンスでした。

プロダクトオーナーの視座から見た信頼性とオブザーバビリティ

youtu.be

speakerdeck.com

プロダクトオーナーの視点から信頼性やオブザーバビリティがどのように映っているのか興味があり視聴しました。期待していた通り、ユーザー体験を損なわないようにどうするか?という話からオブザーバビリティに話を繋げており、Chatworkさんでどのように取り組んだのかという話が聞けました。

「ユーザー満足度は誰の関心なのか?と考えた時プロダクトオーナーこそが最もSLOに関心を持つべき」という言葉にすごく共感しました。

弊社でもオブザーバビリティ・エンジニアリングの読書会やHoneycombの勉強会をプロダクトオーナーを巻き込みながら開きたいと思いました。

www.oreilly.co.jp

SREの組織類型に応じたリーダーシップの考察

youtu.be

speakerdeck.com

このセッションは目から鱗でした!視聴してない方でSREと組織のあり方やリーダーシップ理論などに興味のある方はこんな見方もあるのかとなるのでオススメです。

菱田氏はSL理論や組織の信頼性のマインドセットを説明した上で、SL理論の部下の発達度を組織の信頼性マインドセットのフェーズに当てはめることができるという話をしていました。

これによりSRE組織のリーダーシップスタイルを決めることができるのでは?という話は聞いていて興味深かったです。 SRE組織に対して技術支援をしているTopotalさんならではの話だったのではないでしょうか?

cloud.google.com

水口

2022年5月からスタディプラスのSREグループで働き始めた水口です。SRE NEXTの存在は以前から知っていましたが、SREのプラクティスを実践する役割になってからの参加は初めてです。

九段会館に来るのは10年以上前の「向井秀徳アコースティック&エレクトリック」のライブに行って以来であったり、そもそも久しぶりのカンファレンス現地参加ということでとても楽しみにしておりました。会場ではワイワイと技術の話をしていたり、元同僚との久しぶりの再会を喜んでいる人などがたくさんおり、「SREに関心を持っているソフトウェアエンジニアってこんなにたくさんいたんだ・・・?」と私は衝撃を受けておりました。

個別のセッションについての感想は書ききれないので簡単に1つだけ書きます。各セッションに共通していたこととして「信頼性を語る上で最も大事なのはユーザーである」ことが語られており、改めて重要なことだと認識しました。

また、懇親会にも参加しました。私は知り合いもほぼいない中1人参加だった上、あまり懇親会が得意な方ではなく戦々恐々としておりましたが、同じ話題を共有する方々ばかりというのもあって色々な方とお話しできました。SRE NEXTの良かった点ですね!

『みてね』のセッションなどでもEKSのバージョンアップなどの運用が大変という話がありましたが、プロダクトをEKSで動かしている会社の方々とお話させてもらって、色々な苦労話を聞けました。「ああ、泥臭く大変な運用を地道に1つずつやっているのは我々だけではないんだ。外から見てキラキラして見える会社の方々も地道な苦労の積み重ねのもとでエンジニアリングしているんだ・・・!」と分かって勇気づけられました。 

また、『Kubernetes完全ガイド』の著者で有名な青山真也さんとお話できたのは個人的に大きなトピックです。「勉強し始めの頃におうちKubernetesを作って楽しくKubernetesに入門できました」など色々お伝えできてよかったです。青山さんには「k8sの業務経験も1年経つなら、そろそろプロポーザルを出せる頃ですね?」という 激励をいただいたので、今後はアウトプットにも力を入れていきたいと思っています。

お話させてもらった方一人一人について名前を出してお礼をしたいぐらい楽しかったのですが、長くなってしまうので私の感想は以上にします。来年はSRE NEXTにプロポーザルを出したいですね!

蜂須賀

2022年10月からスタディプラスのSREグループで働き始めた蜂須賀です。 今回初めてSRE NEXTに参加しました。開会から閉会まで各社の取り組みを知ることができ、とても勉強になりました。

特に印象に残ったセッションを2つ紹介します。

Warningアラートを放置しない!アラート駆動でログやメトリックを自動収集する仕組みによる恩恵

youtu.be

speakerdeck.com

アラート駆動でログやメトリクスを自動収集するprepalertというOSSを使用した事例について紹介していました。 このセッションの中で私が大切だと感じたのは、優先度が低いが定期的に実施したほうが良い調査の効率化です。

Warningアラートの調査は問題として顕在化する段階まで達していることが少なく、優先度が低くながりがちです。 この調査を効率化することで工数自体を削減できますが、工数を短くすることで定期的に調査する習慣が作りやすくなったり、週次MTG等で調査分析する時間を取ることができます。

Warningアラートだけでなく、優先度が低いが定期的に調査したほうが良いものは効率化するメリットがあると感じました。

SREを以てセキュリティエンジニアリングを制す ― class Dev"Sec"Opsの実装に向けて

youtu.be

speakerdeck.com

セキュリティスキャナのスコアをSLO/SLI的な観点で運用したい場合の問題点について紹介されていました。

このセッションでは、SLO/SLIに関して再考する機会を得ることができました。 セキュリティスキャナのスコアをそのままSLO/SLIで導入してしまうと、そのSLOの数値が何を表しているのかわからなくなってしまいます。それだけでなくまとめて数値化することで各問題の重大さがわからなくってしまいます。

SLO/SLI的な観点で運用するなら、メトリクスの特性やそのメトリクスが悪化した場合のリスクの特性を吟味して導入する必要があると感じました。

まとめ

今回紹介できなかったセッションの中にもとても素晴らしいものがたくさんありました。 毎回SRE NEXTではSREという枠組みで色々な事例が聞けて、参加した後に「仕事頑張るぞ!」という気持ちにさせてくれます。来年以降のSRE NEXTも楽しみですし、弊社SREグループももっと発信していかないとなと思わされました。