Studyplus Engineering Blog

スタディプラスの開発者が発信するブログ

SRE

SRE NEXT 2023 参加レポート

SRE

SREグループの菅原です。 9/29(金)に九段会館テラスにて開催されたSRE NEXT 2023に参加しました。 ちょっと遅くなってしまいましたが、カンファレンスやセッションの感想についてレポートします。 SRE NEXT 2023とは 信頼性に関するプラクティスに深い関心を…

Amazon CloudWatchの費用を半額削減した話

Amazon CloudWatchの費用を半額削減した話 こんにちは。スタディプラスのSREグループの蜂須賀です。 今回はAmazon CloudWatchの費用を半額削減した話を紹介します。 Amazon CloudWatchの費用を半額削減した話 経緯 CloudWatch Metric Streamsの試験導入 背景…

スタディプラスのAWSコストを約3割削減できた話

この記事ではスタディプラスが2023年上半期にAWSコストを削減した取り組みを紹介しています。

Kubernetesの既存DeploymentにHPAを導入する際の注意点

こんにちは。2022年10月に入社したスタディプラスのSREグループの蜂須賀です。 今回はKubernetesの既存DeploymentにHPA(Horizontal Pod Autoscaler)を追加した際の話を紹介します。 経緯 スタディプラスではKubernetesでシステムを構築しておりますが、 一部…

Amazon EKSクラスタ上で動作するSidekiqをGraceful Shutdownさせる

SidekiqをKubernetes(Amazon EKS)で動作させる際、Graceful ShutdownとRolling Restartをさせるために必要な前提知識を整理します。

スタディプラスのポストモーテム文化

SRE

お久しぶりです。SREグループの菅原です。 おすすめのアイスはオハヨー乳業のBRULEEです。夏場は1日にアイスをいくつも食べてしまいました。もう末期ですね。 弊社ではポストモーテムをバックエンド(サーバーサイド+SRE)で運用して3年経ちました。2019年のSR…

コンテナビルドを速くするためのテクニック

こんにちは! SREの栗山です。 最近観て良かった映画は「コーダ あいのうた」です。 今回は弊社で使っているコンテナビルドを速くするためのテクニックを紹介します。 以下のような一般的なテクニックに関しては他でよく紹介されているので今回は割愛します…

スタディプラスを支えるインフラ技術(2021年)

スタディプラスでSREをしてます、ksugaです。 最近は寒くて、電気毛布が欠かせません。寝るとき足元に電気毛布を敷いて寝ると睡眠が深く、疲れが取れます。 毎年恒例になっている「スタディプラスを支えるインフラ技術」を書いていたら公開が年明けになって…

ちょっとした改善を継続的に消化する取り組み

こんにちは、SREの栗山です。最近好きな小説は「十二国記シリーズ」です。 今回はちょっとした改善を継続的に消化する取り組みに関して書こうと思います。 TL;DR SREチームでは2週間に1回「改善デー」を設けている 「改善デー」では1日で終わるようなちょっ…

Kustomize Componentsで構成管理

こんにちは。SREの菅原です。 突然ですがKustomize便利ですよね。 弊社ではKubernetesのManifest管理にKustomizeを使っています。Kustomizeの機能は複数ありどれも便利なのですが、今回はその中でもComponentsという機能を使って便利なのかどうなのかという…

EKSのCluster AutoscalerでNodeのスケールイン時に502、504エラーがでるのを解消した

チャオ。SREチームの栗山(@sheepland)です。 好きな漫画は「僕の心のヤバイやつ」です。毎回心がバキバキになりながら読んでいます。 今回はEKSでCluster Autoscalerを使った際にNodeがスケールインするタイミングで502、504エラーがでるのを解消した話です…

スタディプラスを支えるインフラ技術(2020年)

こんにちは、SREの菅原です。 あっという間に2020年も年末ですね。時が過ぎるのが早い... 今回は今年の振り返りも兼ねて、2020年でSREチームが行ったインフラのリニューアルについて記事にしたいと思います。 以前スタディプラスを支えるインフラ技術(2019年…

Kubernetesを本番導入しました

こんにちは、SREチームの栗山(@sheepland)です。 さて、スタディプラスでは2020年9月に念願の Kubernetes本番導入 を果たしました。 本番導入といってもまだ10マイクロサービスあるうちの1つをKubernetes上で稼働させているだけです。しかしそこに至るまで様…

Amazon AuroraのMySQLユーザーをTerraformで安全に管理したい

SREの菅原(id:ksugahara08)です。 最近、既存のシステムをAmazon Auroraへ移行させるという作業が頻繁に発生しました。 モテ期かな?と勘違いするくらいAuroraに関しての仕事に恵まれたため、その中でも役に立ったTerraformでAmazon AuroraのMySQLユーザーを…

Amazon AuroraにAuto Scalingを導入してCPU高負荷を乗り切った話

こんにちは、SREチームの菅原(id:ksugahara08)と栗山(id:shepherdMaster)です。 新型コロナウイルスが流行して世の中では外出自粛になる中、Studyplusは例年以上に多くのユーザー様に利用していただく機会を得ました。それに伴って4月からサーバーへのアクセ…

Kubernetes上でのFluentdを使ったログ収集について

こんにちは。ご機嫌いかがでしょうか? SREチームの栗山(id:shepherdMaster)です。 弊社ではKubernetesを導入するために着々と準備を進めております。 どんなシステム上でアプリケーションを動かすにせよ、ログ収集は必要になってきます。 Kubernetes上でロ…

スタディプラス SREチームの2019年の取り組みまとめ

SRE

SREチームの栗山(id:shepherdMaster)と菅原(id:ksugahara08)です。 年末ということもあり、弊社SREチームが2019年に行ってきた取り組みの中で大きめのトピックを紹介したいと思います。 本来ならもっともっと書きたいことがあるのですが、今回はスタディプラ…