MEGAZONE

MEGAZONEブログ

Balance cost optimization and resiliency
Cloud Operations re:Invent 2023

Balance cost optimization and resiliency

Pulisher : Managed & Support Center ビンナリ
Description : Resilience(レジリエンス)がコストとビジネスに与える影響について学ぶセッション。

私はAWS Managed and Technical supportをサポートし、お客様の様々な要求を聞いていますが、基本的にすべてのお客様が求めるのは結局コストの最適化だと思います。

実際に進行している業務の中で、cost optimizeに関するお客様からのリクエストを受けており、現在私がお客様に提案している部分以外にどのような方法があるのか知りたいと思い、お客様に適した方法があれば適用を推奨したいと思い、本セッションを選択しました。

AWSを利用する顧客の立場では、現在のサービスの運営費用以外の必要以上の費用を支出したくないと思います。 しかし、アンケートによると、ダウンタイム発生により発生する費用が障害状況時にResilienceのために支出される費用よりはるかに大きいことが確認されています。

Resilienceがコストに与える影響だけでなく、ビジネスに与える影響まで確認し、これに役立つAWS Resilience hubを通じて確認できる部分についてのセッションです。

Resilience(復元力)とは?

Resilience(以下、復元性と呼びます)とは、障害状況で迅速に対応し、回復する能力を意味します。これに対するワークロードを実装して考慮すべき部分は、比較的単純なエラーに対応する能力である高可用性と可用性領域を全く使用できない、または自然災害で該当地域のネットワークが切断されるなどのDisater recoveryでの回復能力です。

回復力が重要な理由は、そのワークフローだけでなく、それに依存するパートナー、従属システムが影響を受ける可能性があり、ユーザーの不満を招き、頻繁に発生する場合、組織の信頼性と士気にも影響を与えるためです。

回復力が悪いと、組織にとっては金銭的な損失だけでなく、組織の評判の低下を招く可能性があります。技術やデータ面では、サービス利用の影響、データやセキュリティの低下、そしてこれは最終的に労働者の士気低下、失業にまで影響を与える可能性があります。

復元力がない場合のコストを見て、全体的な分析を行い、コストと復元力のバランスを見つけることが重要です。復元性のために過度にプロビジョニングされていないか、規制要件に適合しているかなども考慮してバランスを取ることをお勧めします。

Single azでEC2、RDSを通じてサービスする構造で、追加azにEC2を構成してELBを通したり、リージョン一つを追加して構成してサービスすることで、アプリケーションのDown Timeを減らし、継続性は高めることができます。

サービスが負荷分散(az、リージョン間)されることを考慮して、面倒ですが、シングルAZに構成したリソースリソースより低く構成すれば、追加リソース費用をより節約することができます。

また、これが万が一のダウンタイムで発生する費用より大きくはないでしょう。

AWS Resilience hubは、現在のアプリケーションの復元力を検証し、追跡できるAmazonサービスであり、これにより信頼性の高いインフラストラクチャを構成し、最終的にはコスト最適化を支援することができます。

AWS Resilience Hubはまた、ダッシュボードを提供するため、アプリケーションの復元力の状態を総合的かつ詳細に可視化することができます。

Chalk Talkの最初のセッションでしたが、発表者と観客のコミュニケーションが多く、質問の時間が多

復元力とコストは両刃の剣のように復元力を上げるとコストが増え、コストを下げると復元力が低くなり、バランスを取るのがいつも悩ましい問題です。 (もちろん、私には選択肢がありませんが…)

復元性に投資することが長期的に金銭的、評判的な損失を防ぐのでコスト面で優秀かもしれませんが、今すぐ目に見える運営コスト削減を希望する顧客が多く、どうなるかは見守る必要がありそうです。

AWS Resilience Hubは使ってみませんでしたが、ダッシュボードが可視性が高そうなので、機会があれば構成してみたいと思います。

ブログ一覧

この記事の読者はこんな記事も読んでいます