はじめに
皆さん、こんにちは。IT 基盤部の 安藤、平田、横田です。 私たちは DeNA のさまざまなサービスのインフラを横断的に運用し、日々サービスの安定稼働とコスト削減に取り組んでいます。
この度、2024 年 12 月にラスベガスで開催された AWS re:Invent 2024 (以下 re:Invent) に 3 人で参加してきました。 re:Invent は、AWS が主催する世界最大級の技術カンファレンスです。
re:Invent では、セッションや参加型ワークショップ、基調講演などの機会を通じて、多くの知見を得ることができました。 本ブログでは、re:Invent で得た新しい知見と技術に関する学びを、DeNA IT 基盤部がどう活かしているのかお伝えします。
また 2025 年 1 月末には、弊社オフィスで re:Cap イベント (re:Invent の振り返り会) が開催されました。 そこでは、現地参加者以外のメンバーに re:Invent でのアップデートの共有や、re:Invent の魅力について伝える場面がありました。 その re:Cap イベントの様子についてもお伝えします。
DeNA における re:Invent に対する取り組みについて知ってもらえたら幸いです。
re:Invent で得た学びを今後どう活かすか
Amazon Aurora DSQL に関する技術調査
DeNA IT 基盤部が運用しているサービスの中には、グローバルに展開される大規模なサービスも存在しており、データベースの最新アップデートには特に敏感です。 これまでにも、Aurora Serverless V2 や TiDB といった新しいデータベースサービスを積極的に検証してきました 1 2。
Amazon Aurora DSQL (以下 DSQL) は、今年の re:Invent で最も脚光を浴びた新技術といっても過言はないでしょう。
我々も基調講演での DSQL リリース発表後、DAT334 | Build resilient, high-performance apps with Amazon Aurora innovations
のセッションを聴講し DSQL の内部構成についてヒアリングしてきました。さらに IT 基盤部のデータベースに詳しいメンバーが、
- DSQL の開発者のブログ
- re:Invent で開催された各種セッション
の情報を元に、さらに DSQL の詳細調査を行いました。また、データベースの技術に詳しくない方々にも理解しやすいように、
- DSQL のどの部分が革新的なのか
- Cloud Spanner や FoundationDB との比較
を分かりやすく整理し、部内にその知見を還元してくれました。 そして、その内容は先日ブログとしてもリリースされていますので、ご興味のある方はぜひご参照ください。
Aurora DSQL は何が新しいのか?(vs. これまでの Aurora 編)
Aurora DSQL は何が新しいのか?(vs. Spanner 編)
Aurora DSQL は何が新しいのか?(まとめ + 内部技術編)
DSQL はまだプレビュー段階であり、情報は限られています。また、現時点では PostgreSQL にのみ対応しているため、MySQL を大規模に使っている DeNA ではすぐに実際の運用に取り入れることは困難です。 しかし新しい技術を題材にしながら、より良いインフラ構成をチームで議論した時間は、エンジニアリングとしての喜びを感じる非常に意義深いものでした。
Amazon EKS Auto Mode の利用検討
Amazon EKS Auto Mode は、AWS re:Invent 2024 で発表された Amazon EKS の新機能です。3 主な特徴としては、新たに追加された Amazon EC2 Managed Instances を使用することで Amazon EKS におけるノード管理を自動化することができ、運用にかかる手間を抑えることができます。
私たちが運用を担当する一部のプロダクトでは既に Amazon EKS を導入しており、今回発表された Amazon EKS Auto Mode に切り替えるかどうか検討していました。 Amazon EKS Auto Mode を使用することにより、
- ノード管理が不要
- 今までは Kubernetes のアップグレード戦略を検討し、約 4 ヶ月に一回の頻度でアップグレード対応をする必要があった
- マネージドな
Karpenter
を利用可能
- 今までは独自に Karpenter のリソースをデプロイする必要があった
- マネージドな
EBS CSI ドライバー
や
EKS Pod Identity Agent
を利用可能
- 今までは Amazon EKS Addon としてデプロイし、アップグレード対応が必要だった
といったメリットを得ることができます。 要約すると、今まで EKS クラスターの管理者が定期的に実施する必要があったアップグレードに関するオペレーションの一部が不要になります。
そのため、新規で構築する Amazon EKS クラスターについては、Amazon EKS Auto Mode を利用することで、従来よりも運用にかかる手間を抑えられないか、各種コンポーネントの細かい設定は今までと同じように利用可能か、という観点で現在検証を進めています。 一方で、既存の Amazon EKS クラスターについては、今までの運用で知見が蓄積しているため、従来の設定オプションを引き続き利用していく予定です。
AIOps による運用効率化
昨今、AI / 生成 AI の領域における進歩は目まぐるしく、様々な分野でその技術が活用されています。 今回の re:Invent でも、AI / 生成 AI に関する様々なセッションやワークショップが開催されました。
その中で我々は SUP302-R | Detect, investigate & respond to security scenarios with generative AI
というワークショップに参加してきました。
このワークショップの概要は、Amazon Q Business という生成 AI アシスタントを活用して、セキュリティインシデント対応を体験するというものでした。
初めて Amazon Q Business を体験したのですが、以下のような特徴が特に印象的でした。
- 実際にインシデントが発生した時の初動対応について、Amazon Q Business と壁打ちすることで、即座に適切な対応策を見出すことができる
- アプリケーションのコンテキスト知識をもとに、具体的な回答を提供してくれる
- 例えば、
What are the AWS resources of [アプリ名]?
と尋ねると、そのアプリケーションを構成するインフラリソースを教えてくれる
- 例えば、
今回はあくまでワークショップでの体験であるため、Amazon Q Business がすぐに実運用として活用できるとは言い切れません。 ただし、障害対応時のアシスタントとして活用することについては、大いに可能性を感じることができました。
また re:Invent 期間中には、Dynatrace というサービスに触れる機会がありました。 Dynatrace はアプリケーションパフォーマンス監視 (APM) を実現するためのツールで、以下のような特徴を持っています。
- 1 つのエージェントをインストールするだけで、インフラからアプリケーションまでの監視を一元的に行うことができる
- 自動でサーバ間の通信経路やボトルネックを可視化する機能を持つ
- 障害が発生するとその原因特定から自動修復、チケットの起票、被害状況のレポートまで、全フローを AI がサポートする
我々のインフラ運用は、まだその多くが人力に依存しています。オペレータの知識や経験、暗黙知などが運用の質を左右する状況であり、属人化による課題も抱えています。 これまで我々が培ってきた知見を、自動化し、より効率的で質の高い運用に置き換える取り組みを続けていますが、現状と理想の間には未だ、大きなギャップが存在します。 ワークショップやエキスポで複数の AIOps 技術に触れ、開発者との議論を深めた結果、これらの技術が現状の課題を解決する強力なツールになると強く感じました。 上記で言及した Amazon Q Business, Dynatrace は現地で触れた AIOps サービスの一部であり、他にも多くの有用なサービスがありました。
re:Invent から帰国後、速やかに部内へ情報共有を行い、年明けより AIOps ツールの導入に向けて PoC の準備を進めております。AIOps を活用した運用改善の取り組みについては、今後もブログで発信していく予定です。ぜひご期待ください!
re:Cap イベント
2025 年 1 月末には、re:Invent の振り返り会である re:Cap イベントが弊社オフィスで開催されました。 こちらのイベントは IT 基盤部だけではなく、DeNA で AWS を利用している、もしくは利用しようと考えている全ての人を対象としたイベントです。
re:Cap イベントでは、日頃より DeNA を支援いただいている AWS アカウントチームの皆様より、re:Invent で発表された多数の最新情報の中から、特に DeNA にとって重要な下記の領域における有益なトピックをご紹介いただきました。
- Amazon Aurora DSQL, Amazon EKS Auto Mode といった、インフラ領域の最新アップデート
- Amazon SageMaker, Amazon Redshift, Amazon Q といった、AI/ML・分析領域の最新アップデート
- ゲーム事業や動画配信といった、DeNA と特に関連のある分野での最新海外事例
特に、Amazon EKS Auto Mode に興味のある参加者が多かったため、re:Cap 後に IT 基盤部と開発者合同で勉強会が開催されることになりました。
またイベント後半では、re:Invent に参加したメンバーによるライトニングトーク(LT)会を実施しました。 「re:Invent のおすすめのセッションやコミュニティアクティビティ」や「IT 基盤部が AWS GameDay に参加して得られた経験と自信」といった re:Invent のイベントに関する内容から、「全ての会場を回りました。1番食事が美味しいホテルはどこだ?」や「胃もたれしたらここに行け」といった現地の食事情報、そのほかにも、海外に行ったことがなく、現地での過ごし方やコミュニケーションに不安がある人に向けた自身の体験談などをお伝えしました。 実際に現地参加したからこそ得られた経験・知見を参加者に共有することができました。
セクションごとにはクイズ大会が行われ、参加者同士で大いに盛り上がりました。
▼ LT 資料の一部
おわりに
re:Invent に現地参加し、多くの学びと刺激を得ることができました。 また re:Cap イベントを通じて、現地参加が難しかった方々にも最新アップデートや re:Invent の魅力、熱気を共有し、来年以降の参加を後押しできたことは、非常に有意義でした。
今回 re:Invent で得た知見を最大限に活用し、今後も事業成長に貢献してまいります。
最後まで読んでいただき、ありがとうございます!
この記事をシェアしていただける方はこちらからお願いします。