【事例紹介】デジタルアーカイブサービス「国立国会図書館デジタルコレクション」をAWSへ移行 フレキシブルな保守・改修が可能に

国立国会図書館は、国内外の資料・情報の収集・保存を核として、国会、行政・司法各部門、国民に対するサービスを提供しています。
国立国会図書館デジタルコレクション(以下「デジタルコレクション」)は、国立国会図書館で収集・保存しているデジタル資料を検索・閲覧できるサービスであり、国立国会図書館のデジタル情報基盤の中心的な役割を担うシステムです。

以前はオンプレミス環境で運用されていましたが、旧来技術の制約によりシステムの柔軟性及び拡張性が限定的であったことや、インフラリソースを容易に増強できないことから、突発的な利用の増加や登録コンテンツの増加に対応できないといった課題が生じていました。
また、中長期ビジョンとして掲げているデジタルシフトを加速させるうえで、サービスを取り巻く環境の変化に対応して、インフラリソースの合理化や、技術要素の現代化やシステムの改修に対する柔軟性を持つことが求められていました。
こうした背景から、システムの刷新とデジタルシフトの迅速化を図るためのソリューションの調達が開始されました。
BTCは公共セクターや、クラウドネイティブなインフラ・アプリケーション開発に強みをもっており、このプロジェクトのアプリの再構築やクラウド移行を支援させていただくことになりました。
インフラ環境の移行先として複数のパブリッククラウドが候補に挙がりましたが、国内の公共分野でも幅広く利用されていることや、国立国会図書館様の別システムで利用実績があることから、アマゾン ウェブ サービス(以下「AWS」)への移行を提案しました。

~AWSの各種マネージドサービスを活用した開発~

次期システムのインフラ要件としては、セキュアで信頼性が高いこと、拡張性が高いこと、デプロイが容易であることが要求されており、国立国会図書館様の別システムでも利用実績があることから、コンテナオーケストレーションサービスであるAmazon Elastic Kubernetes Service (Amazon EKS)を中心に、AWSの各種マネージドサービスを活用したアーキテクチャを提案しました。

これらの構成に移行したことにより、信頼性が向上したとともに、CI/CDの文化が根付き、開発プロセスが高速化されました。また、運用に関わる人的工数が削減されました。

① 厳密なアクセスコントロールと高速なレスポンスを両立したフロントエンド
フロントエンドは、Amazon CloudFrontとAmazon Simple Storage Service (Amazon S3)を活用したSingle Page Application(SPA)のホスティングを採用しています。これにより、フロントエンドに対するレスポンスを高速化し、ユーザビリティを向上させています。
また、認証や特定の条件を満たした場合にのみアクセス可能な限定コンテンツを提供するために、署名付きURLとCloudFront Functionsを活用しています。

② 自動的に拡張され可用性の高いコンテンツ管理基盤
コンテンツ管理基盤はAmazon S3とAWS Lambda、Elemental MediaConvert、DynamoDBにより構成しました。
国立国会図書館の業務系システムから登録されたコンテンツデータは、Lambda上の変換機能や、AWS Elemental MediaConvertを使用して、公開用の形式に変換され、Amazon S3に保存されます。この構成により、コンテンツ登録の必要に応じて、柔軟に計算用のリソースやストレージを確保できるようになりました。
登録のフローのステータスは、Amazon DynamoDBで管理しています。変換プロセスの進行状況やエラーハンドリングなどをリアルタイムに監視し、必要に応じて適切なアクションを実施できます。
Amazon S3 Intelligent-Tiering(データへのアクセス頻度に基づいて自動的に安価な領域にデータ配置される。)を活用しています。また、自動的に大阪リージョンでバックアップされるよう設定しました。これにより、大量のコンテンツを高速提供できる基盤でありながら、低いコストと高い可用性が確保されています。

③ 高速で運用管理の容易なサーバサイド
サーバサイドではKubernetesのマネージドサービスである、Amazon EKSを採用しています。
Cluster AutoScalerやEFS CSI driver、AWS Load Balancer Controller等、アドオンを効果的に組み合わせることで、作り込みを避けた運用管理のしやすい仕組みを実現しています。
Amazon EKS上のPodは冗長化され、検索結果画面に表示する情報や、セッションデータ等、高速性が要求されるデータについては、Amazon Elastic File SystemやAmazon ElastiCacheを活用することで、スケーラブルで高速なサービス提供を実現しています。

~再構築に伴うユーザビリティ向上~

今回のデジタルコレクションのリニューアルにより、全文検索可能なデジタル化資料が増加するとともに、閲覧画面が改善され、ユーザビリティが向上しました。また、ユーザ数の増加や機能追加に柔軟に対応できるようになりました。コンテナやサーバレス基盤を中心に構築されたシステム構成が支えとなり、これらを実現しています。

BTCは、今後もクラウドネイティブなアプリケーション開発やクラウドマイグレーションなどの支援を通じて、公共部門でのクラウド導入の動きに寄り添い、DX推進に貢献してまいります。