NICTサイエンスクラウドは、情報通信研究機構が開発し、サービスを行っている科学研究専用クラウドです。その背景、概念、目的、現状などをご紹介します。
科学研究の分野には、3つの研究手法があると言われてきました。第1の手法は理論研究手法、第2の手法は観測や実験による研究です。19世紀までに始まったこれらの伝統的な研究手法に加えて、20世紀に計算機シミュレーション技法が登場しました(第3の手法)。
21世紀に入り、これら3つの研究手法に加えて、第4の手法としてデータ指向型研究手法(The Fourth Paradigm: Data-Intensive Science)が提言されています。インフォマティクスは、データ指向型科学において、データ(特に大規模データや複雑で多種多様なデータ)を解析する技術のことを指します。
インフォマティクスが研究手法として提言されてきた背景には、科学研究で扱うデータのほとんどがデジタル化された(すなわち、コンピュータ上で処理することができる)ことと、データサイズや種類が大規模化・多様化していることが挙げられます。科学データは量・種類とも増え続け、多くの研究者は「一生かけても解析できない程の量と種類のデータ」に埋もれつつあります。いわゆる、科学研究分野におけるBigData問題です。インフォマティクスへの期待の一つは、コンピュータのデータ処理能力を存分に活用して、これらのBigData問題を解決することです。
「クラウド」は、「インフォマティクス」同様に、明確な定義が確立していない概念です。サイエンスクラウドを定義すると、次のように説明されるでしょう。「従来の研究手法では、研究者が(予算を獲得して)コンピュータのハードウェア、ソフトウェア、データ、アプリケーションを管理・運用・開発してきたのに対して、科学研究クラウドではインターネットや学術研究系ネットワークを介してサービス(計算機、ストレージ、データベース、アプリケーションなど)に接続し、その環境下で研究開発を行う。」近年、研究費の多くがデータ処理のための基盤整備に用いられています。科学研究クラウドが普及すると、予算の多くをデータ処理そのもの(アプリケーション開発、データベース構築など)に用いることができるため、より高い研究成果が期待できます。
図は、情報通信研究機構(NICT)が2010年より構築を開始したNICTサイエンスクラウドの概念図です。NICTサイエンスクラウドでは、第2の研究手法(観測・実験)により得られた多種多様な観測・実験データと、第3の研究手法(計算機シミュレーション)により得られた大規模な計算機シミュレーションデータを一つのストレージ環境に集約します。各研究者が独自のデータストレージを有する必要がないことや、データ管理を自ら行う必要がないことだけが利点となります。それだけではなく、すべてのデータが一か所にあることで、あらゆるタイプのデータを横断的・統合的に処理することが可能となります。これにより、観測・実験データとシミュレーションデータの融合的解析の効率が飛躍的に向上します。
NICTサイエンスクラウドは、NICTの高速バックボーンネットワーク網(JGN-X)上に分散システムとして構築されています。2012年12月現在、国内4地区(5データセンター)から構成されています。
データの分散保存により安全なデータ管理が期待できます。これからのクラウド技術においては、このような分散型が重要になると考えられています。
NICTサイエンスクラウドは、科学研究目的に特化したクラウドシステムです。民間クラウドサービスとは異なる様々な特徴・特長があります。
NICTサイエンスクラウドは、NICTの情報通信研究開発の一環として運営しています。サービスは完全な可用性を保証するものではありません。
NICTサイエンスクラウド利用者には、NICTが研究開発する情報通信技術の実証実験等へのご協力をお願いすることがあります。