[本文]

国・地域名:
米国
元記事の言語:
英語
公開機関:
国家科学技術会議(NSTC)
元記事公開日:
2024/12/17
抄訳記事公開日:
2025/01/14

NSTCが研究開発インフラにおけるデータインフラのあり方を検討した報告書を公表

Framework For Considering Data Infrastructure and Interconnectivity

本文:

(2024年12月17日付、国家科学技術会議(National Science and Technology Council:NSTC)の標記発表の概要は以下のとおり)

データインフラは、多くの大規模な国内外の研究プロジェクトや共同研究の中核をなすものである。研究データへのアクセス、相互リンク、分析を容易にするコンピューティングとデータ技術の急速な進歩とともに、実験・観測施設から生まれる研究データの規模と複雑さは指数関数的に増加している。連邦政府の国家AI研究リソース(NAIRR)や国家戦略コンピューティング・リザーブ(NSCR)などの研究開発イニシアチブや、オープンサイエンス等に関する連邦政府の目標は、科学データとインフラに関する新たなレベルの調整を必要としている。

このような背景のもと、NSTCは本報告書において、研究開発インフラ(RDI)の計画、開発、運用等に際してデータインフラと相互接続性を検討するためのフレームワークを提供している。さらに、RDIにおけるデータインフラに関する共通的な課題として、連邦政府とコミュニティが共同で議論し、取り組むことが有益と思われるものを提示している。

本報告書が提供する、データインフラ計画における検討項目は以下のとおり。
①データに関する科学的目標とミッションの優先順位
▽どのような科学的事項と目的がデータインフラ投資選択において優先されるのか。
▽どのようなデータ方針、コミュニティ規範、標準を採用するのか。
▽データに関する成功とは何か、また評価のための定量基準と指標は何か。
②利用者と活用
▽科学とミッションの目標を達成するために、データインフラを利用する主なユーザーはだれか。
▽どのような科学利用モデルとワークフローを支援するのか。
▽どのような方法でユーザーとデータとのインタラクションを支援するのか。
③データインベントリ、管理、管理責任
▽本取組みにおけるデータインベントリはどのようなものか。
▽データのライフサイクルを通じてデータ管理はどのように実現されるのか。
▽データインフラは、データガバナンスと管理のニーズをどのように実装するのか。
④動的データエコシステム
▽相互運用性を最大限に高めるために、どのようにデータインフラを設計できるのか。
▽RDIライフサイクルの各段階において、将来を見据えた開発要素はどのように統合されるのか。
▽スタッフおよびユーザーが、変化するデータのリソースとサービスに適応できるようにするためのプロセスは整備されているか。
⑤プロジェクトのガバナンスとパートナーシップ
▽データのステークホルダーは誰か。またどのように意思決定に参加しているか。
▽プロジェクトの持続可能性とレジリエンスを確保するための、ポリシーおよび財政支援のメカニズムはどのようなものか。
▽共同作業がどのように実施および監督され、それぞれの役割と責任がどのように配分されるかについて合意があるか。

[DW編集局]