[本文]
-
- 国・地域名:
- 米国
- 元記事の言語:
- 英語
- 公開機関:
- 全米科学アカデミー(NAS)
- 元記事公開日:
- 2015/01/15
- 抄訳記事公開日:
- 2015/03/04
-
大量データ収集ソフトウェア: 収集の技術的代替ではなく、収集効率化・プライバシー保護が目的
- 本文:
-
2015年1月15日付の全米科学アカデミー(NAS)の発表記事によれば、「ソフトウェアに基づく技術が大量の知的情報収集を完全に代替することはできないが、目標とする収集をより効果的に実行し、収集されたデータの利用を管理する方法の開発は可能である」と全米研究会議(NRC)の最近の報告は述べている。「収集されたデータを隔離し、それらデータへの問い合わせを制限してデータの利用を監視することは、プライバシー保護の強化に役立ち、市民の自由への懸念をいくらか和らげることが可能である」とも述べている。
上記調査は、米国の知的情報の現状を評価する目的で、2014年1月にオバマ大統領が発した大統領政策指令28号で求められた業務の報告である。本指令では国家情報局(ODNI)に対して「インテリジェンス・コミュニティが目標とする情報獲得を大量収集よりも容易に実施できるソフトウェアの作成可能性を調査」して1年以内に報告するよう指示している。ODNIはNRCに調査の実施を依頼し、調査は大統領への回答作成支援を目的として2014年6月に開始された。その後数ヶ月かけてNRCが指名した専門家委員会が報告書を作成した。NRC報告書の主な内容は以下のとおりである。
・収集(Collection)とは、情報源からデータを抽出し、一定の基準にしたがってフィルタリングをかけ、その結果を保存するプロセスと定義している。収集されたデータの大半が調査研究における現在の目標やテーマと関係なければ「バルク(bulk)」データと見做され、関係があれば対象データとされる。
・大量データ収集の主要な価値は、その後の調査研究に関連する可能性のある過去の兆候を示す情報の記録である。
・収集されたデータの今後の調査研究との関連度合いは、別の方法で標的を定めることによっても高められる。新たな対象データが見つかった時点でそれを含めるべくフィルタリング基準を迅速に更新することが、目的とするデータ収集に役立つ。それが十分早期に適切に行われれば、過去の事象に関するバルク情報は必要なくなる。ただし過去の事象が特異的であったり、新しい情報の収集に要する遅れが長すぎる場合は、対象データの収集で大量データ収集を代替することは出来ない。
・データ収集管理の1つの選択肢として収集されたデータの利用に関する自動管理を行うと、調査研究の対象でない人のプライバシー保護に役立つ。報告では利用の自動管理に必要な主要な技術的要素として3つ(特定の方法でのみアクセス可能なようにするバルク・データの隔離、保存データに対して可能な問い合わせの種類の制限、問い合わせの監視)を挙げている。
・対象データ収集またはデータ利用自動管理の強化に必要な技術の一部はさらなる研究開発を必要とするが、すでにインテリジェンス・コミュニティや民間企業で使用されている技術もある。研究室での実証試験に用いられているものもあるが、多くは今後5年以内には配備可能である。
[DW編集局+JSTワシントン事務所]