[本文]

国・地域名:
ドイツ
元記事の言語:
ドイツ語
公開機関:
ドイツ工学アカデミー(acatech)
元記事公開日:
2025/09/08
抄訳記事公開日:
2025/10/09

MISSION KI、データ発見と品質向上を支援するオープンソース技術をリリース

MISSION KI präsentiert Datensatz-Suchmaschine und automatische Qualitätsbewertung für die präzise Datensuche

本文:

(2025年9月8日付、ドイツ工学アカデミー(acatech)の標記発表の概要は以下のとおり)

人工知能が効率的に学習し、正確な予測を行うためには、質の高いデータが必要である。データは大量に存在するものの、利活用しやすい形で整備されているのはごく一部にとどまる。多くのデータは統一的な形式や品質に関する記載がなく、このままでは貴重なデータが十分に活用されない。こうした課題に対応するため、MISSION KI(ドイツ語でMISSION AIを意味する名称)は、複数の情報源を横断してデータセットを探索できるデータセット検索エンジンDaseenを開発した。Daseenはベータ版として公開されており、www.daseen.deで無料かつ登録不要で利用できる。

Daseenはオープンソースのソフトウェアを基盤としており、公的および民間のデータポータルやデータスペースから、行政、地理空間データ、気象など多様な分野の29のデータ提供者により提供される7万件超のキュレーション済みデータセットへアクセスできる。データの収集は今後数か月間で順次拡充される予定である。AIサービス事業者のbeebucketが本プロジェクトの実装を担当し、eXXcellent solutions、deltaDAO、nexyoが支援した。

データ探索を容易にするにはデータの品質記述が不可欠であるため、関係者は「Extended Dataset Profile Service(EDPS)」を開発した。EDPSはデータをインデックス化・分類する統一的な方法であり、データセットに関するメタデータ(いわゆるデータプロファイル)は自動的に生成する。これにより、データ提供者は異なる場所に存在するデータを自動的にカタログ化・キュレーションし、データプロファイルを通じて検索可能かつ利用可能な形で公開できる。こうして記述されたデータは、データスペースやデータポータルを横断して人手あるいは機械的に発見・利用され得る。MISSION KIはEDPSをDaseenに統合し、登録データセットの品質を可視化することで、利用者が目的に合った高品質なデータを効率的に取得できるようにした。

MISSION KIはこの強力なサービスを既存のデータスペースであるMobility Data SpaceやPontus-Xに組み込んだ。さらに、開発されたソフトウェアが既存の技術的ソリューションや標準と調和し、安全でオープンに利用でき、長期的に運用可能であることを確認した。また、このソフトウェアは現在、オープンソースとしてGithubで公開されている。

[DW編集局]