WDS (World Data System) について
ICSU (国際科学会議、現在は国際学術会議、ISC)は2008年10月の総会において、1957-58年に実施された地球観測年(IGY)を期に設立されたデータ関連組織であるWorld Data Center (WDC)とFederation of Astronomical and Geophysical Data Analysis Services (FAGS) を発展的に解消して、新たにWorld Data System (WDS) を設置することを決定した。
WDSの目標
WDSは、品質管理された科学データの長期的な保全と提供によって、ICSUが推進する科学研究事業を支援することを主目的とする。これまでICSUのデータ活動の主体であったWDCやFAGSが地球科学系分野での活動に限定されていたのに対して、WDSでは自然科学系各分野はもとより、広く人文社会科学系までを含んだ幅広い領域におけるデータを対象とし、最新の情報科学研究の成果を取り入れたデータの保全・利用システムの構築や、発展途上国における情報格差の解消を目指す。
WDS科学委員会(WDS Scientific Committee, WDS-SC)
WDSには、活動方針の決定やWDSに加入するデータセンターの審査を行う、WDS Scientific Committee (WDS-SC、科学委員会)が設置されている。現時点における11名の委員は、国際公募に基づき、地理的領域、研究分野、ジェンダー等を考慮して選出されており(任期3年)、国別では、米国(2名)、仏(2名)、英、独、ブラジル、南ア、ウクライナ、日、中(各1名)となっている。委員構成では、WDCやFAGSからの連続性への配慮から、地球科学系の委員が大半を占めているが、情報科学系の委員も数名加わっている。これらの委員に加えて、後述のWDS国際プログラムオフィス(WDS-IPO)のホスト機関代表者と、ICSU事務局代表者の2名が、投票権を持つEx Officio として参加している。委員会は原則として年2回開催されるが、ネットワーク利用の会議も毎月のように開催されている。
WDS国際プログラムオフィス(WDS International Programme Office, WDS-IPO)
WDSでは個々のデータセンターがデータの保全や公開に責任を持つ、分散型のデータシステムの構築を目指しているが、WDSを統一性のある「システム」として機能させるためには、その中核となる組織が不可欠である。またWDSはICSU外の国際的なデータ組織との連携の強化を目指しており、それらの組織との日常的な情報交換や協議を行う態勢の確保が重要となる。そこで2010年8-9月に国際プログラムオフィス(WDS-IPO)の国際公募が行われた結果、我が国の(独)情報通信研究機構に設置されることとなった。WDS-IPOはWDSが行う活動の実務を担当し、他の国際的なデータ組織や研究者コミュニティへの窓口となる。WDS-IPOの詳細については、本特集の別稿を参照されたい。
WDSにおけるデータ公開ポリシー
WDSの前身であるWDCとFAGSにおいては、データセンターが保有するデータ等の ”Full and Open Access”、つまりデータの提供に特別な制限を設けることはせず、原則無償で(又は最低限の費用で)データの提供を行うことをポリシーとしており、WDSにおいてもこの方針が受け継がれている。このポリシーは、第2次世界大戦後の冷戦時代に実施された国際地球観測年(IGY)において、東西両陣営間におけるデータ交換態勢を確保するために制定されたのであるが、それから半世紀が経過した現在においても、自国で取得されたデータの公開に消極的な姿勢を示す国も散見される。また大規模災害に関連したデータなど、社会的な影響力が大きいデータの場合、例え先進国であっても、政治的な配慮などからデータの公開に制限が加えられているようなケースが現実に存在する。そこで人類共通の財産としてのデータの共有に向け、非政府・非営利団体であるICSUのデータ組織として、WDSが積極的なアクションをとることへの期待がある。もちろん全てのデータを一挙に全面的公開まで持って行くことは不可能に近く、現状の改善に少しでも繋がるようなデータ公開のガイドラインを提示しつつ、研究者の国際的な連携をバックにした粘り強い努力の継続が求められる。
WDSメンバー登録
WDSは、趣旨に賛同したデータセンターや国際的なデータ組織などの「メンバー」によって構成される。これは科学連合や加盟国によって構成されることが多いICSU傘下の組織としては異例であり、データ活動の「現場」の声を直接ICSUに反映させることが可能な態勢となっている。現在WDSでは、メンバーとして参加を希望するデータセンターの募集を行っている。メンバーに申請する手順としては、先ずWDSのホームページ(http://icsu-wds.org/home/1-about-us)において「WDSに対する関心の表明」を行い、所定の申請用紙にある質問事項に回答の上、WDS-SC委員による審査を経て、データセンターのホスト機関とICSUとの間で覚書を交換する、という手順になっている。審査に当たって重視されるポイントは、データをWDSが定めるポリシー(Full and Open Access)に従って公開する意志があること、長期的なデータ活動を行うことに対するホスト機関からの了解があること、データの品質管理が行われていること、データ活動に対する外部評価が行われていること、最新のIT技術の導入に積極的であること、概ね2年ごとに開催されるWDS全体会議に出席する意志があること等である。現時点で約140ヶ所のデータセンターの審査が順次行われており、現時点で約40か所のメンバー登録が終了している。
しかし実際にメンバーの募集を始めて見ると、当初想定していたようないわゆるデータセンターだけではなく、データ・コンソーシアムや政府間協定による国際データ組織、大学、政府機関、情報関連企業、出版社などがWDSに関心を持っており、WDSを古典的な意味でのデータセンターの組織として捉えることは、必ずしも現実的ではないことが明らかになった。そこで、通常のデータセンターなどのレギュラーメンバー、データ・コンソーシアムなどのデータ組織が加入するネットワークメンバーといった、4つのカテゴリーに分類して、それぞれの基準で審査を行うこととした。詳しくは上記のWebページにある。
データ・パブリケーション
これはデータセンターだけでなく、大学等でデータを公開している担当者からも良く聞くことであるが、研究論文において明らかにそのデータ組織が公開しているデータが使用されているのにも関わらず、データ源の引用はもとより、謝辞においてもデータ源に対する言及が無いケースがしばしば見られる。データ源が明示されていない場合、その論文の信頼性に対して疑念を持たれる可能性があるだけでなく、データ提供者の寄与が正当に評価される機会が失われてしまう。このような状況を改善する第一歩として、先ず学術誌の論文査読におけるデータ源の引用に対するチェックを、参考文献の引用に対して要請されているものと同等のレベルとすることが必要であろう。データに対するアイデンティファイアー(識別子)の付与など、確実に元データにアクセスできるシステムの構築については、学術誌出版社と連携した動きが既に始まっており、WDSとして早急に方向性を打ち出す必要がある。国内においては、1990年代に始まった国立大学の独立法人化の流れに伴い、教員の評価が発表論文件数などの研究面での業績が重視され、データベースの構築や公開に向けた努力が正当に評価されない傾向が生まれた。このような事態の改善のためにも、論文等におけるデータ源の可視化を推進する意義は大きく、日本学術会議においても各分野の科学委員会が連携した議論が必要である。
7.データ救出、データの長期保全
WDSの前身であるWDCが設置された動機の一つとして、第二次大戦中に取得されたデータの保全があったが、現在でもアナログデータや紙媒体上のデータのディジタル化が課題として残されているだけでなく、その時代における研究の主流から外れたことなどによって、データの所在が不明となったり、データセンターそのものが閉鎖されてしまう場合がある。また最近では、研究活動によってデータを取得して来た研究者の引退に伴い、データの保全と公開に問題が発生するケースが増えつつある。これらのデータの多くは二度と得られない貴重なものであり、将来別の観点からの研究に利用される可能性も残されている。更にそれらのデータを基にした研究論文が出版されている場合も多く、データの追跡性確保の観点からしても、長期保全・公開が懸念されるデータへの取り組みが求められる。
幅広いデータ利用への対応
最近では、例えば地球環境変動の研究に見られるように、研究分野を横断したデータ利用が広く行われている。このような従来の研究分野の枠組みを離れたデータ利用によって、新しい研究の創成が期待される一方、専門外のデータの不適切な取り扱いによって、誤った情報が社会に発信されてしまうような事態も発生している。また専門外の研究者にとって、自分の研究に適したデータが何であって、それがどこにあるのかを知ることは、それ程簡単ではない。そこでWDSでは、専門外の研究者を意識したメタデータの整備や、分野横断型のデータ検索システムの構築を主要な目標の一つとしている。また最近では、政策決定者によるデータ利用を意識したデータ活動も行われているが、例えば福島原発事故に関連した放射線量データの公開の過程において、色々な問題が発生していることからも分かるように、特に社会性が高いデータについては、一般市民によるデータ利用も意識したデータ利用態勢の構築が求められる。
WDS対応の国内委員会
WDS発足の時期と重なった第21期学術会議においては、第20期から継続していた地球惑星科学委員会国際対応分科会・WDC小委員会で、WDSに対する国際対応を行って来た。しかし広く科学全般のデータを対象とするWDSについては、地球惑星科学委員会で対応することは適当でなく、データ活動における情報科学系分野との連携強化がWDS憲章にも謳われていることから、22期学術会議においては、これまでICSU傘下の科学技術データ委員会 (Committee on Data for Science and Technology, CODATA)の国内対応を行っていた、情報学委員会国際サイエンスデータ分科会の下に、CODATA小委員会と並列する形でWDS小委員会を設置することとなった。委員の選出においては、WDC(7ヶ所)などのデータセンター責任者に加えて、データに関係が深い色々な分野の研究者を主体とし、災害科学や人文社会系科学分野にパイプを持つ研究者も委員として加わっている。WDS小委員会ではWDSメンバーの勧誘に加えて、人文社会系分野を含めた国内データセンター間の連携、データ活動のサポート態勢、研究観測データの保全と公開、論文等におけるデータ源引用の慣例化に向けた提言等に向けた活動を行う。またWDS-IPOのホスト機関である情報通信研究機構では、データ関連研究者に政策実務者を交えた「WDS国内推進会議」を定期的に開催し、上記のWDS小委員会と連携して、WDS-IPOの活動を実質的に支援する態勢に向けた議論を進める。
文責
渡邉 堯
日本学術会議情報学委員会・国際サイエンスデータ分科会WDS小委員会委員
情報通信研究機構、WDS-Japan
参考文献
学術の動向 {特集1}科学データの長期保全とグローバルな共有、2012年第6号
T. Watanabe, WDC Activities in Japan, 2008, Data Sci. J., Vol. 8 (2009), pp S102-107.
WDSの目標
-
○ 研究の発展に資するデータ・情報を提供
-
○ 科学データ・情報の国際的共有
-
○ データ利用環境の整備
-
○ 品質管理されたデータ・情報の長期的な提供
-
○ データ関連活動のサポート態勢の整備
-
○ 情報格差の解消