未来のいつか/hyoshiokの日記

hyoshiokの日々思うことをあれやこれや

Open Dataについて

Open Dataというのがどのような定義になっているのか知らなかったので、教えてもらったところ、下記のスライドが分かりやすい。

その8ページ目に各種openの定義が載っている。「オープン」の定義 参照先:

  1. Open Definition (OKF系、データ用) http://opendefinition.org/od/
  2. Definition of Free Cultural Works(Wikimedia系、コンテンツ用) http://freedomdefined.org/
  3. Open Source Definition (OSI系、ソフトウェア用) http://opensource.org/osd
  4. Free Software Definition (FSF系、ソフトウェア用) https://www.gnu.org/philosophy/free-sw.html
  5. Debian Free Software Guidelines (debian系、ソフトウェア用) http://www.debian.org/social_contract#guidelines

オープンデータにとってのオープンと言うのはどのような定義なのか。オープンデータという言葉を共通の理解のないままに利用していると混乱や誤解を生じるので、なるべくならば広く合意された定義があるといい。

最初の定義がデータ用のもので、2番目のものがコンテンツ系、3番目がオープンソースの定義で、4つ目と5つ目がそれのベースになった従来からあるフリーソフトウェアの定義などである。

オープンソースという言葉に関しては、OSI (Open Source Initiative) が定義したものがあり、広く合意されているので、混乱は生じていない。その定義を知らない人が勝手にオープンソースという言葉を間違って利用することはなくはないが、(どんな言葉にもそのような誤用はある)、共通の定義があるので、誤解が伝搬すると言うことはない。

一方で、オープンデータという言葉は、誰かが厳密に定義したわけでもなく、それの共通認識が広く合意されたものではないようだ。

オープンソースのアナロジーにたってみると、オープンデータというのは、誰でも自由に利用でき、変更(加工)でき、再配布できるもので、利用に制限はかけられていないということになる。単にデータを公開しているだけではだめで、それを変更したり、再配布できるべきだと考える。

政府が持つ各種のデータに関しては、国民の共有財産なので誰でも自由に利用できるべきだ、というのはわかりやすい。各種統計データなどは自由に利用出来るべきだ。そのデータを利用して論文を書いたり、本を書いて売ったり、何らかのビジネスをしたりするのも自由だ。

利用においては制限がない方がいい。

一方で民間企業が収集したデータについてはどうだろうか。それらのデータは著作権やその他の知的財産権で守られると言うのが原則だとして、権利者が何らかの許諾をしてオープンデータと言う場合の原理原則はなにになるのだろうか。

単にデータを公開したのだけど利用に制限を設けているものをオープンデータと言うのは混乱すると思う。それは上記の各種自由がないからだ。そのようなデータ公開は、いわば制限付きデータ公開だ。ソースコードを公開するだけではオープンソースと呼ばないのと同じ扱いである。

ただ、残念ながら、オープンデータに関しては、そのようなコンセンサスはまだ出来上がっていないようである。データを公開する組織なりが勝手に「おれおれオープンデータ」の定義をし利用するのは、様々なデメリットがあるので、なるべく早いうちに「オープンデータ」の定義を合意した方がいいと思う。

東京メトロがオープンデータでコンテストをするというニュースがあったけど、 *1 その利用には各種制限がかかっているようなので、上記の意味での「オープンデータ」というのには躊躇がある。東京メトロのデータを利用したコンテストであれば、混乱は生じない。 *2

オープンデータの動向についてちょっと調べてみたいと思った。