未来のいつか/hyoshiokの日記

hyoshiokの日々思うことをあれやこれや

外脳

データベースと言うのは、ざっくり言えば、データを組織化してコンピュータ処理可能な形式に変換したものと、それを処理するソフトウェアとの組だ。単にデータを格納するだけではだめで、それを検索可能にしておかないといけない。検索というと単に値を比較してそれと同じものをひっぱり出すというイメージだが、データの塊から相関関係を見つけたり今まで良く知られていなかった関連を発見したり、そのようなことも含めると検索と言うものが、情報処理というか若干知的な雰囲気が漂ってくる。多量なデータを集約する処理をするだけでも、今まで見えてこなかったことが見えてくることがあったりするので、データベースが果たすべき役割と言うのは極めて大きい。
データの処理が高度化し、データのサイズが巨大化すると今まで処理できなかったものが処理できるようになる。人間の脳では物理的に処理できなかったものがデータベースで処理できるようになってきている。データベースを人間の脳の代わりに使おうと言うのが「外脳」の概念である。人間の脳ほど知性はないので、取りあえず大量な記憶域として、しかも絶対忘れないストレージとして利用する。
20年前はAI(人工知能)の世界の話であったが、いまやインターネットが我々の外脳化している。インターネットそのものがデータベースであり、それを操るエンジンがGoogleをはじめとする検索エンジンである。
グーグル村上社長「2009年には“人類の知”がすべて検索可能に」http://internet.watch.impress.co.jp/cda/event/2006/01/31/10701.html と言っているが

村上氏は「Googleでは、将来的に世界の全データをオーガナイズするという目標を掲げているが、それには500万TBもの情報量が必要とされている。そのうちデータ化が完了しているのは約1%。これをどのように達成するのか議論を重ねている」と話す。

広大な「外脳」が誕生しつつある。
Googleがコンピュータに載せたデータと言うのが500万TBの1%ということだから5万TBすなわち50PB(ペタバイト)ということになる。ふむふむ。このPBという単位、大きいのか少ないのかよくわからない。数年前にインターネットのサイズはどのくらいなのかということをヨタ話したことがあったが、それを思い出した。id:hyoshiok:20040926
ちなみに500万TBというのは5EB(エクサバイト)となる。
この世界の情報量というのがどのくらいあるかという問題については http://www.lesk.com/mlesk/ksg97/ksg.htmlがその先駆的な研究なのだけど、2003年版とでもいうものがhttp://www.sims.berkeley.edu:8000/research/projects/how-much-info-2003/execsum.htm にある。Table 1.2を見ると2002年での上限の推定値が5,609,121TB(約5609PBすなわち5.6EBである)となっているので、Googleのデータも多分ここらへんをもとに推定しているのだろう。(How Much Information 世界の情報量)
まあ、情報はデジタル化され我々の外脳になっていくという世界観である。ストレージの要素技術だとか、RDBMSの技術だとかその重要性は当分ゆるぎないように思える。てなことを考えた冬の夜長である。

PS.IBM最初の磁気ディスクは、IBM 350 ディスクストレージ http://www-03.ibm.com/ibm/history/exhibits/storage/storage_350.html というのらしい。1956年9月4日発表。5百万文字を記録できたそうだから今で言うところ、約5MBってことかな。