« 2006年06月 | メイン | 2006年10月 »

2006年09月30日

Webの望ましい進化(後編)

長いのに読んでいただきどうもありがとうございます。
それから、ringoさん、トラックバックどうもありがとう。

今回で一応完結です。
でも、いつかこの続きを書いてみたいと思います。


3.テキストコンテンツの復活

私はテキストコンテンツの衰退は、人間の賢さの停滞でもあると考えている。
人間は、ビデオや漫画や音楽などに比べて、テキストコンテンツにより多く頭を使うだろう。
よい文章を読み書きすることで人はより賢くなっていくのである。

脳トレなんてくだらないことをやっていないで、他人に読んでもらえるようなよい文章を書く練習をすればよいだろう。
よい文章を書くためにはそれなりによく考えたり他人の書いたものを参考にしなければならないからトレーニングとしては最適である。

だからテキストコンテンツが衰退して、その消費がほとんど時間の浪費にしかならないような状況は非常にまずい。
何とかしてテキストコンテンツの復活を目指さなければならない。

テキストコンテンツを復活させるアプローチは少なくとも2つ考えられる。
一つは、バイナリーコンテンツと組み合わせることである。
つまり、コンテンツのマルチモーダル化である。
図表のない論文がわかりにくいように、また登場人物の台詞だけで背景を説明するドラマがつまらないように、言葉は重要であるがそれだけではインパクトに欠けるのである。

だから、テキストコンテンツを他のコンテンツと関連付けることによってリッチにしていくことはとても重要である。
そして、他のコンテンツの意味に関するアノテーションから、テキストの意味も推論可能になり、その結果、意味を考慮してテキストコンテンツを評価できればよいのである。
そのためには、それら関連付けられたバイナリーコンテンツに、引用しているテキストコンテンツとは独立にアノテーションが付与できる必要がある。

もう一つのアプローチは、よりストレートであり、それゆえに実現が困難なものである。
それはテキストの意味を厳密に分析して機械的に処理可能にするということである。

そのための手段に言語的アノテーションがある。
言語的アノテーションは、文書や文の構造と、語と語の関係(代名詞の照応などの関係を含む)や語と語義(word sense)の関係を明確にして、文書の(機械による)正確な処理を促進するものである。

以下の図に示すように、文の構造をグラフ的に表示して編集できるエディタによって、言語的アノテーションは比較的容易に作成できる。
これは、ユーザーがWebページ内の任意のテキスト領域を選択し、機械的な解析を行った結果を修正することによって行われる。
たとえば、グラフのノードに当たる語の連結先(係り先、被修飾語)をドラッグ&ドロップで変更することで文構造を修正することができる。

linguistic_annot.jpg

図5:Webページ内の任意のテキストへの言語構造のアノテーションエディタ

また、以下の図に示すように、語義を定義した辞書を用いて任意の語の語義を検索し、複数の候補が見つかった場合は、ユーザーが適切なものを選択することによって行われる。

sense_annot.jpg

図6:日本語の場合の言語構造および語義のアノテーションエディタ

言語的アノテーションには高度な判断が必要な場合もあるが、基本的には対象となるテキストの言語を母国語とする人間ならば訓練次第で誰でも可能なものである。

当然、言語は変化していくものだから、辞書もその言葉が使われた時代に依存するものである。
言語的アノテーションの過程において、辞書の内容が適切でないと判断された場合は、語義を追加して定義を与え、その新しい語義をアノテーションとして付与することになる。

Wiktionaryのように、新しく定義された語義とそれが付与された例文を共有し、複数の人によって語義の定義が修正されていく仕組みが必要である。

言語的アノテーションはFolksonomyに比べるとはるかに複雑な作業である。
基本的に特別な言語的知識を必要としないが、多少の慣れと比較的高いモチベーションが必要である。
そもそもわれわれは普段、文の言語構造や語義を意識してテキストを読み書きしているわけではないので、突然それを意識しろと言われてもなかなかできるものではないだろう。
しかし、ツールによって潜在的な問題を顕在化して見せることで、人間にそれを解決することを促そう、ということである。

言語的アノテーションが付与されたテキストコンテンツはそうでないものに比べてはるかに機械的な処理が容易である。
そのためコンテンツの意味を考慮したさまざまなアプリケーションが実現できる。

私の考える「テキストコンテンツ復活」のシナリオはこうである。

まず、言語的アノテーションのためのツールを公開し、誰でもやろうと思ったらいつでもできる状態にする。
それと同時に、言語的アノテーションに基づくさまざまなサービスを公開する。
それはたとえば、文書の意味検索、分類、要約、翻訳、パラフレーズ(専門用語をわかりやすく言い換える、など)、(読み間違いのない)音声化、リコメンデーション(ユーザーの興味に合わせた推薦)などである。
十分にそのメリットがわかる状態にして、Wikipediaのように、地道に言語的アノテーションを増やしていく。

これは、Folksonomyあるいはソーシャルブックマークのように安価なものではないから、貢献者はなかなか増えていかないだろうと思うが、より理想的なWeb環境を希求する人たちはきっといるだろうから、そういう人たちが気軽に入ってこれる入り口を作るべきだろう。

アルファブロガーと呼ばれる人たちが、ブログをまともな読み物と多くの人に認知してもらうことに貢献したように、アルファアノテータと(後になって)呼ばれるような人たちは、テキストコンテンツに主観的評価や感想とは異なる、言語的分析結果を加えて、そのコンテンツの価値の向上に貢献してくれるだろう。

無論、すべてのテキストコンテンツに必ず言語的アノテーションが付随していなければならないわけではないが、言語的アノテーションのないテキストコンテンツは、その正確な意味を考慮して検索や分類をするのが困難である。
その結果、時間にある程度余裕のある人でない限り、そのテキストコンテンツをまじめに読んでくれる人はほとんどいなくなるだろう。

ここで誤解すべきでない点は、テキストコンテンツに言語的アノテーションを関連付けて共有することと、タグやコメントを付けてソーシャルブックマークへ登録することは単に情報の粒度の違い以上の本質的な違いがあるということである。
タグやコメントのように言語的アノテーションに個人の恣意性がまったく含まれないわけではないが、それは可能な限り客観性を持ってコンテンツの内部構造の多義性を解消する役割を持っている。
コンテンツの意味を考えるためには、コンテンツの部分や内部構造に触れないわけにはいかない。

言語的アノテーションを用いることによって、ある人がある状況で読むべきテキストコンテンツを選び出すための一般的な手段が提供されるだろう。
それによってテキストコンテンツは復活するのである。


4.人間が賢くなるためにWebがなすべきこと

さて、Webの望ましい進化とはどのようなものか考えてみよう。
私は、まず、バイナリーコンテンツの任意の要素に関するアノテーションとそれに基づく要素単位の検索(たとえば、映像のシーン検索)があたりまえのものとして組み込まれることが挙げられると思う。
次に、ライフログのオーサリング技術が発展し、SNSやGoogle Earth(の発展形)などと簡便なやり方で結び付けられることが考えられる。

そして、最も重要なものとして、テキストコンテンツへの言語的アノテーションの仕組みとその応用が、現在のFolksonomyやWikipediaを上回るアテンション(と貢献者のモチベーション)を獲得しているということがあると思う。
セマンティックWebの貢献者が現在どれだけいるのかわからないが、彼らがコンテンツの意味の問題を真剣に考えているならば、喜んで言語的アノテーションに貢献してくれることを期待している。

もちろん、言語的アノテーションを誰にでも扱えるものにするためには、これから開発しなければならない技術がまだいろいろある。
しかし、原理的に不可能だと思われるものは何もない。
つまり、がんばればいつかは必ずできることなのである(アテンションが集まるかどうかは偶然の要素も強いが)。

ただ、Webを、さらには人間社会をよりよいものに変えて行きたいと思うような人々は今後増えていくのだろうか。
Webの参加者はその進化に積極的に貢献してくれるのだろうか。
それについてはまったくわからないし、私はそれをただ期待することしかできない。

しかし、Web誕生に続き、もう一度奇跡が起こって、Webがまっとうな進化を遂げてくれるならば、人間はようやく知能増幅器と呼べるような道具を手に入れることができるだろう。

それによって、人間は今よりもっと賢くなれるだろう。
人が賢くなれば、その人の社会との関わり方も変わってくる。
積極的に政治に参加できるようになるだろうし、巧妙な犯罪や洗脳から自分や家族を守っていけるようになるだろう。
教育問題も少子化もニートも、人々がみな一様に賢くなっていけば、大部分は解決されるだろうと私は(きわめて楽観的に)考えている。

現在では、強者と弱者の違いは、たいていの場合、賢者と愚者の違いである。
もちろん、身体的な要因もあるだろうが、身体的なギャップは賢さによってある程度補えると思う(これは無論、虚弱なのはその人が愚かだからだ、などと言っているのではない)。

賢さの差が明確になったとき、賢い者は次の2つのどちらかの行動をとるだろう。
他の人との賢さの差を広げようとするか、狭めようとするか、である。

前者は、自分たち以外の人の思考を停滞させようとする、たとえば洗脳である。
これはマスメディアやそれに類するものに多い。
巧妙な詐欺もその一種である(フィッシング詐欺などはその典型である)。

後者は、人の思考を活性化させ、もっと頭を使うように働きかける、つまり教育である。
教育とは、考えるという経験を促進させるものである。
直接教わった知識よりも自分で考える経験の方がはるかに重要である。

社会全体をよくするためのツールは、賢さの差を拡大させるようなものにはならないだろう。
また、賢くなろうとする万人が利用可能なものであるべきだろう。
つまり、特定の集団が独占するようなものではなく、公共物であるべきである。

Webはまだまだ普及率が十分ではないと思う。
たとえば、TCP/IPの発明者(つまりインターネットの生みの親)の一人ヴィントン・サーフはこう言っている。

「地球上にはネットを使っていない人々が50億人もいるのです。この人たちが加わることで、予想もできない大きな変化が起きますよ。ネットのユーザーはまだ世界で10億人、世界人口の16%です。それだけでも、とてつもない変化を体験しました。これからさらに利用者が増えるにつれて、情報量は爆発的に増え、ネットそのものが姿を変えていくのです。」(日経ビジネス 第1359号(2006.9.25発行)より)

しかし、Webは参加者が誰でも自由に利用できる公共物になりつつあると思う。
もちろん、Web上でビジネスをするのはよいし、そうしないと運用にかかるコストをまかなうことはできない。
しかし、Webの参加者全員が特定のビジネスと無関係に、自由に活動を行うことができる。
そのような場が国境を越えて存在するということは、人類にとってとてつもなく大きなメリットである。

だから、人間がもっと賢くなるためにWebが有効なツールとなるべきである。
YouTubeのようなサービスはとても魅力的で、コンテンツも豊富で、面白くてしょうがないのであるが、それを見て自分が賢くなったかというと全然そんなことはないのである。
それは、人気のあるブログを読んでいるときもだいたい同じである(人気があり、かつそれを読むことで読者が賢くなれるコンテンツもまれに存在するが)。

これ以上貴重な時間を浪費するくらいならWebを見るのをやめる(私は昔ニュースグループを日常的に読んでいたときにそう思って、いっさい読むのをやめた)なんていう人が続出する前に、Webが私の考えているように進化するとよいのだが、こればかりはどうなるかまったく予測がつかない(無論、そのための努力を惜しむつもりはない)。

Webのテレビ化なんてことは何としても回避しなければならない。
特定の個人や組織が必要以上に支配力を持つような状態は非常にまずいと思う(要するに、MicrosoftやGoogleのこと)。
自分をGoogle信者などと言ってGoogleを礼賛する人は多いようだが、それら組織が、Webを人が賢くなるためのツールにしようとしているのかどうか、時間をかけて慎重に吟味していただきたいのである。

投稿者 nagao : 00:02 | コメント (225) | トラックバック

2006年09月28日

Webの望ましい進化(中編)

2.バイナリーコンテンツとライフログ

バイナリーコンテンツとは、テキストデータを含まず、本来アナログ情報であるものをコンピュータで扱えるように無理矢理デジタル化したものである。
そのおかげで、Web上のコンテンツはさらに多様になり、格段に面白いものになっていった。

バイナリーコンテンツの処理は当然ながらテキストコンテンツの処理とはまったく異なる。
バイナリーコンテンツそのものから日常的な検索の対象となる情報を抽出するのは非常に困難だからだ。
画像の色やテクスチャで類似のものを検索するとか、音声波形の類似するものを検索するとか、コンテンツそのものを自動解析して検索の手がかりにするという研究は山のように存在するが、特殊な状況を除いて、日常的にはそんな検索はほとんどやらないだろう。

やはり、人間にとって日常的な検索は、適当に思いついたあるいはどこかで見聞きした言葉による検索である。

「検索というのは自分のやりたいこと・やっていることを機械に伝達する作業だ」と言った人がいるらしいが、それはやはり人間にとって都合のよいメディア(つまり言語)を用いるのが自然だろう。
これはおそらく今後もずっとそうだろう。

言葉を使わない検索もある、つまり、明示的な検索要求のない検索であり、たとえば、リコメンデーション(推薦)である。
これは、昔プッシュテクノロジーという名前で呼ばれ盛んに研究された。
プッシュテクノロジー(PointCastというシステムがその代表例)は、ユーザーの嗜好や(動的に変化する)興味をうまく認識・反映することができなかったためすたれてしまった(もっとも、RSS Feedやソーシャルブックマークの機能によってリバイバルの兆しはあるが)。
あ・うんの呼吸で適切なコンテンツを提示するシステムは実現されていないし、今後もできないだろう。


さて、言葉に基づくバイナリーコンテンツの検索は、コンテンツへのアノテーションあるいはメタデータを用いた検索である。
「あなたはグーグルのパシリ?(Are you Google's gopher?)」というBBCの記事で紹介されているGoogle Image Labelerのように、画像検索のためのメタデータ(検索用タグ)を大量に集めるための努力はさまざまな形で行われている(それにしてもGoogleは実に頭がいい)。

そこでFolksonomyなどという造語も生まれた(ちなみに、folk(民衆)とtaxonomy(語の階層に基づく分類)の合成語である)。
Folksonomyなんてもっともらしい用語にすると何か新しいことを言っているようだが、全然そんなことはない。
情報の整理をするためにコンテンツに検索タグをつける、などということはごく自然なことだし、ネットワークでタグを共有することも、Webの文化においては当然のことである。
それが、なぜ最近になって注目されるようになったのか。
それは、機械的なインデキシングによる検索への不満が顕在化してきたこと、機能を絞りこみ人間の手間を最小限にしたこと、Webブラウザで簡単に作業ができ、プラグイン等のインストールを不要にしたこと、Webユーザーの参加者意識が向上してきた(つまり、面倒でも人の役に立つことを積極的に引き受ける)こと、などが要因だと思う。

たとえば、2000年頃に公開されたThirdVoiceというシステムは、任意のWebページにコメントを付けたり(そのコメントに返信することもできた)、評価点やタグに類するいくつかのキーワードを付与することができた。
これがなぜすたれたかというと特別なプラグインをインストールする手間があったのと、多くの人が特定のサイトに悪口を書き始め、そのサイトのオーナーからクレームが付いたためである。
よくサイトにコメント欄をつけてユーザーからのフィードバックが得られるようにすることがあるが、これは都合が悪くなったらコメント欄を閉鎖することができるため、サイトオーナーが制御できる点がよいのだろう。
ThirdVoiceは(悪口を含む)コメントを任意のページに付けることを許し、ユーザーがそのページを閲覧するときコメントも連動して表示するという余計なことをしたため、すたれてしまったのである(まあ原因はそれだけではないかも知れないが)。
単純にキーワードだけを付ける仕組みにして、オンデマンドの検索サービスを公開していれば、今日のソーシャルブックマークの偉大な先駆者になっていただろう。


ところで、最近のYouTubeの勢いを見てもわかるように映像コンテンツへの関心は驚くほど高くなっている。
そしてその勢いはさらに増していくだろう。
映像ほど人間の直感に訴えかけるものはないからだ。

映像コンテンツのオーサリングは今よりずっと簡単なものになるだろう。
それによって映像コンテンツの氾濫が現在のテキストコンテンツと同程度になることは容易に想像がつく。

では、同じように映像コンテンツも衰退するのだろうか。
私はそうならないと思う。
映像コンテンツ(に限らずバイナリーコンテンツ一般)は、コンテンツ制作時あるいは制作後の(第三者を含む)人間の何らかの努力によってしか、便利なものになり得ないからである。
そのことに気づいた人たちが継続的な努力を行っていけば、どれほどの量の映像コンテンツがWeb上にあってもその価値が下がっていくことはないだろう。
映像コンテンツを好きな人は多いし、その価値を高めるための努力をいとわない人も多いだろう。
それは、映像コンテンツほど人を楽しませてくれるものはそうないからである。

ちなみに、コンテンツの価値が下がらないということとゴミのようなコンテンツが増えていかないということは同じではない。
もちろんゴミは増えていくに決まっている。
しかし、ゴミとそうでないものを区別する一般的な方法が発明されるだろう。
その発明によって、コンテンツの(全般的な)価値がある程度のところで保持されるのである。

ここで、映像コンテンツの価値を高めるための私たちの活動を紹介しよう。
映像コンテンツの価値を高める最も有効な方法は、その映像に関してできるだけ多くの人がうんちくや感想などを語り、その語られた内容を映像(の特定のシーン)と関連付けて蓄積していくことである(実は、それだけでは不十分なのだが)。

私たちの研究室で開発されたビデオブログシステムSynvieは、ビデオの任意のシーンに関してブログで思う存分語り合うためのシステムである。
以下の図に示すように、Synvieを使ってビデオを見ながらちょっとした操作をすれば、ビデオ内の任意のシーンを引用したブログが書ける。

video_annotation.jpg

図1:映像シーンに対するアノテーションおよび視聴インタフェース。ユーザーはビデオの任意の時間に対してコメントを付与可能である。また、閲覧中の映像に同期したアノテーションを表示可能である (Courtesy by Daisuke Yamamoto)

videoblog_edit.jpg

図2:ビデオブログ編集インタフェース。シーン伸縮ボタンを押して対象シーンを時間的に前後に伸縮させることによって、正確に対象シーンを提示・選択可能であり、対応するコメントの編集も可能である (Courtesy by Daisuke Yamamoto)

引用によって他のコンテンツについて語ることは、単純にそのコンテンツについて語るよりも、ずっと人に伝わりやすく、また機械によって内容に関する情報を処理するためにも有用である。
指示代名詞の指し先があいまいな文章よりそうでない文章のほうがわかりやすいのと同様である。

ブログ(エントリーのパラグラフ)とビデオ(シーン)は、引用・被引用の双方向リンクで自動的に結ばれる(被引用のリンクをシーントラックバックと呼んでいる)。
ブログのテキストを解析し、さらに人間の手を少し加えれば、ビデオに関する意味的な情報が抽出できる。
人気のあるビデオコンテンツは、きっと多くの人が引用して語ると思われるので、単純にリンクの数をカウントするだけでもそれなりに見るべきビデオシーンの選択に役立つだろう(もちろん、引用されている部分だけを見れば十分という保証はないが)。
また、ビデオを見ながらブログ等のテキストを読んでいれば、その理解がより深まるだろう。

キーワード検索やランキングに関しては、引用のリンクとブログテキストだけでは不十分なので、検索タグの抽出などの工夫が必要であるが、これについてもよさそうなやり方をいろいろ試しているところである。


ビデオブログの発展形(厳密にはビデオブログと他のコンテンツの複合体)にライフログというものがある。
ライフログは、もともと(環境設置タイプや携帯・装着タイプの)ユビキタスなカメラが不特定の人物の映像を継続的に撮影し続ける状況で、特定の個人に関連する映像をかき集めてくると、その人の人生の記録を構成することができる、というコンセプトであるが、監視されているという印象が強く、どうも気持ちがよくない。
しかし、人の人生を丸ごと記録にとって再利用可能にするというのはとてつもなく面白い試みであろう(同様のものにMicrosoftの研究者によるMyLifeBitsという研究もある)。

ライフログはその人物がこの世を去ってから特に大きな価値を持つことになると思う。
生前はプライバシーの問題で公開できる部分はかなり限定されると思うが、死後はその遺族の許諾のもとに(場合によっては編集を行ってから)より多くの部分が公開されることになるだろう。

あるビデオブログが、もし自分で撮影した自分の体験のビデオを引用して語っているものだとすると、それは当然ライフログの一部とみなすことができる。
体験に何らかの意味を与えることができるのはその体験者だけだから(第三者が分析して何らかの解釈を与えることは可能だが)、その人の書いたブログは映像の正確な意味を記述するテキストコンテンツということになるだろう。

私は、自分の子孫に自分のことを長く記憶してもらうためにライフログを残す人がこれから多く現れると思っている。
その結果、Web上にライフログが氾濫し、やはり相対的に価値が下がっていくことも考えられるが、私はライフログの価値はある水準を維持できると思っている。
それは、やはり制作にはそれなりのコストがかかるし、人生の記録そのものなのだから嘘はつけないだろうし(ことさらにかっこつけようとして、自分の体験を捏造しようとする人はいるかも知れないが、映像などの文脈情報も含めて捏造するのはかなり骨が折れる作業だろうから、あまりにもコストパフォーマンスが悪くてあきらめるのではないだろうか)、映像等によって客観的事実が提示されるので資料価値もそれなりにあるだろうからである。

ライフログの評価はその人物に対する評価とその人の体験そのものの評価によって構成されると思う。
ライフログによって、その人の知られざる側面を知ることによって、その人を再評価することもあるだろう。
基本的には、その人の知名度や人気がその人のライフログの評価に影響を与えることは間違いがないと思う。
「この人のことをもっと知りたい」「この人の体験を追体験したい」と思う人がいる限りライフログの価値は失われることはない。

ただし、これは特定の人(特に有名人)のライフログのみが価値が高く、それ以外は低いということを言っているのではない。
ライフログは体験の集積だから、参考になる体験もきっと含まれているだろう。
そういう体験を適切に検索する仕組みがあれば、たとえ無名人のライフログであってもきっと有益なものになるだろう。

ライフログの主要な部分はやはり映像コンテンツだろうが、ライフログを構成するコンテンツは他にもいろいろある。
私が考える映像以外の主要なライフログの構成要素は、実世界の位置と時間である。
位置はGPSやGoogle Mapsみたいな仕組みがあれば容易に関連付けられる。
時間の関連付けも自明だろう。
ライフログは必ず時間軸上にマップされるものなのだから。

ライフログのオーサリングに関しては、画期的なものが発明されるだろう。
実は、私たちも一つ考えている。
それは、位置情報を含む文脈情報と前後左右の映像を暗黙的に記録する個人用の乗り物である。
もちろん、乗り物でなければならないことはないし、乗り物ではダメな場合もあるだろう。
しかし、それでも個人用の情報化された乗り物の持つ可能性は非常に大きいと思う。

以下の図に示すように、乗り物に搭載された複数のカメラとマイクは暗黙的に搭乗者の周辺の記録をとっていく。

at7_cameras.jpg

図3:個人用知的移動体ATとそれに搭載された複数のカメラ

また、搭乗者は手元のジョイスティックを使って前方のカメラを操作して、その時点で特に注目している対象を撮影する。
当然、時間と位置も記録している。

また、以下の図のようなインタフェースを用いて、それらの情報を統合し、さらに体験の内容をテキストで記述することによって、(私たちの考える)ライフログが制作される。

lifelog_edit.jpg

図4:ライフログ編集インタフェース。メインカメラの映像と地図とテキストを簡単な操作で結び付けることができる (Courtesy by Kazutoshi Kozakai)

ライフログの共有は、もし制作者(つまり体験者)が生きている間にやる場合はプライバシーの問題を考慮して、SNSのように親しい間柄での公開が中心となるだろう。

1994年頃にMITメディアラボの研究者がWWW (Wearable Wireless Webcam)という研究をやっていた。
これは装着型カメラで自分の見ているものを撮影し、無線で送信してリアルタイムにWebで公開するというものである。
なんでそんなことをやっているのかと聞いたら、こんなことを言われた。

「今はいたるところにカメラがあって知らぬ間に自分の映像が撮られている。それは監視であって撮られる側の都合など考えちゃいない。ならば、自分も撮って公開して一方的な監視に対抗してやるのだ。」

そのときはこの理屈がよくわからなかったのだが、今では少しわかる。
人々のプライバシーをある程度犠牲にして個人および組織を守るという考えはよいのだが、プライバシーを犠牲にする当人である個人が自分に関わる情報をコントロールできないのでは非常に困ったことになる。
悪用されるかも知れないからだ。
だから、自分の生活に関わる情報は自分で作成して自分で公開する、それによって発生する問題にも自分で責任を持って対処する、という考え方をしようということなのだろう。
私たちの考えるライフログは、同時代の人たちというより、後世の人たちに有効に活用してもらいたいと思って制作するのがよいと思っているが、もちろん、自分を守るため、そして自分の生活を豊かにするために利用できるようにすることも重要だろう。

ライフログは、わざとらしいドラマやくだらないバラエティなどと違って、そのリアルさとまじめさによって多くの人々の心を打つだろう。
フィクションより実話に基づいたドラマの方が見る側の関心が一般に高いのと同様に、人のリアルな生き様には興味を引かれるものが少なくないだろう。

テレビ用の映像コンテンツが今後どんどんWebに置かれていく(YouTubeなどに無断で投稿されるようなイリーガルなものでなく、著作権者が許可したもの)と思われるが、それが徐々にチープで面白くないものになっていくのに反して、個人がありのままの人生を映像等で綴ったものの方が共感できる面白いものになっていくだろう。
そこにライフログの無限の可能性を感じるのである。
最も重要で面白いコンテンツ(ソース)はやはり人間(の生き様)そのものだということかも知れない。

投稿者 nagao : 00:20 | コメント (176) | トラックバック

2006年09月26日

Webの望ましい進化(前編)

大変ご無沙汰しています。
最近、InterCommunicationという雑誌に記事を書きました(11月発売号に掲載されるそうです)。
この雑誌が、このたびWebの未来に関する特集を組むのだそうです。

担当者は最初Web X.0という特集タイトルを考えていたそうなのですが、Web 2.0が明確な意味を持たないバズワードだと言われ始めてきたこともあり(僕も一時期はそれが重要なキーワードだと錯覚していましたが)、このタイトルは変えた方がよいと思います、と担当の人に言いました。

このブログでは3回に分けてこの記事の草稿を掲載します。
何かコメントをいただけましたら、できるだけ反映させたいと思います(原稿の締め切りは10月15日です)。

かなり長いですが、読んでいただけると幸いです。
どうぞよろしくお願いいたします。

ちなみに、内容の構成は以下の通りです。

Webの望ましい進化

前編(今回分)
1.テキストコンテンツの衰退

中編(近日公開)
2.バイナリーコンテンツとライフログ

後編(近日公開)
3.テキストコンテンツの復活
4.人間が賢くなるためにWebがなすべきこと


Web上のものに限らず、人間の生み出すもので最も重要なものはコンテンツであると私は考えている。
だから、私にとってのWebの望ましい進化とは、コンテンツをより多様に、また意味的により高度にする仕組みを備えることである。
「より多様に」というのはこれまでのコンテンツのあり方に縛られない新しい発想でコンテンツを制作できるようにしようということあり、「意味的により高度に」というのはコンテンツの意味を表現する仕組みを取り入れて、コンテンツを人間にも機械にもより正確に理解(あるいは処理)できるようにしようということである。
これからそれらについて具体的に述べていこうと思う。
その前に現状の問題点について考察してみよう。


1.テキストコンテンツの衰退

Webがもたらした、人類へのマイナス面の最大のものは、テキストコンテンツの(相対的な)価値の低下だと思う。
テキストコンテンツとは言うまでもなく、人間の執筆する文章をメインとした(補助としての画像等を含んでも構わない)コンテンツである。
その典型例は、マスメディアの提供する(主にニュースに関する)記事、オンラインジャーナルなどの学術論文、企業などの提供する製品・サービス・イベント情報、そして個人が執筆・公開するブログである。
これらはあたりまえに存在し、私たちは普段それらをかなりの時間と労力をかけて消費している。
これらはどれもそれなりに信用でき、それなりに信用できない。

よく読んで考えて、時に他のコンテンツと照らし合わせながら信用できるかどうか判断する。
それはもちろん正しい姿勢であるし重要なことではあるが、かなり面倒くさい。
読んだものはすべて信じる、ということならば、その人は単に騙されて振り回されるだけだし、すべて信じない、ということなら読むために要した時間がもったいなすぎる。
結局、現状では、判断するのが面倒なら読むな、という結論になるだろう。

いや、テキストコンテンツが信用できるかどうかは、文章の表現や他者による評価や評判でだいたいわかるから、判断にそんなに手間はかからない、という人もいるだろう。
しかし本当にそうだろうか。
文章が一見よく書けているとしても、そのコンテンツを高く評価する推薦者がいるとしても、自分でよく読んでみて違和感や矛盾を感じるものは鵜呑みにはできないし、するべきではない。
その違和感や矛盾は錯覚や誤解かも知れないから、やはり何らかの根拠が必要だろう。
それは、もう少し他の文献を当たったり、人と議論をしたりして、それなりに努力しなければ手に入れることはできない。

コンテンツの消費を単なる娯楽と割り切るならともかく、少しでも自分を賢くしたいと思うのならば、テキストコンテンツとのつき合い方はもはや簡単なものではなくなった。
その結果、自分の払うべきコストとのバランスにおいて、テキストコンテンツの価値は低下したのである。

参照される頻度が高く、内容的に質の高いものがWebに存在しないわけではない。
しかし、あまりにも玉石混淆で、読むべきものとそうでないものを事前に区別する確実な方法が存在しない。
つまり、読むべきものかどうかは、すべて読んでから判断しろ、ということになってしまう。
それも仕方がないと考えるならば、せめて候補を人間の許容できる量に限定して欲しい。
適切なものを選び出すことはおろか、おおよその範囲を限定することすら困難になってしまったのは、まさにWebのせいである。

これには異論を唱える人も当然いるだろう。
自分のお気に入りのサイトがあり、それを定期的に見ている、そのサイトの記事はどれも良質で読み応えがある、だからテキストコンテンツの価値が低いなどとんでもない、という具合に。
また、検索エンジンによって読むべきものがおおまかに限定されているのだから、必要なものを選び出すのはむずかしくない、と言う人もいるだろう。
しかし、テキストコンテンツ全般で見ると、やはり価値は下がっていると思うし、検索エンジンが読むべきものとそうでないものを区別しているとも思えない。

コンテンツ全体を見渡して、あなたが今必要としているコンテンツはこれでしょう、と薦めてくれる仕組みは現在のWebには存在しない。
もちろん、検索エンジンを使って適当に選んで、それを読んで満足できるのならそれでよい場合もあるが、とりあえず選んで読んだものより内容が正確で自分の要求に合ったものがあるのかないのか、あるとしたらそれはいったいどうやって探せば見つかるのか、などということは、おそらく人間が許容できる時間内に答えが見つかるものではなくなってしまった。
それは、テキストコンテンツがあまりに無責任に無秩序に大量に生産されるようなシステムが実現されてしまったからである。

では、Web以前ではどうだったか。
テキストコンテンツを広く流通させるほとんど唯一の方法は、紙媒体による出版だった。
これは結構、手間もコストもかかる。
だから、必然的に、質の高いもの(多くの人の関心を引きそうなことで、知的好奇心を満たしてくれそうなもの)を出版しようという動機につながったと思う。
だから、私は本屋に行くのが好きだったし、整然と並べられている本のタイトルを読んでいるだけで、わくわくさせられたものである。

また、日本には真のエリートが育ちにくいためかThe Washington PostやWall Street Journalのようなクオリティ・ペーパーと呼べるような新聞がない(ちなみに、真のエリートとはありていに言えば「ノーブレス・オブリージュ」の精神を実践している人のことである)。
今の日本で発行される媒体で、日常的に目を通して、それほど時間をかけずに理解して信頼できるリソースはほとんどない。
ならば、日本のものじゃなくても構わないのだから海外のクオリティ・ペーパーを読んでいればよい、と思うかも知れないが、記事の対象となる領域が偏っているのでそれだけ読めば十分というものではない。
それに、そもそもの成り立ちから見てもクオリティ・ペーパーは広く浅い内容を扱うものではない。

最近では、出版物もクオリティの低下が著しいようだ(それでもWebのテキストコンテンツよりはましだと思うので、私は一般に書籍の一部しか引用していない)。
「戦争論」(私の世代では、「東大一直線」)で有名な小林よしのりの「中流絶滅」という漫画(小学館 2006)にはこんなことが書かれている。

「いかにも平易なタイトルをつけ、テレビの奥様向けサスペンス・ドラマみたいにていねいな副題もつけ、人気作家の推薦文を帯でアピールして、大衆の教養コンプレックスを癒す装いで最近の新書はまんまと売れている。」

私もまったく同感である。
最近の新書は確かに読みやすいと思うが、それを読んで賢くなったという気があまりしない。

人間が賢くなるために必要なことは質の高い文章を読むことだから、質の低いWebのテキストコンテンツを読み続けることは、貴重な時間の浪費につながってしまう。

Webには質を測るわかりやすい指標の一つである、ある種の権威付けが存在しない(ただし、学問の世界における権威付けはそれなりに機能している)。
もはやWebではマスメディアの優位性はほとんどない。
マスメディアが平気でデタラメを撒き散らしていることに、多くの人が気づいてしまったからだ。
一昔前にはそれなりに権威があった(と思われる)朝日新聞なんか、もはやとても信用する気が起こらない(有名な「1発だけなら誤射かもしれない」発言を参照のこと)。

確かに、たとえばCNETの記事やWikipediaきっこのブログなど、読み応えのあるテキストコンテンツもいろいろあるだろうが、それを読んで何かを学ぶというより、それが自分の中での議論を呼び起こすきっかけになるということが多い(つまり、その内容を信じるかどうかの判断を常に必要とする)。
それでも考えるきっかけになることはよいことだが、やはり先人の知恵が凝縮されたような本を読んで頭をフル回転させた方が賢くなるという点では効率がよい。

Web上の(というか、もはやすべての)テキストコンテンツをシステマティックに吟味し、現在あるいは将来の自分にとって重要なものを探してランキングしてくれる仕組みが必要だ。
それを実現するには、コンテンツに人間の力で意味情報を付け加えていくやり方(後で詳しく述べる)が最良の解決策だと思う。

うまくない一つの方法は、何らかの確率・統計的な手法でテキストを処理し、無理矢理に重要度や関連度を計算してしまうことである。
コンテンツの意味は確率や統計では扱えない。
人間の生み出す情報は高度な文脈依存性を持っているからである。
コンテンツの外にあるもの(コンテンツ中に陽に含まれていないもの)をうまく組み合わせていかないとその意味を適切に扱うことはできない。
だから、今のWeb検索エンジンは、ユーザーの求めているものとそうでないものを区別することができないのである。

Googleはハイパーリンクの構造を使ってキーワード検索した結果をランキングする手法を実用化したが、もうそんなやり方ではどうにもならないほど玉石混淆のテキストコンテンツが氾濫してしまった。
ブログや掲示板がその要因の一つになっていることは間違いないだろう。

ソーシャルブックマークのように、人間が内容をよく読んで何らかの評価をすることで読むべきものをガイドする、というやり方がある。
これは結構有効に働きそうに見える。
しかし、やっぱりそれだけでは十分ではないし、多数決のようなやり方で個人に適したランキングができるとはとても思えない。
他人の意見に流されやすい人はそれでもいいが、Web上のコンテンツが鵜呑みにできなくなったように、大多数の意見などもそのまま受け入れることができないのである。
人工知能という分野を切り拓いた功労者の一人であるマーヴィン・ミンスキーは、こう言ったらしい。

「みんなと逆のことをやれば、だいたい正解である。大多数の人間は間違っている」 (「素人のように考え、玄人として実行する」(金出武雄著 PHP研究所 2003)より)

基本的に、多くの人の力を借りなければコンテンツの意味の問題は解決できない。
しかし、ランキングまで人の力を借りると自分の都合にうまく合わせることができない。
ランキングは個人の要求や文脈に応じて変化すべきものだからである。
大多数の人の考えを偏りなく考慮して普遍的な答えを見い出そうとすると間違ってしまうのである。

「みんなの意見は案外正しい」(The Wisdom of Crowds (James Surowiecki, Random House, Inc., 2004)の邦題)のは、多くの人と問題の文脈が共有できる(同様の経験をしている)かそもそもその文脈があいまいで特定できない場合に限られるだろう。

そして、コンテンツを吟味するという問題がより顕著になってくるのは、これからさらに増加していくバイナリーコンテンツ(映像や音声)である。

投稿者 nagao : 00:04 | コメント (19) | トラックバック