2009年03月14日

ビデオアノテーション研究には未来があるか

つい先日、情報処理学会第71回全国大会という研究集会が滋賀県の琵琶湖の近く(といっても琵琶湖は見れなかった)の立命館大学で開催された。
僕のいる研究室からは、ほぼ全員がそれに参加して研究発表を行った(僕も一応、発表登録をしたが、学生の発表と時間が重なってしまったのでキャンセルした)。

その中で「マルチメディアとメタデータ」という僕たちの研究テーマとよくマッチするセッションがあり、僕のいる研究室の学生の一人がそこで発表した。
これまでに作ってきたシステムのデモをいろいろ見せながら、実験結果も報告して、なかなかよい発表ができたと思っている。
僕はこのシステムの設計にはずいぶん知恵を絞ったので、かなりの思い入れがある。
この学生もよくがんばったし、僕の期待にも応えてくれた(正直、大学に来てから今までで、最も指導のし甲斐があった学生である)。

しかし、そのセッションの座長の評価はさんざんであった(優秀な発表を表彰する賞に関して「該当者なし」という判断がなされた。これは僕たちの研究発表が特にダメという評価ではないが、すべての発表がダメという評価なので、いずれにせよ、高い評価ではなかった。ちなみに、座長がこのような判断を下したセッションは110件中たったの3件だったそうである。まったく関係がないが、「スター誕生」という往年の人気番組の萩本欽一のせりふ「バンザイ。。。なしよ」というのを彷彿とさせる)。
何がどう悪いのかまったく説明がなかったので、いったいどういう方向にこの研究を導いていけばいいのか迷いが生じてきた(本人に直接、何が問題なのか問い合わせればよい、という意見もあるだろうけど、「(賞の)該当者なし」とだけ言い切ってその場を立ち去った人間に何を聞いてもまともな答えは返ってこないような気がする)。

僕たちが取り組んでいる「ビデオアノテーション研究」すなわちビデオに対するコメントやタグなどのメタ情報を収集し、ビデオの意味的な内容を解析して、さまざまなアプリケーションを実現する研究は、今後、大きな発展の余地があるのだろうか。

最近、YouTubeもビデオアノテーションの仕組みを取り入れ、ビデオの投稿者が許可するユーザーが、ビデオ内の任意の時間の画像の任意の部分に吹き出し風のコメントを付けたり、他のコンテンツへのリンクを付けたりできるようになっている。
ニコニコ動画よりまともなコメントが付くようになれば、いろいろと利用価値もあるだろう。

ちなみに、上記のセッションでは、ニコニコ動画のコメントから意味のある情報が抽出できるかどうかを試みた研究発表もあったが、結果はあまり有意義なものではなかったようである。
まあ、これは研究対象がダメすぎたのかも知れないけれど。

僕たちが研究しているビデオシーン引用もこれからさらに面白くなっていく予感はするのだけど、今のところ、あまりよい反応はない。

ビデオアノテーションに関しては、明らかに、僕たちの研究が先行していたと思っている(僕がビデオアノテーションの研究を始めたのは1998年のことである)が、もうほとんど「時代に追い付かれてしまった」という気がしている。
だから、再び引き離すには一体何をすればいいのか、また、僕たちにこれから何ができるのか、苦しみながら必死に考えているところだったのである。
そんな状況で上記のような評価をもらったのでショックが大きかった。

確かに、現時点で、ビデオアノテーションによってできることはあまり多くはないだろうし、驚くような結果(たとえば、任意のキーワードにぴったりマッチするビデオシーンが検索される、など)が出ているわけでもない。
しかし、ビデオ(のシーン)を主要な素材としてネットならではのコンテンツを作っていくためには、どうしてもこの研究が必要だと思っている。
だから僕は、この研究には未来があると信じている。

投稿者 nagao : 02:17 | コメント (4) | トラックバック

2009年02月22日

形態素を数えてみたら

人は一生のうちにどれだけの量の文章を書くのだろう。

前回のエントリーで紹介したタイムマシンボードのテキスト入力のために、僕がこれまでに書いてきた文書を使って辞書(読みや表記の一部から単語を引くもの)を作ってみた。
それには、2冊の著書(1997年と2000年に書いたもの)とこのブログ(2005年8月から今月までのもの)といくつかの(単著の)論文から得られた形態素(文法的に分割される文の最小単位)が含まれている。
僕は、これはほぼ10年分くらいの個人的な文書量だと思っている(ただし、英語の文献や、共同執筆の論文やメールなどは含まれていない)。

延べ形態素数は約20万でその異なり数(重複を除いたもの。助詞と助動詞と記号を除く。動詞や形容詞などの活用するものはその基本形の異なるもの)は約9千であった。
意外に少ないなあと思う。
確かに、僕が公開を前提に書いている文章は、専門的な内容がほとんどだけど、広い視野で研究に取り組んでいるつもりなので、使っている語彙はもっと多いと思っていた。

ちなみに、広辞苑第5版の項目数は約23万で、現時点のWikipedia日本語版の項目数は約56万である(これらは複合語や名詞句を含むので、厳密には比較対象にはならない)。

僕は他人に読んでもらえるような文章を書くことは、頭を使うためのきわめて重要なトレーニングだと思っている。
普段から人に見せる文を書く訓練をしていない人(もちろん、メールは訓練にはならない)は、まとまったドキュメントを書くときに、話し言葉に近い表現(「なので」とか「○○したい」とか「こういった」とか)を多用するため、その結果は、体裁が悪く、質が低いものになる(そのため、卒論発表会などで回覧される論文にはひどいのが多い)。
だから僕は、これからも文章を書いて公開していこうと思っている。
これは誰かのためではなく、あくまで自分のためなのである。

しかし、昔はともかく、今は論文を一人で書くことはほとんどなくなったし、本や解説記事は(書けとは言われているけれど)最近さぼっていたため、もっぱらこのブログが僕の(単独による)著作物になっている。
実は、このブログは形態素解析がやりやすいように、一文の後に必ず改行を入れているのである(形態素解析システムは改行までを一文とみなすことが多いので、文の途中に改行があると、その前後の語が正しく解析されないことがある)。

このブログは僕にとって日記ではないので、日常的な出来事などはほとんど書いていない。
基本的に僕が関わっている研究の話を書いている。
また、論文ではないので、あまりむずかしいことは書かないようにしている(それでも、知り合いからは「もっとわかりやすく書いて」と言われている)。
さらに、悪口はできるだけ書かないようにしている。
大学のことにせよ社会のことにせよ、腹の立つことはとても多いのだけど、実名をさらしているのだからめったなことは書けない(僕がリミッターを外して、思っていることをそのまま書いたら、すぐにこのブログは閉鎖になるだろう)。

そのため、形態素の異なり数があまり増えていかないのは当然なのかも知れないけれど、興味の対象が狭い範囲に限定されているのでは、教育者として適切ではないと思うので、形態素の異なり数が増えていくように執筆活動を続けていきたいと思う。

つまらないことにこだわっていると思われるかも知れないが、たとえ本を何冊も書いていたって、書いていることがいつも似たような内容なら、その著者に明確な進歩があるとはあまり思えないのである。
だから、書いてきた文章の形態素の異なり数を一つの目安とすることは、それほどおかしいことではないと思う(機械的な言語処理がさらに高度になって、意味解析の精度が十分なものになったら、これとは違う指標を用いることになるだろう)。
僕は、これから1年ごとにこの数値を調べてみようと思っている。

投稿者 nagao : 12:03 | トラックバック

2008年09月20日

実世界のプログラミング

ご無沙汰しています。

個人用移動体の自動走行のプログラムを書いていて、よく思うことは、実世界の(主に物理的)制約というのは、予想以上にやっかいなものだということである。
同じ実験を繰り返しても、結果が同じにならないからである。
無論、PCやセンサーの不具合やプログラムのバグのせいで、うまくいかないことも多いけれど、ちょっと向きが違ったとか、ちょっと距離が違っただけで、予想と全然違う動きをすることがあるのである。
やっぱり、実世界というのは複雑で面白いなあ、と思う反面、仮想世界ならこんなことは問題にもならないのに面倒だなあ、とも思う。
ロボットの(知的な)自律行動の研究をしている人たちが研究室内の実験環境から離れたがらない理由はよくわかる。
しかし、僕たちは日常環境で利用可能な知的移動体を作っているのだから、いつも同じところだけで実験をしているわけにはいかない。

この研究の目指すところの一つに、インドアロジスティックスあるいは施設内物流というものがある。
これは、人やモノを適切な場所に自動的に移動させる、あるいは、適切な場所に配置されているかを自動的に確認する仕組みを実現して、特定施設内の物理的環境をプログラミングによって最適になるように管理するということである。
タクシーの最適配置と循環経路の決定みたいな個別の問題があるけれど、それを、ある程度大規模な施設内の人とモノの最適な移動と配置の問題として一般化したものである。

倉庫内での物品の配置と検索なんてのはわかりやすい例だけれど、人の移動まで含めてうまく考えたいと思っているのである。
たとえば、博物館で、あるテーマの展示をするときに、美術品の配置と訪問者の興味に応じた移動を最適化したい、なんていう問題を解くには、施設内物流のシステムがあるとうまくいくだろう。


今度の木曜日(9/25)に名古屋大学で開催されるテクノフェア名大2008で僕のいる研究室が実演するのは、そのようなシステムのデモ(のとても単純な例)である。

個人用移動体は以前にもこのブログで紹介したオムニムーバーことAT9号機である(以下の図を参照)。

at9-technofair1.jpg

移動体の屋内位置を正確に認識する仕組みはまだ存在しないので、実世界環境に機械のための記号を埋め込むことにする。
要するに、RFIDタグ(無電源非接触のICタグ)を屋内のさまざまな場所に貼り付けるのである(これは僕らがいつも使う手である)。
また、全方位の距離を計測するためにレーザーレンジセンサーを用いる。

さらに、今回は美術館で自分の見たい展示物を(複数)選択すると、現在位置から近い順にその場所に連れて行く、というデモ(以下の図を参照)を行うのだけど、コンソールに映るカメラ映像に、その展示物の説明をオーバーレイし、さらにユーザーが画面上のその展示物をタッチするとウィンドウが開いてビデオが再生されるようになっている。
このため、展示物に赤外線LEDを付け(RFIDではリーダーの読み取り範囲の都合で展示物の位置を正確に知ることはできないため)、カメラでその位置を計算できるようにした。
その座標を使って移動体をその展示物の前に正確に誘導することができる。

at9-technofair2.jpg

また、これはおまけだけれど、Wii FitのバランスWiiボードを搭載して、体のバランスでATを制御する仕組みと、自動走行中にバランスを大きくくずすと自動的に停止する仕組みも実装されている。
搭乗者のバランスが走行中にどう変化したかを、Wii Fitさながらに、走行後にグラフ化して見ることもできる。

とにかく、いろいろとお見せできると思いますので、ご興味のある方はぜひ見に来てください。

投稿者 nagao : 16:56 | トラックバック

2007年12月12日

コンテンツ・フューチャー(その6)

前回のエントリーからの続きです。

国家とコンテンツの関係に関する話題があった。
やはり、比較の対象となるのはアメリカである。

「アメリカはね。 最近聞いた話では「アメリカンメモリー」という巨大なグランドデザインの元に、各州と各企業がコンソーシアムを組んで、アーカイブ事業を興そうとしているんですよ。 それで、電気とか自動車とかのそれぞれの企業が、例えば電気というアーカイブや車というアーカイブを作る。 また、通信というアーカイブを作る。 あるいは、川というアーカイブを作る。 それを全部「アメリカ人の記憶」という名前のアーカイブにする。 そこがちょっとアメリカのいやらしいところだけど、これが上手いんだよ、あっちは。 日本でそんなことやったらさ、「愛国者」とかって言われるわけだよね。 「右翼ですか?」みたいな。 「日本人の記憶」とか普通の意味で理解されない。 だけど、一旦そういうことをしないと、日本も動かないかもしれない。」(271ページ上段)

あらゆるモノの歴史というコンテンツはもちろん重要だけれど、それよりも僕は人間の行動や体験の記録の方に興味がある。
日本という国家の(行動や体験を集めた)ライフログを作ろう、という動きは将来起こるだろうか。
国家のライフログというのは、国の代表者である政治家や官僚のライフログを含むことになると思うけど、そんなものを作ったら、醜悪な実態が明らかになるか、やらせばかりで無意味なものになるか、のどちらかだから建設的なものは何もない、という人が多いかも知れない(そもそも実現不能という人が最も多いだろうけど)。
情報公開やアカウンタビリティなんて言葉はもうあまり意味を成さないのだろうか。

最後に、ネットの状況とその問題点を端的に示した次の言葉を引用しよう。

「インターネットみたいな、ユーザーの力が強く、ある種コントロールしにくいメディアが登場したことによって、技術の進化速度が制度を追い越してしまった部分ってありますよね。」(226ページ下段)

そうかも知れないけれど、混沌とした社会にはある種の秩序が必要だし、何らかのコントロールが機能しなければ国家的な戦略など不可能だから、新しい時代のコンテンツには従来のコピーコントロールなんかとは異なる新しいコントロールが必要だと思う。
引用や複製をコントロールするのはオリジナルの制作者(CGMの場合はコミュニケーションの主体となるユーザー)であり、国が行うのはメタなコントロール(当事者間でうまくコントロールできないときのコントロールなど)である。
国(つまり政府)が当てにならない、というのなら頼らなければいいし、ルールが明確にならないと動きにくい、というのなら適切な国家機関に働きかければよい(外交が絡むととたんに弱腰になるのは早く何とかして欲しい)。
それは単に運用の問題ではなく、見えにくい問題を見えやすくする技術の問題でもある。
それによって、大きく水をあけられてしまったアメリカのメディア戦略にキャッチアップし、さらに独自の方向性でコンテンツを進化させられるようになると思う。

結局、この本を読んでわかったことは、「日本のメディア・コンテンツビジネスはアメリカのような時代(と技術)の変化に適応できる柔軟さを持たないがゆえに、放送と通信の融合も著作権の問題もうまく処理できずに、かなり危なくなってきている。しかも、従来のマスメディアのやり方ではユーザーの多様な興味に対応できずにアテンションを獲得しにくくなっている。しかし、CGMのように、ユーザーコミュニケーションを積極的に取り込んでいく、日本ならではの優位性もあるのだから、そこを伸ばしていかなければならない」ということくらいである。

まあ、その程度の認識を読者に与えられればよいのならそれでいいけれど、僕としては、(日本ならではの)コンテンツの進化を促進するテクノロジーのポイントはここだ、ということを明確に語って欲しかった。
制度のまずさを技術で補えるのなら、官僚や政治家が制度を見直さざるを得ないような、圧倒的な技術とそれに基づくコンテンツをできるだけたくさん提示していくのがよいのだろう。

コミュニケーションの集積がいつのまにかコンテンツになっている場合を除いて、コンテンツを公開・消費するということは知財(知的財産)を共有するということであることをよく認識すべきだと思う。
コンテンツは誰にでも作れるものだし、経験やスキルの差も作品からは曖昧にしかわからないのだから、その価値を判断するのが容易ではないことはわかる。
しかし、それでも自分のコンテンツは自分でしっかりコントロールすべきだし、他者のコンテンツも注意深く利用すべきだと思う。
最近読んだ新聞にこんなことが書いてあった(ちなみに、以下の久保田さんという人は、以前に「コンテンツがタダになる日は来るか」というエントリーの最後で引用した意見を述べた人である)。

「「知財立国を掲げるなら、法規制以上に情報の取捨選択や活用への感度を高める教育が重要」とコンピュータソフトウェア著作権協会の久保田裕専務理事は強調する。 7月施行の改正著作権法は権利侵害の厳罰化などを定めたが、「独創性などの著作権の価値を尊重する土壌があってこそ法の実効性も高まる」。」(日本経済新聞 2007年12月3日朝刊16面より)

やはり自分が参考にしたオリジナルのコンテンツは尊重すべきだし、自分の作品から常にオリジナルに辿り着けるように技術的な工夫を凝らすべきだと思う。


以下は余談であるが、この本の著者の一人は、あとがきの中でこう書いている。

「コンテンツは生活必需品ではない。極論すれば我々の生活に「なくても構わないもの」だ。しかし、同時に「ないと寂しい」のがコンテンツだとも思う。」(310ページ)

これには思いっきり反論しておこう。
もはや人間はコンテンツなしには生きられない。
コンテンツは水や食料や衣服と同様に生活必需品である。
なぜなら、人間はコンテンツを消費しないと賢くなれないからだ。
ある程度賢くなければ人間は長く生きられないだろう。

ある意味、人類の歴史そのものがコンテンツなのだ。
歴史を知らないものは未来を語れない(たとえ語ったとしてもほとんど意味を成さない)。
未来を展望できない人間は今をただ目的もなく無為に過ごすことになる。
「勤勉は未来を、怠慢は今を豊かにする」という言葉があるそうだ。
「なくても構わないけどないと寂しいのがコンテンツ」なんて程度の認識でコンテンツを語らないで欲しい。

僕は、人間がコンテンツを利用してより賢くなるための技術を研究している。
コンテンツが衰退すると人間の知能の進化も停滞してしまうと考えているからである。

ちなみに、僕が今書いている本のタイトルは「近未来のコンテンツ・テクノロジー(仮題)」である。
来年中には何とかして出版にこぎつけたいと思っています。

投稿者 nagao : 00:07 | コメント (234) | トラックバック

2007年12月10日

コンテンツ・フューチャー(その5)

前回のエントリーからの続きです。

新しいコンテンツを生み出すクリエイティビティに関して、こんなことを言っている研究者(兼メディアアーティストらしい)がいた。

「「創作性があるかないかを客観的に見分ける方法はあるんだろうか」みたいなことを考えたんですね。 一番はじめに考えたのはモデルの複雑さ。 これで判定できるんじゃないかと。 例えば接続されているモジュールの数とか、接続されるルールの複雑さとかです。 で、実際にやってみて見分けることができないってことがわかった。 ものすごくシンプルなのに、創作的であるとしか言いようがないような発見をもたらしているモデルもある。 結局、何が創作性なんだろうとかと。 1つあり得るな、と思ったのは「ほかの人に影響を与えたかどうか?」を基準として考えてみるのはどうだろうかってことなんです。 あるモデルを元にして、ほかの人が影響を受けて、あるモデルが別のモデルに発展していったとすると、その「親」に当たるモデルには一番創作性があるんじゃないか。 それで「ユニークID」の機能を実装したんですね。 誰かがモデルを作って投稿する際に、そのモデルに一意のIDを埋め込むんですよ。 それをデータベース上で管理する。 そうするとダウンロードしたモデルには全部そのIDが埋め込まれているようになる。 それで何か変更して再投稿すると、変更した瞬間に新しいIDが生成される。 そうすると、元のIDと新しいIDの両方が存在しているから、その2つのタグ付けによってデータベース上で管理されるんですね。 なので、このモデルはこのモデルから派生したものだっていうことがシステムが検知できるようになっている。 これは、再利用みたいなものを促進する部分もあるし、再利用したときに自動的にその親がトレースできる仕組みを入れたいと思って作ったんですね。 (中略) ここまでやれば創作性をある程度客観的に判定できるようになるかな、と思ってやってみたんですが、やっぱりそんなことはなかったんですよ。 なぜかっていうと、ある一定以上に創作性が高いと、あまりにも創作的すぎて真似しようという気が起こらなくなるんです。」(207ページ下段)

コンテンツの部分引用と派生のネットワークによって、オリジナルコンテンツの影響力の程度を客観的に測定する、というのは悪くないと思う。
それがダイレクトにはコンテンツの「創作性の高さ」の判断には結びつかない、というのは一見正しいようだけど、本当にそうかな、という気がする。
確かに、新しいことを生み出したり発見したからこそ多くの人に引用されるのだ、とは言い切れないかも知れない。
「陳腐なものはそれに効果があるからこそ多用される。多用されるからこそ陳腐になる」という言葉があるけれど、やはりその「陳腐なもの」にもオリジナルがあるはずである。
だから、そのオリジナル(最初に考案されたバージョン)が何であるかわかるのなら、その派生物が「陳腐なもの」となっていった過程を見ることで、オリジナルの「創作性の高さ」を議論することはできると思う。
コンテンツが生み出されてからの長い時間を考慮することで、派生による「影響力の程度」とその「創作性の高さ」を結びつけることはきっとできると思う。

そして、コンテンツを中心としたそのユーザーの活動とクリエイティビティに関して、次のような意見があった。

「おかしいと思うんだったら、不満に感じているんだったら直してください。 直す余地があるんですからと。 そういう仕組み……というかユーザーに対するアクションの「選択肢」を最初からドーンと提示すればいいわけですね。 (中略) ユーザーに自発的に手を動かさせることで、批判を封じつつ、クリエイティブにつながる行動をさせる。 確かにそれはメリットが多いし、理にかなっている。」(213ページ上段)

やはり、ネット時代のコンテンツは、ユーザーを積極的に巻き込んでいくものになっていくのだろう。
「貢献者としてのユーザー(User as Contributor)」というWeb 2.0のスローガンが示すように、ユーザーはコンテンツをよりよいものに変えていくことができるのである。
だから、コンテンツはユーザーによって補足・修正や評価を付け加えられていって成長するための手段を持たなければならないのである。
そういうものを僕はアノテーションと呼んでいる。

一方で、大多数の意見や行動のみに頼ってものごとを評価することへの懸念ももちろんある。
たとえば、こんな意見があった。

「目利きとか評価者とか番付とかが、アクセス数や素人の感想に置き換わっちゃった。 ページランクも別にそのサイトに対する純粋な評価ではないよね。 映画評や書評も、アマチュアの感想が出ること自体はかまわないんだけど、じゃあ「太鼓判」はどこにあるのか。 (中略) 良い意味でのオーソリティが失われたわけですよね。 かつて、西洋のルネッサンスとか、日本の桃山とか浮世絵時代とか、あるいはバロックとか、シュールレアリズムの時代とかダダとか、かなりアナーキーな状態で文化が流行したときでも、やっぱり目利きという存在はどの時代にもいたんですね。 それが確かに現在では失われている。 ただ、僕は別にネット的なフラットなものを完全に否定しているわけじゃなくて、フラットにすることの良さと、山脈のように頂上をいくつか作るものと、両方必要だと思ってるんです。 僕はそれを「ピークモーメント」って呼んでいるんだけど。 例えば、ミシュランの星の権威が崩れてフラットになったら、意味がないわけですよ。 「ミシュランのメンバーはどうも十数人いるようだ」というくらいの幻想の中でガチガチの評価をしてくれているから良いんだけど、これが全部ページランクになったら、どの店が美味いのかまったくわからなくなりますからね。 ページランクで「美味しい」って判断されるのと、食べ続けたヤツが「美味しい」っていうのは違うからね。 それは書評でもそうですね。」(267ページ下段)

これにはまったく同感である。
ネットが破壊した既存の伝統の中に歴史的な権威というものがある。
よいものには理由があるのだけど、それを説明するのに時間がかかるから、権威というものでとりあえず納得してもらうのである。
もちろん、権威は安定なものではないから、人間の努力によって維持していかなければならない。
権威にあぐらをかいて努力を忘れたら、すぐにその権威は失墜する。
その努力にはかなりのコストがかかるから、自動化や合理化によってそれを補おうとする。
そして自動化や合理化の部分ばかりに注力した結果、ページランクみたいなものが出てきて、もともと何を守ろうとしていたのかわからなくなってしまい、権威なんてものは取るに足らないものだなどと短絡的に考える人が出てきた。
人間はほおっておくとたいてい楽な方へ流れるから、維持するのにそれなりの努力を伴うものは段々見捨てられていってしまうだろう。
たとえば、ミシュランガイドを批判するのは簡単だけど、ミシュランのメンバーがそれらの批判に真摯な態度で対応していかないと、いずれその権威は失墜してしまうだろう。
マスメディアがやっていくべきことも、短期的な視聴者のアテンションの獲得などではなくて、ある種の権威を維持・回復していくための努力なのだと思うのだけど、すでに失ってしまったものを取り戻すのは不可能なのだろうか。

このエントリーは次回で最後です。

投稿者 nagao : 00:07 | コメント (218) | トラックバック

2007年12月08日

コンテンツ・フューチャー(その4)

前回のエントリーからの続きです。

コンテンツとその伝達手段であるメディアを切り離して、既存のメディアやハードウェアに依存しない、コンテンツのエッセンスと、最も効果的なユーザーへのリーチの仕方について考える必要があるだろう。
それに関して、ラジオ業界の人からのこんな意見があった。

「今のメディアにおけるラジオという形態はなくなっても、「音声コンテンツ」は絶対生き残るという確信はあるんです。 音声コンテンツそのものへのニーズって普遍ですよ。 何かしながらでも楽しめるし、手軽だし。 ただ、ラジオというメディアじゃなくて、ラジオよりも優れていて、リスナーにとってもっとメリットがある音声コンテンツが出てきて、そっちで聴くほうが便利で楽しいんだったら、そっちに入れ替えちゃえばいいと思うんですよね。 (中略) コンテンツは何か別のところで生き残り、メディア自体は死んでしまうという現象は絶対に起きる。 ただ、ラジオがそうなるのかというのはまだわからない。 現状で言うと、ポッドキャストやネットでは出せないライブ感とかそういう部分があるから、僕はまだラジオの価値はあると思っています。」(102ページ上段)

確かに、ラジオのライブ感覚というのは残すべきコンテンツのエッセンスであるような気がする。
ただ、ネットにおけるライブ感覚というのは、ラジオのそれとは若干異なるものになるだろう。
それは、たとえば次の意見で言われているものである。

「ウィキみたいなシステムを基本にして、ニコニコ動画や字幕・inみたいに放送のタイムラインが表示されて、そこには放送の書き起こしデータがテキストで表示される。 その書き起こし部分をクリックするとストリーミングですぐ音声も聴けるようになってて、さらにリスナーがツッコミ入れたいと思ったらすぐ横にボタンがあって、ツッコミ入れられるみたいな仕組みがあったら、ネットとラジオが完全に融合した全く新しいメディアになるんじゃないかな。」(109ページ下段)

実は、ニコニコ動画や字幕・inの元ネタである僕たちのSynvieやDivieにはこれに似た機能がすでにある。
テレビの生番組やラジオのライブとは少し異なる、非同期性を持ったライブ感覚をネット上で実現することができる。
だから、テクノロジーが既存のコンテンツをベースにした新しいエクスペリエンスをもたらすことがある。

また、何をコンテンツと見なすかということもネットによって変わってきたと、この本は言う。
たとえば、こんな意見がある。

「コミュニケーションそのものがコンテンツ化するって現象は、以前だったら考えられなかったじゃないですか。 そもそもそういう環境はなかったし。 (中略) mixiで他人の日記を読むのが文化だという発想が出てくるのは、1つの象徴的な話だなぁと。 (中略) でも、それって良い悪いの問題じゃなくて、そうなってる、ある種必然的な環境の変化なんでしょうね。」(171ページ上段)

コミュニケーションそのものがコンテンツとなるというのは別に最近の話ではない(そもそもこの本のような対談集もコミュニケーションがコンテンツ化された例と言える。ただし、編集されているのでコミュニケーションそのままというわけではないが)。
ただ、ネットのおかげで、本来コンテンツの要素になりにくかったものもコンテンツに含まれるようになったのは事実だと思う。
たとえば、コンテンツに対するタグやコメント、ブックマークなどである。
僕は、一応これらをコンテンツとメタコンテンツに分けて、必要に応じてトランスコーディングという仕組みで統合することを試みているが、メタコンテンツがコンテンツの要素として表示され、ユーザーにはその区別が明確にならないことも当然あるだろう。

さらに、こんな意見があった。

「今ネットの中って、やっている本人がコンテンツだと思ってないところがあると思うんですよ。 単なるコピペでもアフェリエイト(注:正しくはアフィリエイト)でも、この話の流れでそれ持ってくるかー!みたいなのって、やっぱりセンスだと思うんですよね。 そこにはひねりがあって、創作的な要素が含まれている。 そしてそれがコンテンツが発生した瞬間であるとみんなが気づいたときに、既存コンテンツに対する壮大な見直しのようなムーブメントが起きるといいなと思ってるんですけど。」(173ページ下段)

既存のコンテンツが本来の意味を成さなくなる、ということはないだろうけど、およそ創造的な活動の成果はみなコンテンツ(あるいはその要素)と見なせる、という時代が来て、人間の活動がより広範囲に集積され、次の世代に継承されていくということは容易に想像できる。
それは突然起こるのではなく、じわじわと草の根的に広がっていくムーブメントなのだと思う。
どこかの誰かが仕掛け人となって、戦略的に引き起こすムーブメント(たとえば、日本におけるセカンドライフのようなもの)にはならないと思う。

このエントリーは性懲りもなく続きます。

投稿者 nagao : 00:14 | コメント (12) | トラックバック

2007年12月06日

コンテンツ・フューチャー(その3)

前回のエントリーからの続きです。

ネット時代のコンテンツの共有に関して、音楽業界の人がいいことを言っている。

「かたやコンテンツホルダー側から見ると、YouTubeはもう既成事実としてあるわけじゃない。 で、ぶっちゃけあれに対してどう接していいのかわからないんですよ。 僕も「ネットの違法コピーがこれだけあるから逸失利益がこれだけある」みたいに数字を仮定で算出するバカらしさは理解できるけど、でもじゃあYouTube的な違法コピー認めるの?って言われたら「No!」と言わざるを得ないし、業界はそういう方法でしか身を守る手段がわからないんじゃないかな。 「違法は違法じゃねえか!」っていう。 逆に言えば、行政の側もそれくらいしか提示できないんだよ。 彼らもどうすればいいかわからなくなっている。 だからね。 補償金の議論で言えば、僕は「補償金」って名前に抵抗感のあるユーザーがいるんだったら、じゃあ補償金はいりません。 その代わり「コンテンツ税」でも何でもいいけど、我々がユーザーの私的な利用領域については立ち入らない代わりに、全体として音楽業界のクリエイティブを支える大きなインフラがあればいいと思うんですよ。 もちろん、そういうものをきちんと分配するための制度は必要だと思うし、誰にどう分配するんだという議論はそのときにきちんとやればいい。 僕個人は結局ユーザーの私的複製の問題はそういう形でしか解決できないと思ってるんです。 こまっしゃくれたDRMとか駆使したって、結局はパテントを持っているメーカーを儲けさせて終わりじゃん、みたいな。 どこかで解除されたらあとは屍になっちゃうわけでしょ。 そんなことよりも、ある程度のアロワンス、(注:この読点はおかしい。「の」に換えるべきだと思う)ある社会を実現するための文化的インフラをみんなで作りましょうよ。」(131ページ下段)

これを見て、以前に書いた「コンテンツがタダになる日は来るか」というエントリーを思い出した。
やはり、結論は、「コンテンツはタダになってはいけない」ということなのだと思う。
自分たちのコンテンツが不用意に使い捨てにされないための努力をしなければいけないということだろう。
コンテンツがコピペで広まるのは、そのコンテンツを生み出した人間がコントロールできなくなるという点がダメなのだと思う。
それに関して、こんな意見があった。

「コピーコントロールしないってことは、ある意味それはコンテンツホルダーが「人々の記憶に残してもらうための投資」をしていることだと思うんですよね。」(293ページ下段)
「海賊行為は昔からずっとあるわけですけど、それでコンテンツ産業がなくなったかっていうとなくなってないわけじゃないですか。 僕はインターネットは産業全体を飲み込めるほどキャパシティが大きくないと思ってますし、ネットの海賊行為程度で滅びるコンテンツ産業はそもそもコンテンツに力がなかったんだ、とも思いますね。」(295ページ上段)
「種を残しておく。 だから、「コピー=悪」じゃなくて、「保険」って考え方はできないですかね。 文化を守るための保険。 文化が死なないためのね。」(298ページ上段)

これらの意見は正しいように思われるけれど、じゃあ今のままでいいんだ、ということにはならないと思う。
コピーコントロールしたって、文化は守っていけると思うし、クリエイターがやる気を失わないだけの報酬を得られる仕組みを実現するべきだと思う。
たとえば、テクノロジーを駆使して、ユーザーの自由な活動を支援しながら、商用コンテンツへのアテンションに結び付けていき、トータルとしてビジネスのバランスが取れて、誰も損をしないようにする、という手もあるだろう。
それに関して、こんな意見があった。

「「コピー=悪」みたいなことを言う権利者の方は多いですが、歴史を見れば、少なくとも今までに限っては全くそんなことはないということが証明されている。 コピーできるハードウェアが逆に視聴機会を増やして、そのこと自体がユーザーにコンテンツへの興味も増やしてきました。 アメリカでは「スリングボックス」という「ロケフリ(注:ソニーのロケーションフリー)」に似た商品が発売されて、CBSと提携して「Clip+Sling」というサービスを提供しています。 これはCBSがスリングボックス自体にオフィシャルにコンテンツを流して、それをPCソフトで受信して見ることができるというハードとコンテンツが一体化されたものですね。 Clip+Slingが面白いのは、提供されたコンテンツを見ながら面白いところでインポイントとアウトポイントを指定すると、その部分がClip+Slingのサーバーにアップロードされて、パーマリンク化されたコンテンツに対してYouTubeみたいにコメントしたり、ユーザー同士がコミュニケーションできるようになっている。 CBSの狙いはものすごくはっきりしていて、スリングボックスみたいな便利な機械を、コンテンツに興味を持ってもらうためのインフラとみなしてるんですよね。 コンテンツホルダーがそのインフラにコンテンツを提供するから、ユーザーにうちの番組に興味を持ってくださいという。 ゆくゆくはテレビを見てもらって視聴率が上がればいいや、っていうある種の割り切りがある。」(069ページ下段)

スリングボックスという製品の話は知らなかったけれど(ちなみに、これとほぼ同じことは僕たちのSynvieでもできる)、これは、前々からWiiの任天堂に提案したいと思っていた話に近いものである(今のところその機会はまだ訪れていないのが残念)。

コンテンツの視聴機会を拡張していくテクノロジーは、これからもいろいろなものが現れると思う。
それに関して、こんな意見があった。

「何をもって国を富ませるかって話で行けば、クリエイターとその周辺だけが儲かればいいってことじゃない。 物流以外にも、伝送やコミュニケーションに乗せて、国の経済力全体が上がるかどうかがポイントになる。 そういう意味では、テクノロジーの恩恵でコンテンツのアクセス性が高まることがキーになるわけです。」(301ページ下段)

ネットではアテンション・エコノミーと呼ばれているように、コンテンツやサービスへの大量のアクセスを獲得することはそのままある種の経済的優位性を獲得することにつながるという考え方がある。
そもそもコンテンツに興味を持ってもらわなければ、そのコンテンツの良さはアピールできない。
だからきっかけは何でもいいから、コンテンツにユーザーの注意を惹きつけるための何らかの工夫をしよう、ということだろう。
今のテレビのような、ユーザーを不必要に煽ったり、騙しのようなテクニックでユーザーを誤誘導しないような工夫ができるとよいと思う。
そのための技術は、やはりユーザーの集合知を利用するものだろうか。

このエントリーはまだ続きます。

投稿者 nagao : 00:28 | コメント (31) | トラックバック

2007年12月04日

コンテンツ・フューチャー(その2)

前回のエントリーからの続きです。

ネットによって、人々のコンテンツ消費のスタイルが変わってきたというのはいくつかの意見から読み取れる。
たとえば、これ。

「若い学生とかと話すと、やっぱりネットが好きでネットばかり見ていて、テレビを全く見ない子って増えているんですよね。 でも、そういう子もYouTubeは見ている。 彼らは動画コンテンツに興味がないわけじゃなくて、「情報処理」のスタイルがネット的なんだなという気がしています。 情報処理がネット的になるっていうのは、自分にとって必要なものだけをフィルタリングして取ってくると言い換えてもいいかもしれません。 そういう形に慣れた人は、従来のテレビ番組のようにリビングのテレビでみんなとわいわい話しながら楽しむということに、魅力を感じないのかもしれませんね。」(048ページ下段)

テレビを見ないことは別に悪くないし、かえって良いことだと思うけれど、これまでのようにコンテンツをだらだら消費するスタイル(カウチポテトって言葉はもう死語ですか?)の方が明らかに楽だし、検索するとかフィルタリングするとかの方が面倒だと思うから、若い人たちのテレビ離れというのは本当なんだろうか(本当なら大変結構なことだ)。
テレビを見ない人が本当に多いのなら、テレビ広告ビジネスは衰退しているはずだし、地上デジタル放送に完全移行してやっていけるのだろうか(ハイビジョン放送って結構コストがかかりそうだけど)。

また、こういう意見もある。

「(テレビは)メディアとしてドミナントじゃなくなってきています。 それは、テレビが本来の役割に純粋化されていく課程(注:過程の間違い?)にあるだけだと思うんです。 その意味でもネットがテレビを殺しているんじゃなくて、やっぱり今ネットがテレビを救っている。」(059ページ上段)

テレビがドミナントではないというのはよいことだと思うのだけど、本当にネットがテレビを救っているのだろうか。
ネットで批判されることによってテレビがよくなっていくというのなら、やらせや偏向報道ばかりのマスメディアなんて、とっくに変わっていてもよいはずじゃないか。
これに関連して次のような意見もある。

「書籍だったら、巻末に参考文献リストみたいなのが載っていたりするじゃないですか。 あれ、テレビでもあり得ると思うんですよ。 参考にしたものがあるのなら、クレジットの最後に「これを参考にして作りました」っていうテロップがひとつ出るだけでも、あらかたのパクリ問題って解決するような気がする。 結局、何も言わずに安易にパクるから、勘ぐられる部分がある。 「これこれこういうものから着想を得て、こんな番組を作りました」と源泉になったソースをオープンにしていくことがネット時代の作法としては理にかなっているし、余計な炎上の種にならない気がします。 ネットでパクリや倫理について糾弾している人たちって、法律的にどうたら、社会正義のために的なお題目を掲げてることが多いけど、実際は感情的なところで難癖付けてる人が多いんじゃないかな。」(056ページ下段)

こういうことができるのなら、とっくにやっていてもよいのではないだろうか。
それをやらないのは、やはりテレビ関係者が視聴者をなめているからではないのだろうか。

また、こんな意見もあった。

「僕は今のテレビの、テロップをうざいほど入れる作り方が嫌いなんですよ。 「ここが笑いどころですよ」みたいな感じで何でもテロップが入ったり、CM明けに番組が巻き戻されるのに腹が立って仕方がなかった。 普段はDVR(注:デジタルビデオレコーダー)でそういう巻き戻しは全部編集して観てるから、その感覚でオンタイムのバラエティ番組とか見ちゃうともう本当に見られたもんじゃないですね。 「引っ張りすぎだろ!」とか「またCMかよ!」みたいな。 そういう怒りを僕は持っていたし、それはもうテレビの自滅じゃないかとすら思ってたんだけど、実は今回の取材でそこの意識だけは変わったんですよ。 それは何かというと、「テレビってそもそもそんなに真剣に観るメディアじゃないんだ」ってことなんです。 (中略) ユーザーは気になったところだけパッとフォーカスして見るというスタイル。 だから、必然的に最大公約数を取るようなコンテンツ作りになるし、濃密なコンテンツってそもそもテレビのコンテンツとしてそれほど求められていない。 全部の番組がNHKの骨太なドキュメンタリーみたいになっていくのは、テレビというメディアのあり方としては本質的に違うのかなという。」(167ページ上段)

テレビのコンテンツの質が下がるのは避けられないということか。
結果としてそうなってしまうというのならまだしも、作り手側がその程度のものだと思っているのはどうなのだろう。
テレビがよくなっていき、再び多くの視聴者のアテンションを惹きつけていくためには、コンテンツの質を上げ、視聴者を馬鹿にせず、その批判にきちんと対応して、信用や人気を回復していく努力をしなければならないのではないだろうか。
その程度のことは承知していても、テレビ広告費がどんどん下がっていき、制作者側のモラルが低下してきている今日では、誰かが変革を起こそうと思ってもどうにもならない状況なのだろうか。
無名でも実力のある俳優を起用したり、しがらみの少ないフリージャーナリストにコメントさせたりして、ドラマやニュース番組を、それほどコストをかけずにもっと真面目に作る、という試みを何年か続けてみたらどうなのだろう(ちなみに、僕は「たかじんのそこまで言って委員会」というテレビ番組をよく見ています。普通に芸能人も出ていますが、比較的よく作られていると思います)。

このエントリーはさらに続きます。

投稿者 nagao : 19:03 | コメント (238) | トラックバック

2007年11月24日

無限のパラドックス(後編)

しばらく間が空いてしまいましたが前回の続きの解答編です。
前回のエントリーにコメントをいただいた方はありがとうございました(以下を読めばわかりますが、いただいた答えはみな合っています)。

一つ目の問題。

交換した方が確かに有利なのだ。
あなたが賞品を受け取る可能性は、AをCに交換することで3つに1つから3つに2つに増えたのだ。
その理由は、空の箱を開けたのが、「賞品がどの箱にあるか知っている」わたしだからである。
あなたがAを選んだとき、わたしはBを開けるかCを開けるかを選択し、それが空であることを示すことができる。
わたしがこの空の箱を示すことは、とても重大な付加的情報を与えることになる。
なぜなら、わたしは「常に」空の箱を示すことができるのだから。


二つ目の問題。

最も賢い男がAだったとしよう。
彼は次のように推論しただろう。
わたしの帽子が赤であるとしよう。このときBは、もし自分の帽子も赤ならば、Cが緑の帽子を少なくとも1つ見たことを表す動作、すなわち手を挙げる動作をしないことを知っている。
つまり、もしわたしの帽子が赤ならば、Bは自分の帽子が緑であることを知るだろう。
しかし、Bは自分の帽子が緑であることを知らないのだから、わたしの帽子は赤ではあり得ない。
つまり、わたしの帽子は緑だ。


三つ目の問題。

すでに部屋にいる宿泊客が次のように移動すればよいのである。
各々の宿泊客は自分の部屋の番号を2倍した番号の部屋に移動するのである。
つまり、部屋1の客は部屋2へ、部屋2の客は部屋4へ、部屋3の客は部屋6へ、...、部屋nの客は部屋2nへ移動するという具合である。
これらすべての移動は当然同時に行われる。
そして、移動したあとには、すべての偶数番の部屋は埋まり、すべての無限に多い奇数番の部屋は空きになっている。
そこで、最初の新しいお客は最初の奇数番の部屋1へ、次のお客は部屋3へ、次は部屋5へ、n番目の新しいお客は2n-1へ入ればよいのである。


最後の問題。

もしその床屋が自分の髭を剃るのなら、自分で自分の髭を剃る人の髭を剃ることになり、彼のルールに違反することになる。
もし自分の髭を剃らないとすると、彼は自分で髭を剃らない村人の一人になり、そのような村人すべての髭を剃らなければならないので、自分の髭も剃らなければならないことになる。
これはやはり矛盾ということになる。
結局、この床屋はどちらを選択しても、自分で決めたルールを遵守することはできない。
つまり、そのようなルールを守れる床屋は存在し得ないということである。


これだけの問題では、「無限のパラドックス」という本の魅力を説明しきれないのであるが、ゲオルク・カントールの集合論および無限の概念や、クルト・ゲーデルの不完全性定理を理解するのに役立つ面白い論理パズルが満載されている。

数学というのは、ものごとを高い抽象度で考えることができる便利な道具だと思う。
特に論理的思考法をトレーニングすれば、他者に自分の考え方を適切に伝えたり、相手を説得するのに有効だろう。
僕は、初等教育において数学と国語をしっかり教えることが何より(特に英語や社会科より)重要だと思っている。
また、言語の運用に関する理論(それを語用論(pragmatics)という)は、文法よりメタな概念であるが、それを理解するには論理学を学ぶのが一番よいと思う。
それによって、他者が論理的思考をしていると仮定すると、どのようなコミュニケーションのやり方が有効であるのか判断できるだろう。

ただし、話している相手が「論理的思考ができる」という仮定が段々成り立たなくなってきている気がする今日この頃である(これに関しては、いつか「ゆとりの恐怖」というテーマでブログを書こうと思っている)。

投稿者 nagao : 20:39 | コメント (202) | トラックバック

2007年11月14日

無限のパラドックス(前編)

どうも気分が明るくならない今日この頃ですが、仕事ばかりではうんざりなので、久しぶりにブログを書きます。


最近、白揚社という出版社から電話があった。
この会社は、僕の大学生時代に大いに話題になった名著「ゲーデル,エッシャー,バッハ」(ダグラス・ホフスタッター著 1985)の日本語版を出版したところである。
僕が1994年に翻訳した「無限のパラドックス」(原題Satan, Cantor, and Infinity(悪魔、カントール、そして無限)。レイモンド・スマリヤン著)という本を「スマリヤンの無限の論理パズル」と改題してペーパーバックで(オリジナルはハードカバー)再出版する予定だということである。
僕はそれを聞いて何となくうれしくなった。

この本は僕が一人で翻訳したのだが、当時から好きな本だったのである。
今の僕からはとても考えられないことなのだが、270ページの原著(翻訳は286ページ)を一か月程度で翻訳したのである。
これを訳していた当時は、博士論文を書いていたりした時期で実はとても忙しかったにも関わらずである。
ちなみに、1990年に出版された同じスマリヤンの前著「決定不能の論理パズル」(原題Forever Undecided(永遠に決まらない))の翻訳には約半年間(しかも友人と共訳)、2001年に出版された「スマリヤンの究極の論理パズル」(原題The Riddle of Scheherazade(シェラザードのなぞなぞ))の翻訳には約1年間(しかも家内と共訳)も要している。

また、この本に関しては珍しく、いつも出版社にお任せしていた(一応、案は出すけれど)本のタイトルを自分で決めさせてもらった。
だから、「無限のパラドックス」というタイトルにはとても愛着がある。
ちなみに、自分でタイトルをつけさせてもらった他の訳書には、1996年に出版された「人はなぜ話すのか」(原題Tell Me A Story。ロジャー・シャンク著)がある。

気に入っていたタイトルが変わってしまって残念だけれど、ペーパーバックになって再び出版されるのはとても喜ばしいことである。
このブログを読んでいるみなさんにも是非読んでいただきたいと思う。

有名なマーティン・ガードナーの「数学ゲーム」もかなり面白いけれど、レイモンド・スマリヤンのパズル・ブックにはまる人は結構いるのではないかと思う。


ここで、「無限のパラドックス」に出てくるパズル問題をいくつか紹介しよう(解答は後編で述べる)。

一つ目は確率にまつわる問題である。

閉じた箱が3つある。それらをA、B、Cと呼ぼう。その中の一つには賞品が入っており、残りは空である。
あなたは無作為に一つの箱を取ったとする。それをAだとしよう。
あなたが箱を開けて賞品があるかどうか見る前に、わたしが残りの二つのうち一つを開けたとする。
それをBだとしよう。そして、それが空であることをあなたに知らせたとする。
そこで、あなたにはあるチャンスが与えられる。
あなたが持っている箱、つまりAの中身を取るか、あるいは残った一つの箱、つまりCの中身と交換するか、である。
ここで問題は、「AをCと交換することによって確率的なメリットはあるだろうか」ということである。


二つ目は他者の推論を推論するというメタ推論に関する問題である。

3人の男、A、B、Cが目隠しされて、それぞれの頭には赤か緑の帽子が置かれていることを聞かされる。
そして、目隠しが外され、3人は他の2人の帽子を見ることができるようになる。
しかし、自分自身の帽子の色を知ることはできない。
実際、3人にはすべて緑の帽子が与えられている。
3人は、もし少なくとも1つの緑の帽子が見えたら手を挙げるように、と言われる。
この場合は、当然3人とも手を挙げた。
そして3人は、もし自分の帽子の色がわかったら手を降ろすように、と言われる。
しばらく間があってから、3人のうちで最も賢いものが手を降ろした。
彼はどうやって、自分の帽子の色を知ったのだろうか。


三つ目の問題は、無限に関するものである。

ヒルベルトのホテルには、無限に多くの部屋がある。
部屋には、部屋1、部屋2、部屋3、...、部屋n、...と連続の番号が付けられている。
そのような部屋が一列に並んでいるホテルを想像してほしい。
ある場所を起点に、右方向に無限に部屋が並んでいるのだ。
始まりの部屋はあるのだが、終わりの部屋はない。
このホテルが満室だとする。それぞれの部屋には1人ずつお客がいる。
そこに、新たに無限に多くのお客が泊りにきたとする。
彼らもすでに部屋にいるお客たちも相部屋にはなりたくないとする。
しかし、すべてのお客たちが、もし頼まれれば1回だけ部屋を変わってもいいと思うくらいには協力的だとする。
新しくやってきた無限のお客たちは、どうしたらこのホテルに泊まれるだろうか。


最後は、有名なパラドックスに関する問題である。

ある村には、自分の髭を自分で剃らない人の髭だけを剃るという床屋がいる。
その床屋は、自分で自分の髭を剃る人の髭は剃らないが、自分で自分の髭を剃らない人の髭はすべて剃るということである。
では、その床屋は自分の髭を剃るだろうか、剃らないだろうか。


答えがわかった方は、コメントしていただけると幸いです。
というわけで、後編をお楽しみに。

投稿者 nagao : 03:16 | コメント (316) | トラックバック

2007年11月03日

人の死のいたみ

先日(10月29日)、僕の目の前で人が亡くなった。
正確には、僕のいたところのすぐ近くでということで、僕の視線が向いていたわけではない。
僕はそのとき、地下鉄の駅のホームで、ベンチに座ってiPodで音楽を聴きながら本を読んでいた。
電車が来たな、と思って顔を上げたところ、ベンチの隣に座っていた人が僕の方を向いて何かを伝えようとしていた。
僕はヘッドフォンを外して話を聞いたのだが、たった今線路に人が落ちてそのまま轢かれてしまったということらしい(かなり興奮されていたので最初は言葉がよく聞き取れなかった)。
電車は駅に入る途中で停止し、駅員が数人駆けつけてきた。
僕の隣にいた人は、その内の一人に目撃者として連絡先を聞かれていた。
電車内の乗客たちは、状況がわからないようだったが、何人かがドアを叩いて駅員にドアを開けるように要求していた。
僕は茫然として立ちすくんでいた。
駅員が何人か線路に降りて車両の周囲を歩き回って調べていた。
その内の一人が「靴が見つかりました」と言ったのを聞いて、僕は急に恐ろしくなった。
車内にいた乗客たちと違って、僕は線路の状況を自分の目で確認しようと思えばできたのだけど、体が動かなかった。
しばらくして先頭の車両のドアが開き、乗客がホームに降りてきて、ぞろぞろと階段を上がっていった。
僕は自分が何の役にも立たないことを悟って、駅員の一人に「外に出てもいいですか」と聞いてから、階段を上がって外に出た。
外では複数のサイレンの音が響いて、救急車や救助員を乗せた車が到着したところだった。
担架を持った数人の救助員が駅に入って行った。
僕は、何も気づけなかったこと、その場にいて何の役にも立てなかったことを激しく悔やんでいた。
後で聞いたところ、そのとき線路に落ちたのは70歳くらいの女性で、ほどなく亡くなったそうである。
線路に落ちた理由はわからないそうだが、傍に誰かがいたら落ちなくてすんだかも知れない。
そう考えると、心が痛む。
それ以来、僕は駅のホームで本を読んではいない。


上の話とは直接の関係はないが、先日僕の昔の知り合いが亡くなった。
そのことについて、mixi経由で知人から連絡があったが、僕はかなり以前からmixiを利用していなかったのでパスワードがなかなか思い出せず、結局あまり詳しく状況を知ることができなかった。
このブログエントリーでも語られているように、彼はまだ若くて、英気と覇気に溢れ、能力も高い人物だった。
僕が以前に所属していた研究所で、(そのとき彼はまだ学生だったが)一緒に働いていた。
その当時、その研究所には、優秀な研究者や学生がたくさん集まっていて、活気に満ちていた。
僕はそういう環境がとても好きだった。
彼とは仕事(研究)上の接点は特になかったけれど、マシンやネットワークのメンテナンス等でいろいろとお世話になった(当時研究していた対話システムのデモ用のデータを提供してくれたこともあった)。
もし今の僕に彼ほどの能力があったら、僕たちのやっている研究などとっくに実用化していただろう。

彼の急逝についてはにわかには信じられないのだけど、細かいことを詮索するのはやめて、静かに彼の死を悼むことにしよう。
僕がその研究所を辞めてからは会うことはなかったけれど、みんながんばっているんだろうなあと思っていた。
実際、彼の専門分野(インターネットプロトコル)では彼はかなり有名らしい。
志半ばで倒れるのはさぞ無念だっただろうと思う。

itojun、僕は君のことを忘れてはいませんし、これからも忘れないと思います。
君の熱意や真面目さは周りの人にとてもよい影響を与えてきたと思いますから、君の遺志を継ごうとするものはきっと少なくないでしょう。
今は、お疲れさまでした、と言わせてください。
心からご冥福をお祈りします。

投稿者 nagao : 22:09 | コメント (23) | トラックバック

2007年09月03日

ATとWii

ようやくAT9号機が動き出しました。
この一か月間はほとんどそのためだけに費やされました。
そのため、このブログもまったく更新できませんでした。

8月上旬に初めて研究室に持ち込まれた9号機はぴくりとも動かず、まったくどうしようもない状態でした。
その原因を一つ一つ、シーケンサやサーボドライバーなどの部品の製造元と相談して解決していきました(まだ解決されていない問題もいくつか残っています)。

以下は9号機の写真です。
4台のサーボモーター(+減速機)が巨大です。
車輪はオムニホイールです。
また、9号機はWiiリモコンを主要なユーザーインタフェースデバイスとしています。
これは、広く一般に普及しているゲームコントローラを使うことでなじみ易くすることと、ユーザーが自分専用のコントローラを持ち歩いて乗り物に接続することで、操縦に個人性(適切な速度やナビゲーションにおける嗜好性など)を反映させることができる、という効果があります。

at9.jpg

さて、今回9号機に実装されている(されつつある)機能は以下の通りです。

1.Wiiリモコンをコントローラとして(ハンドル部に装着して)操作する8方向移動およびその場回転
2.やはりWiiリモコンを使って(今度は手に持って)行う直感的な遠隔操作
3.RFIDタグとリーダーを用いて行う自動走行
4.9号機の前後左右に取り付けられた無線カメラを利用した4方向同時モニタリング

1は9号機の基本動作です。
9号機は原理的には任意の方位に平行移動できるのですが、4個のサーボモーターの制御がうまくいってなくて、とりあえず、その構造上、比較的簡単に動ける8方向に限定しています。
ちょうどWiiリモコンの十字キーも上下左右斜めの8方向を指定できるようになっているので、これらと対応付けています。
Wiiヌンチャクのアナログスティックや一般のジョイスティックなら任意の方向を指定できるので、ある程度問題が解決したらそれにも対応してみたいと思っています。
ちなみに、その場回転は+-ボタンを押して操作します。
+は時計回り、-は反時計回りになります。

以下の写真はハンドル部に装着したWiiリモコンです。

at9-wii-remote.jpg

2はWiiリモコン内蔵のイメージセンサーと自作した拡張デバイスを組み合わせて、ほぼボタンを使わないで行う操作です。
拡張デバイスには赤外線受光素子が組み込まれていて、IDをエンコードした赤外線を受信してそのIDをデコードすることができます。
9号機の周囲に固定された赤外線LEDを利用して、ATから見たWiiリモコンへの距離と方向を認識することができます。
これによって、より直感的な遠隔操作が可能になります。
たとえば、WiiリモコンをATに向けるとATが自動的にそばに寄ってきて止まります。
また、ユーザーが「見えない棒」を使ってATを引き寄せたり遠ざけたり、左右に振ることで回転させることができます。

以下の写真は、僕が腕に拡張デバイスを装着してWiiリモコンをATに向け、ATを近くまで移動させているところです。

at9-rc1.jpg

at9-rc2.jpg

3は通信距離が比較的長いとされるUHF帯(860MHz~960MHz)のRFID(Radio Frequency Identification)タグとリーダーを用いて、ATが安全に走行できる領域を比較的容易に設定し、人間が細かい操作を行わなくても自律的に走行できるというデモです。
これは、バーチャルウォールと呼ばれる、掃除機ロボット(有名なところではiRobot社のRoomba)が家具などを傷つけないようにするための目に見えない壁の話に似ています。
将来は、人間と乗り物の活動エリアを柔軟に切り分けて、乗り物専用のエリアに人間が生身で侵入すると警告音が鳴り、乗り物は人間専用エリアには侵入できないような仕組みが実装されると思います。
RFIDを用いる必然性は特に無いのですが、タグが無電源で貼る場所を選ばない点(実は多少制約があります)や僕たちにとってなじみ深いデバイスであること(僕が最初にRFIDを研究に使ったのは1995年のことです)から、これを採用しました。

4は以前にAT7号機で利用した無線LAN内蔵ネットワークカメラ4台を今回も利用して、9号機の周囲4方向を同時に撮影して表示するというものです。
この手のカメラは電源をかなり消費するので、ATのようなバッテリーをたくさん積めるような移動マシンは適していると言えるでしょう。
送信された映像と音声は個人の体験をキャプチャするのに利用されます。

以上の仕組みの一般向けのデモを今週の金曜日に名古屋大学で行います。
詳しくは、テクノフェア名大のこちらのページをご覧ください。

興味を持たれた方は、是非、新しいATを体験しにいらしてください。

投稿者 nagao : 20:02 | コメント (234) | トラックバック

2007年07月21日

バランスボードは円盤型がいいと思う

再び任天堂Wiiの話題です。

先日、カリフォルニアのサンタモニカで行われたE3 (Electronic Entertainment Expo) Media and Business Summitというイベントで、任天堂が紹介したWii Fitという健康志向ゲームは、Wiiバランスボードという新しいコントローラを使うらしい(もちろん、僕はこのイベントに参加したわけではなくネットでの見聞によるものである)。
このコントローラは、プレイヤーが上に乗ると、その体重の偏りをリアルタイムに計測してWii本体に無線で送信する仕組みになっているようである。

これは、形状がいかにも体重計のようになっているので、あまり違和感なくその上に乗ることができる(製品化される段階でデザインが変更されるかも知れないが)。
ただ、どうやら右足と左足を置く場所があらかじめ決められてしまっているようだ(E3でのステージデモが最初うまくいかなかったのはバランスボードを逆向きに置いてしまったからではないだろうか)。
向きが決まっているのなら、どう置けばよいのか直感的にわかるような形状になっているのがよいと思う。

あるいは、どう置いても違いがないように設計するのがよいだろう。

つまり、円盤型がよいと思う。
それに、床に置いたらオン、持ち上げたらオフになるようにすればよいので、明示的な電源スイッチなんかいらないだろう。

以前のエントリーATとiPodで書いたけれど、僕のいる研究室で開発している個人用の乗り物ATのコントローラとしてステップホイールというデバイスを作ったことがある(以下の写真を参照)。
これは、直径40cmの円盤で、上に人間(ATの搭乗者)が乗って体を傾け、ATの移動方向と速度を制御するものである。

stepwheel.jpg

同心円上に並べられた8個の圧力センサーの値を常時計測し、最初に乗ったときにユーザーに2~3秒静止してもらってニュートラルポジションを計算し、それとの差分に基づいて体の傾きを検知するのである。
搭乗者は、ステップホイールにどう乗ってもよく、セグウェイのように体を前に向けて乗ったり、スケボーのように体を横に向けて乗ったりできるようになっている。

バランスボードを使ったゲーム(飛んできたサッカーボールをヘディングではね返す)のように、上半身の動きを検出するようには今のところなっていないが、つま先とかかとの圧力バランスや右足と左足の圧力バランス、そして単位時間当たりの圧力の変化量をうまく組み合わせれば何とかできると思う(おそらくバランスボードも似たような仕組みだと思うけれど、ゲーム風景のビデオを見た限りでは非常によくできているみたいである)。
また、Wii FitはBMI (Body Mass Index)と呼ばれる、身長と体重から計算される値(体格指数とも呼ばれる。式は体重(kg)/(身長(m)の2乗))を記録するようになっているので、あらかじめ、身長を登録しているはずだから、その値も考慮して上半身の傾きを計算しているのかも知れない。

ところで、僕は、ステップホイールの上で、片足を軸にしてもう片方の足をすべらせてスライドすると、足を動かした分だけその場回転をするような仕組みも考えていた。
これはiPodのクリックホイールの操作を真似たものだが、バランスボードにも同様の仕組みを取り入れるとよいと思う。

たとえば、この仕組みでメニュー選択ができるようにすればよい。
つまり、メニューモードに移行したら、足をスライドさせて項目を選択、足を浮かせて決定である(決定する場合は、片足を一度浮かせてからつま先をトンとするのでもよいだろう)。
メニュー選択ができれば、Wiiリモコンを一緒に使う必要がなくなり、きめ細かな操作も足でできるようになって、さらに面白くなるだろう。

とりあえずWii Fitが発売されたら即購入して、バランスボードの性能などを試してみたいと思う。

2代目バランスボードを円盤型にしたいとお考えでしたら是非ご連絡ください>任天堂さん。
ちなみに、Wiiリモコンの拡張コントローラを自作する件は何とかなりそうです。
改造したセンサーバーと新型デバイスを使ってリモコンの位置と向きを認識する仕組みが完成したら、このブログでお知らせします。

投稿者 nagao : 22:58 | トラックバック

2007年07月08日

講演会のお知らせ

今週の火曜日に名古屋大学で以下のような講演会が行われます。
講演者は私です。

最近は、講義か学会発表ばかりだったので、一般の人向けの講演はかなり久しぶりです。
できるだけ実例を多く紹介して、専門外の人にもわかりやすい話をしようと思います。
おそらく講演の半分くらいの時間はデモをやっていると思います。
ご興味のある方は、奮ってご参加ください。

************情報処理学会東海支部主催講演会のご案内***********

日  時: 平成19年7月10日(火) 15:00~17:00
場  所: 名古屋大学 IB電子情報館 東棟 大講義室
      地下鉄名城線 「名古屋大学」駅下車 3番出口すぐ
http://www.nagoya-u.ac.jp/camp/map_higashiyama/の[66]の東側)

講演題目:「Webコンテンツの高度利用 -アノテーションとトランスコーディング-」

講  師: 長尾 確(ながお かたし)
      (名古屋大学 情報メディア教育センター 教授/情報科学研究科 メディア科学専攻 併担)

概  要:
近年、Webコンテンツはますます多様になり、その利用価値も高くなっている。
もはや、Webに載っていないコンテンツは世の中に存在しないものと認識されることも多くなっている。
しかし、相変わらず、意味的な検索は困難であり、要約や翻訳などの精度も不十分である。
さらに、映像コンテンツも大量にネット配信されるようになったが、単純な視聴以外の利用法には特に新しいものがない。
本講演では、Webコンテンツを知的に高度に利用するための仕組みについて解説する。
また、一般公開されている新しい映像コンテンツサービスとしてSynvieを紹介する。
これは、映像コンテンツをこれまで以上に効率よく検索・視聴するための仕組みであり、映像関連のビジネスを考えている人には大いに参考になると思われる。

参  加:参加費無料(参加資格は問いません)
     会場準備のためなるべく事前にお申し込みください。
     お名前、所属、連絡先(お電話、e-mail)を以下申込先に
     EmailまたはFAXでお送りください。

申込先:社団法人 情報処理学会東海支部 事務局
〒460-0003 名古屋市中区錦2-17-21(株)NTTデータ伏見ビル内
TEL:(052) 204-4517 FAX:(052) 204-4783
E-mail: ipsj_tsj@tcp-ip.or.jp

主  催:社団法人 情報処理学会 東海支部

ポスターは、http://www.ipsj.or.jp/sibu/tokai/よりダウンロードできます。

投稿者 nagao : 01:33 | コメント (14) | トラックバック

2007年06月03日

人工知能の未来を考えるブレインストーミング

僕は、今月の20日から宮崎シーガイアで行われる人工知能学会第21回全国大会のプログラム委員長をしています。
全国大会というのは、学会の会員向けサービスの一つで、会員なら誰でも(一応、内容が適切かどうかのチェックがありますが)研究発表の機会が与えられ、優れた研究は学会の名によって表彰されるという、学会にとって最も重要なイベントなのです。

今回の大会では、有名なプログラミング言語Rubyの開発者まつもとゆきひろさんの招待講演もあります。

といっても、例年特に盛り上がりもなく、ただ淡々と「集まって、発表して、発表が終わったら適当に観光して帰る」という普通の会議になってしまうことも多いのです。

それで、今年はちょっと目新しいことをやってみようと思いました(ちなみに、昨年は「研究者の人生ゲーム」というイベントが行われて、そこそこ盛り上がったそうです)。

全国大会は300人以上が集まる会議ですが、そこで大規模なブレインストーミング(といっても実際はゲームみたいなもの)をやってみようと思います。
題して「2夜連続ナイトセッション・超ダートマス会議」。
「ダートマス会議」というのは、人工知能の黎明期の1956年に行われた有名な会議の名前です。

その有名な会議は1カ月間にもおよぶブレインストーミングを行い(ただし、複数の小規模ワークショップを順次開催)、「人工知能」という名称を定め、研究の基礎となる多くのアイディアを提示したのでした。

そのダートマス会議を超えるような画期的なブレインストーミングをやろう、という意気込みで「超ダートマス会議」という名前をつけました(「ダートマス」というのは会場となった大学の名前なので、「シーガイア会議」でいいんじゃない、と言ったら却下されました)。

さて、超ダートマス会議の内容は、無敵会議と呼ばれる形式によるブレインストーミングです。
無敵会議とは、あるテーマに基づいてお題を出し、その答えの優劣を競って最終的に優秀者(優秀者には豪華賞品が贈呈されます)の発表を聞いて議論する、というものです。

お題とは、たとえば、以下のようなものです。

次のカッコ内を埋めよ。

2100年、人類の英知を極めた「(     )システム」は、
人類史上初の(              )を達成し、
人類の悲願であった(           )という難問を解決した。
ちなみに、それは、あなたが2017年に発表した
(                    )に関する研究成果が
きっかけであることは知る人ぞ知る事実である。

みなさんの答えはいかがですか。

ちなみに僕のはこんな感じです。

2100年、人類の英知を極めた「(無限記憶)システム」は、
人類史上初の(人間の記憶容量の無限大化)を達成し、
人類の悲願であった(物忘れをなくす)という難問を解決した。
ちなみに、それは、あなたが2017年に発表した
(ものぐさな人のための自動ライフロギングシステム)に関する研究成果が
きっかけであることは知る人ぞ知る事実である。

このセッションに込めた僕の意図は、「今後10年かけて少なくとも100年残るものを作る」ための(特に人工知能に関連する)研究を盛り上げることです。
やはり、今後の研究を大きく盛り上げるためには、若手研究者たちの意欲を高いレベルで維持していくことが必要だと思っています。
てっとり早く成果を出すために、すぐに論文になりそうな安易な(海外ではすでに盛り上がっている)研究テーマを選んで、ほんの少しの新規性をアピールして満足しているような研究では、100年生き残るような成果は出せないでしょう。
一人一人がパイオニア精神を持ってアイディアを練り、独りよがりにならないように共通の目的意識を持った人たちとじっくり議論して(ついでに言えば、僕たちの仕組みのように議論内容をうまく活用して)、慎重に研究テーマを決めて、真面目に腰を据えて研究を行っていけば、きっと100年残る研究成果を出せると思います(もちろん、僕もそのつもりで研究を行っています)。

これを読んで興味を持たれた方は、是非、全国大会および超ダートマス会議にご参加ください。

投稿者 nagao : 23:42 | コメント (1718) | トラックバック

2007年04月15日

大学院生募集のお知らせ

名古屋大学 大学院情報科学研究科 メディア科学専攻 長尾研究室では、2008年4月入学の大学院生を募集しています。
もちろん、入学試験を受けなければならないのですが、学部入試に比べて大学院入試ははるかに楽だと思います。
だから、特にやりたいことがなくても大学院は東大に行って、最終学歴を東大にしようという人がいるようです。
これを学歴ロンダリングと言うそうです。

名古屋大学はあまり学歴ロンダリングに向いていないかも知れませんが、キャンパスもきれいで建物も新しいですから、新しいことを始めるのになかなかよい雰囲気のところだと思います。

実は、私はこれまであまり学外からの学生の勧誘をやってきませんでした。
それは、いい研究をやっていれば自ずと人が集まってくると思っていたからです。
しかし、現実はなかなか厳しくて、名古屋大学は知っていてもここの研究科や専攻は知らなかったり、たとえ知っていても「画像をやりたい、音声をやりたい」なんていう「メディア科学といえばパターン認識」的な希望の人が多くて、私のところのような「一風変わった」研究室を希望する人はあまりいないようです。

それで、今回はこのブログで来年度の入学希望者を募集しようと思います。

入学を希望される方には以下の特典があります。

1.大学院入試から入学準備までのアドバイスをします。
2.希望があれば研究室の雰囲気や活動を体験できます。
3.入学後の研究・学習プランについて相談に乗ります。
4.卒業後の就職の相談も可能な限り受け付けます。

大学院でITの未来につながるいい研究をしたい人、今の大学とは違う環境で研究をしたいと思っている人、このブログを読んで研究に興味を持った人、などなど、ご応募お待ちしています。

ご連絡は、メールでお願いします。
メールアドレスは、nagao@nuie.nagoya-u.ac.jpです。
どうぞよろしくお願いします。

投稿者 nagao : 16:03 | コメント (205) | トラックバック

2006年04月01日

このブログを読んでいる方へ

はじめまして。長尾氏の代理のものです。
実は、長尾氏は以前からひいていた風邪をこじらせ、気管支と肺に炎症を起こし、また職場のことでかなり精神的に苦しんでおり、強いストレスがあり、現在、自宅付近の病院に入院しています。
彼は口癖のように「ブログを書かなきゃ」と言っていました。
2ヶ月間もこのブログを書かなかったことを非常に残念に思っている様子でした。
「書くネタはあるんだ。ただ、途中から人の悪口になってしまい、載せられなくなるだけ」とか言っていました。
先ほど彼の見舞いに行きましたところ、しきりに「今日は何月何日だ」と聞いていました。
少々記憶が混乱しているようです。
今後いつ再開できるかもわからない状態ですが、温かい目で見守っていただけますと幸いです。
どうぞよろしくお願いいたします。

投稿者 guest : 12:23 | コメント (6)

2006年01月22日

ワードローグという試み(その5)

Wordlogue Data
オントロジーが構築できれば、情報の意味を厳密に記述できるので、いろいろと役に立つことは間違いないですが、問題は、この構築と保守(変化に対応して修正し続けること)のコストが非常に高いことです。
そこで、ワードローグ、ソーシャルブックマーク、有名なWordNetのようなオンライン辞書などを連結していく作業によって、副産物的にオントロジーを作ってしまいたいと思うわけです。
オントロジーは正攻法で作ろうと思ったら気が遠くなりそうですが、いろいろやっていたらいつのまにかできていた、という話にすればあまり無理はないような気がします。
もちろん、そんなものが偶然できるとは思えませんので、データが集まれば集まるほど、言葉に隠れている概念のマップが具体化されていく仕組みをあらかじめ作っておかなければなりません。
また、データが集まるためには、その作成者にとっての明確なメリットがなければなりません。
まだありがたみがよくわからないと思いますが、現在のソーシャルブックマークタグ以上のことがワードローグを使ってできるようになります。
たとえば、大量のワードローグを連結したネットワークに基づいて、より正確な語彙の分布図が描けるでしょう。
これによって、日本中でよく使われている(ただし、ブログの中で)言葉やそれに関連する概念が何なのかよくわかるようになります。
それは、単に検索キーワードをかき集めてもわかることではありません。
なぜなら、誰かが調べたいと思った言葉と、誰かが実際に書いている言葉では、後者の方がの考えをよく表していると思われますし、さらに、ある言葉が暗黙的に参照している言葉(あるいは概念)などは、検索の履歴を眺めてみてもわかるものではありません。
つまり、現実をより詳細に描写する手段として、ワードローグおよびそれによって描かれるマップが使われるようになるでしょう。
これからワードローグのさまざまな使い方について考えていきます。
使いようによっては、かなり面白いことができるようになるでしょう。
ちなみに、誰からも質問がありませんでしたが、グラフのバーのは、ソーシャルブックマークに10個以上の記事が登録されているタグと一致する場合に緑、エントリー内の出現・被参照頻度が5以上の場合に赤、それ以外は青になっています。

投稿者 nagao : 02:35 | コメント (203) | トラックバック

2006年01月21日

ワードローグという試み(その4)

Wordlogue Data
さて、ワードローグには次のような特徴とそれを利用した応用があります。
ワードローグは、それ自身一種のコンテンツと考えることもできますが、あくまでブログエントリーのメタデータという位置づけです。
また、それは単純な構造であるために、その足し算や引き算が容易です。
足し算とは、複数のコンテンツを結合して一つにしたときに、一つ一つに関するワードローグを足し合わせたものは、合成されたコンテンツのワードローグになっているということです。
たとえば、の各章のワードローグを足し合わせると、全体のそれになるということです。
このようにメタデータ同士の演算を定義できるでしょう。
引き算に関しては、少し解釈が必要ですが、コンテンツの差分のワードローグは、それらの引き算によって計算できるということです。
ただし、コンテンツの差分とは、一方で語られていて、他方で語られていない内容とは限りません。
差分(重複分も)について厳密に考慮するためには、語と語の間の意味的な関係を考えなければなりません。
語間の関係には、同じような概念や事象を表しているという類義関係と、一方が他方の抽象化になっているという階層関係、さらに一方の表す概念に他方の表す概念が意味を追加・補足・限定する依存関係などがあります。
このような語間の関係を明確に定義することで、ワードローグにおけるメタデータ演算もより厳密なものになります。
そして、この作業の延長線上にオントロジーの構築という話があります。

投稿者 nagao : 20:58 | コメント (193) | トラックバック

2006年01月18日

ワードローグという試み(その3)

Wordlogue Data
言語的アノテーションは、いわゆるフォークソノミーと、オントロジーと呼ばれる概念体系の構築の間をつなぐ作業だと言えるでしょう。
その理由は、ただ漠然とキーワードを決める以上の、意味的な操作が必要であり、照応や省略を処理する上で、言語的内容に含まれる抽象的な概念についても多少は考慮する必要があるからです。
ただし、オントロジーの構築のように、そのような概念を明示化して詳細に記述するところまでは要求されませんから、比較的敷居も低く、一般でも十分に作業を行うことができます。
もう少し技術が進めば、言語的アノテーションもさらに簡単なものになるでしょう。
しかし、本質的なことは、人間の介入の必要性はなくならないということです。
それは、言葉の意味の理解というオープンエンデッドな問題が、完全に自動化されることはないからです。
言葉はその成り立ちから見ても、人間記憶に強く依存しています。
人間言葉を発明したときに、に蓄えられた記憶の一部を取り出して外在化(あるいは記号化)させました。
しかし、当然ながら記憶のすべてを外在化させたわけではありません。
その場合、言葉はその使用者の記憶から少し抽象化(あるいは部分化)された文脈を持つことになります。
そして、たくさんの言葉共有することによって、どんどんその抽象度が上がっていきます。
そうなると、実際にその言葉を受け取ったは、抽象化されたその言葉の文脈を自分記憶で好き勝手に補ってしまいます。
そういう、の勝手な補完によって言葉の意味は伝達されていくのです。
ですから、言葉そのものには必ず何か抜け落ちた意味があるわけです。
それを補えるのは、十分な記憶を持つ人間だけですから、言葉の意味の処理を完全に機械に行わせることはできないのです。
記憶が先か言葉の意味が先か、という、にわとり卵論争になってしまいますが。
そういうわけで、言語的アノテーションは、技術の発展や知識の蓄積によって、簡単化されていくと思いますが、いつまでたっても完全に自動化されることはないだろうと思います。
もちろん、厳密さをある程度犠牲にするならば、人間の作業をまったく必要ないようにすることは可能でしょう。

投稿者 nagao : 00:54 | コメント (250) | トラックバック

2006年01月17日

ワードローグという試み(その2)

Wordlogue Data
しかし、出現頻度順に並べた語彙列によって明確になったエントリーの特徴に違和感を感じることもあるでしょう。
ブログの内容を一番よくわかっているのはその書き手だと思いますが、書き手からみて、そのエントリーにおいて間違いなく重要だと思われる語の頻度があまり高くない場合があり得ます。
それは、同じ言葉を何度も使わないことがあるからです。
たとえば、「ワードローグは画期的である。なぜなら、それは単純な頻度以上の情報に基づいているからである。いちいち説明しなくても、使ってみればよくわかる。」という文章を考えてみましょう。
ここで「ワードローグ」は重要な語ですが、1度しか現れません。
しかし、2文目の「それ」は「ワードローグ」を指しますし、3文目の「使ってみれば」の省略された目的語は、やはり「ワードローグ」です。
つまり、この文章では、この言葉(あるいは、この言葉が指す概念)が少なくとも3回出現していると考えることができます。
このような照応(代名詞等の参照)や省略を考慮するために、形態素解析されたテキストにさらに言語的な情報を加えます。
これを言語的アノテーションと呼びます。
ワードローグでは、この言語的アノテーションを容易に行うためのツールを提供しています。
ちなみに、形態素解析は有名な茶筌(奈良先端大が提供しているフリーソフト)を使っています。
言語的アノテーションを行う仕組みは、形態素解析を行ったり、ソーシャルブックマークタグと照合したりするWebサーバーと、解析結果を操作するWebクライアントに分けられます。
言語的アノテーションは、ちょっとだけ面倒ですが、それ以外は簡単ですよね。
それから、ワードローグはただグラフを作成するだけでなく、その情報を他のに伝達するためのRSSデータも生成します。
いろいろなブログでこのデータを生成して交換すれば、似たようなブログエントリーを見つけたり、大量のテキストコンテンツを瞬時に分類したりすることが可能になるでしょう。

投稿者 nagao : 03:22 | コメント (178) | トラックバック

2006年01月15日

ワードローグという試み(その1)

Wordlogue Data
今回のエントリーから、新しい仕組みを導入します。
ブログのエントリーの内容を大雑把に表現する、複数のキーワードのエントリー内の出現頻度を表す棒グラフを表示します。
これは単純に「同じ言葉が何回出てくるか」ということではなく、その語が表現している概念が同じエントリー内で何回参照されているかということです。
この仕組みをワードローグ(Wordlogue)と呼びます。
この言葉は、個人の語彙力を表すワードローブとログをかけています。
また、ローグには「ことば」という意味があり、モノローグやダイアローグという単語にも現れています。
一般ブログのエントリーは、カテゴリーによって分類されています。
しかし、カテゴリーがエントリーの内容を適切に表しているとは限りません(このブログも然り)。
あるブログを読むかどうか決めるときに、その概要があると便利ですが、(まともな)概要の自動生成は一般に非常に困難です。
概要生成の本質的なむずかしさは重要キーワードを見つけることよりも、文章を生成する部分にあります。
そこで、文生成はとりあえず今後の課題として、重要キーワードを比較的容易に見つける方法を考えてみました。
それはブログエントリーのテキストに含まれる語を頻度順に並べるというものです。
このとき、助詞や接続詞などのいわゆるストップワードは除外します。
また、最近はソーシャルブックマークのようにブログを含む任意のWebページを分類するキーワード共有するサービスも公開されていますので、それも利用することにします。
つまり、ソーシャルブックマークに登録されたタグと形態素解析によって分割された要素を照合し、照合したタグに関連した記事の数の語の重要の一つの評価基準とします。
形態素解析は、必ずしも書き手の意図通りに文を分割してくれるわけではありませんから、必要以上に分割されてしまった複合語(たとえば、「名古屋大学」が「名古屋」と「大学」に分割されてしまった場合)は、それらが一つの語であることを教えてやります。
そして、テキストから語がすべて抽出されると、それらの出現頻度をカウントし、頻度順に並べて棒グラフを生成します。
こうすると、かなりそのエントリーの特徴がわかってきます。

投稿者 nagao : 14:17 | コメント (50) | トラックバック

リニューアル

こんにちは。
「常に酔っぱらっているんじゃないかという話し方をする(らしい)」長尾です。
ブログのデザインを一新しました。
そのうち、また長い話を書こうと思いますが、
その前にちょっと新しいことをやろうと考えていますので、
ご期待ください。

清水さん、(前のエントリーへの)トラックバックありがとう。
今後ともよろしく。

投稿者 nagao : 05:31

2005年11月06日

ATとiPod

以前にもここに書きましたが、僕のいる研究室では、ATと呼ばれる、情報化された、個人用の電動の乗り物を作っています。

実は、11月11日(次の金曜日)に、テクノフェア名大という一般の人向けのイベントが名古屋大学で開催され、そこでATのデモをやる予定なのです。

当日の公開内容は、以下の通りです。
1. AT8号機の試乗、
2. ヒューマントレーサ(ATを降りた搭乗者をATが追いかける仕組み)のデモ、
3. AT間コミュニケーション(2台のATの間でメッセージや映像・音声、位置情報などを送り合う仕組み)のデモ、
4. 追体験支援(ATユーザーの体験を記録・共有・閲覧可能にし、同様の体験を他者がしやすいようにする仕組み)のデモ、
5. ATプレイリスト(音楽などのコンテンツを搭乗者の状態に合わせて選択し、提示する仕組み)のデモ

まったく類似性が見い出せないと思いますが、実は、ATはiPodを意識して設計されています(ちなみに設計者は僕です)。

iPodは音楽プレイヤにシンプルさと使いやすさにおいて革新的な変化をもたらしたと言えるでしょう。
それと同様のことを、個人用の乗り物にもたらしたいと思ったわけです。

たとえば、ATにはステップホイールという仕組みがあります。
これは人が円盤状のプレートの上に立つと、ATがその人の体重の偏りを検出して、前進・後退・回転などの走行制御を行うものです。
名前から明らかですが、これはiPodのクリックホイールを意識しています。

以下の写真をご覧ください。

stepwheel.jpg clickwheel.jpg

左がステップホイールで、右は言わずと知れたクリックホイールです(ちなみに、あたりまえですが大きさは全然違います)。

ステップホイールは小型の乗り物の操縦に新しい面白みを加えようという意図で作られています。
それはちょうど、クリックホイールがiPodの操作そのものを楽しくさせているのに似ている(と勝手に思っています)。

また、ATにはプレイリスト機能があります。
これは操縦者や走行速度(急いでいるか、ゆっくりか)に応じて、適切な音楽プレイリストを選択して、音楽再生を行う仕組みです。
ATを降りると音楽を一時停止し、再び乗り込むと続きを再生する仕組みもあります。
つまり、音楽環境を持ち歩くのではなく、人が音楽環境に入り込んで一体化し、共に移動するということです。
近いうちに、ATの提供する音楽が搭乗者の気分とシンクロして盛り上げてくれるようにすることができると思います。

いまや音楽は人の生活にかなり密着しているように感じられます。
また視聴環境は個別化し、ライブコンサートやラジオ番組などを除いて、複数人で同時に同じ音楽を聴くという状況もだいぶ少なくなったと思います。
だから、個人ごとの専用の音楽環境が常にその人についてまわるというのはごく自然のことのように思えます。
そのような環境を作り出すのに、搭乗者を識別する個人用の乗り物というのは非常によくマッチするのではないかと思うのです。

ATを体験したいと思った方は、是非、11日のテクノフェア名大にお越しください。

詳しくは、このWebサイトをご覧ください。

投稿者 nagao : 21:59 | コメント (23) | トラックバック

2005年09月24日

未踏ソフトウェア創造事業に応募しませんか

僕は、IPA(正式名称は、独立行政法人 情報処理推進機構)の推進する「未踏ソフトウェア創造事業」のプロジェクトマネージャをやっています。

僕の仕事は、一般の応募の中から、チャレンジングで面白そうなプロジェクト提案を採択して、いくら資金を出すか決め、プロジェクト進行中にいくつかのアドバイスをして、うまい着地点を定めて、あとは(主に精神的に)プロジェクトに関わる開発者を応援する、というものです。

是非、これを読んでいるみなさんに応募していただきたいと思います。
公募要領は、以下のページにあります。
http://www.ipa.go.jp/jinzai/esp/2005mito2/youryou.html

僕がいつも思っていることは、まず、自分には無限の可能性があると思い込むことが大事だということです。
めんどくさいからいいや、とか、どうせやったってろくなことはない、とか思う人は、そう思ったことですごく損をしてしまっている気がします。

どんな提案がよくて採択されやすいかということは明確な基準はありませんが、以下のことに気をつけるとよいと思います。

1.日本語(英語でもよいですが)をちゃんと書くこと。
提出する前に、一度、(できれば声に出して)内容を読んでみるとよいと思います。
2.自分なりのストーリー(構想、企画、展望など)をできるだけ簡潔に書くこと。
これは他のやつにはなかなか思いつかないだろ、なんていう気持ちが見え隠れしている提案書は読んでいて気持ちがよいです。
3.予算額が大きすぎない(内容とのバランスを考える)こと。
設備投資もそれなりにかかると思いますが、ソフトウェアの開発に一番お金がかかるのは人件費でしょう。
だから、やりたいこととそれに必要な人数とのバランスを考えて予算額を決めてください。
一人しかメンバーがいないのに1000万円を越える提案はなかなか採択できません。

締め切りは今度の金曜日です。

気になっていることがあったら、コメントしてください。
答えられる範囲でお答えします。

せっかくの機会だから、自分の力を試してみましょう。

投稿者 nagao : 19:08 | コメント (26) | トラックバック

2005年09月13日

今、本を書いています

今、デジタルコンテンツに関する新しいテクノロジーについての本を執筆しています(正確には、学生や知り合いとの共同著作です)。
実は、かなり以前から書き始めているのですが、書きたい内容が錯綜していて、なかなか筆が進まないのです。

想定する読者は、大学・企業の情報技術に関わる研究者(学生を含む)やコンテンツビジネスに関わっている人たちです。

いろいろ考えた結果、内容としては、以下のものになる予定です(全体で300ページくらいにする予定)。

1. テキストコンテンツ
 ドキュメントの構造化(XML)、
 メタデータ(Dublin Core、RDFなど)、
 言語構造とテキストアノテーション(GDA、WordNet、
 文解析、語彙解析、アノテーションエディタ)、
 テキストトランスコーディング(要約、翻訳、音声化、言い換え)

2. ビデオコンテンツ
 ビデオの構造化(音声・映像解析)、
 ビデオアノテーション(MPEG-7、Annodex、VAE、SVAなど)、
 オンラインビデオアノテーション(iVASなど)、ビデオ検索、
 ビデオトランスコーディング(ビデオ要約、ビデオ翻訳)、
 ビデオとテキストの統合(ビデオブログ)

3. 音楽コンテンツ
 音楽の構造化(GTTM、MusicXMLなど)、
 音楽アノテーション(MiXAなど)、
 楽曲検索、プレイリスト

4. 辞典コンテンツ
 オンライン辞典(Wikipediaなど)、辞典の構造化、
 辞典アノテーション、辞典コンテンツからのマイニング

5. 会議コンテンツ
 会議のコンテンツ化、会議の構造化、
 会議コンテンツの利用、ディスカッションマイニング

6. 体験コンテンツ
 体験のコンテンツ化(ライフログなど)、体験の構造化、
 体験共有とプライバシー、体験の編集と統合

7. 個人とコンテンツ
 コンテンツのパーソナライゼーション、
 パーソナルコンテンツ配信(ブログ、Podcastingなど)、
 ライツマネージメント(Creative Commonsなど)、
 フィードとシンジケーション(RSS/Atom、アグリゲータなど)

8. 社会とコンテンツ
 ソーシャルネットワーキングサービス(mixiなど)、
 ソーシャルブックマークとリコメンデーション、
 人間関係のマイニング、トラストとセキュリティ

9. 知的なコンテンツ
 コンテンツのセマンティクス、オントロジー、
 セマンティックウェブ、知識発見

あと2, 3年程度ですたれてしまいそうな内容はできるだけ書かないようにしたいと思っています(mixiが3年後まだ残っているかはあまり自信がないですが)。
少なくとも内容の半分くらいは、僕が直接関わっている技術に関するものです(だから上のリストには一般にはまだ知られていない用語が含まれています)。
僕と無関係の人が考えたもの・作ったものでも、僕が解釈をし直して解説しているものもあります(ライフログ、セマンティックウェブなど)。

この本はオンライン版と紙版の2バージョンを出そうと思います。
完成したらこのブログでもお知らせしたいと思いますが、その前に、「このトピックは押さえておくべき」というのがありましたら是非教えていただきたいと思います。

投稿者 nagao : 07:09 | コメント (13) | トラックバック