« 2005年08月 | メイン | 2005年10月 »

2005年09月24日

未踏ソフトウェア創造事業に応募しませんか

僕は、IPA(正式名称は、独立行政法人 情報処理推進機構)の推進する「未踏ソフトウェア創造事業」のプロジェクトマネージャをやっています。

僕の仕事は、一般の応募の中から、チャレンジングで面白そうなプロジェクト提案を採択して、いくら資金を出すか決め、プロジェクト進行中にいくつかのアドバイスをして、うまい着地点を定めて、あとは(主に精神的に)プロジェクトに関わる開発者を応援する、というものです。

是非、これを読んでいるみなさんに応募していただきたいと思います。
公募要領は、以下のページにあります。
http://www.ipa.go.jp/jinzai/esp/2005mito2/youryou.html

僕がいつも思っていることは、まず、自分には無限の可能性があると思い込むことが大事だということです。
めんどくさいからいいや、とか、どうせやったってろくなことはない、とか思う人は、そう思ったことですごく損をしてしまっている気がします。

どんな提案がよくて採択されやすいかということは明確な基準はありませんが、以下のことに気をつけるとよいと思います。

1.日本語(英語でもよいですが)をちゃんと書くこと。
提出する前に、一度、(できれば声に出して)内容を読んでみるとよいと思います。
2.自分なりのストーリー(構想、企画、展望など)をできるだけ簡潔に書くこと。
これは他のやつにはなかなか思いつかないだろ、なんていう気持ちが見え隠れしている提案書は読んでいて気持ちがよいです。
3.予算額が大きすぎない(内容とのバランスを考える)こと。
設備投資もそれなりにかかると思いますが、ソフトウェアの開発に一番お金がかかるのは人件費でしょう。
だから、やりたいこととそれに必要な人数とのバランスを考えて予算額を決めてください。
一人しかメンバーがいないのに1000万円を越える提案はなかなか採択できません。

締め切りは今度の金曜日です。

気になっていることがあったら、コメントしてください。
答えられる範囲でお答えします。

せっかくの機会だから、自分の力を試してみましょう。

投稿者 nagao : 19:08 | コメント (26) | トラックバック

2005年09月18日

モノトニックな編集

誰もが百科事典の執筆者になれるWikipediaのすごさは、その創設者であるジミー・ウェールズの次の言葉に表れていると思う。
「書いた記事をそのまま残す唯一の方法は、正反対の立場の人間でも納得するようなものを書くということだ」(朝日新聞社刊「ブログ 世界を変える個人メディア」より)

誰にでも編集できるドキュメントをネット上に残すということは必然的に中立で公正で正確なものにせざるを得ないということらしい。

これは僕にとって衝撃である。
僕はWikiの思想が嫌いなのだが、その理由は、まさにその「誰にでも編集できる」という点だったからだ。
世の中には悪意を持った人間が必ずいる。
そして悪意を持った人間が匿名という隠れ蓑をかぶるとたいていろくでもないことをする。
そんな人間がうようよいる中で、Wikiなんかやったら「どうぞ荒らしてください。気に入らない文章を改ざんするのもご自由に」と言っているのと同じだと思っていた。

でもそうじゃないというわけね。
Wikipediaでは、ボランティアの力で、悪意を持った人たちの暴挙を見つけては修復するという作業を延々と繰り返し、そういう人たちがあきらめて去っていくのを待つ、という戦略をとっているらしい。
200人ほどが常時チェックし、1000人くらいが継続的に書き込んでいるそうだ。

多くの人間の自発的な努力で、公正で正確な情報を生み出して共有するという仕組みはまったくすばらしい。


いや、ちょっと待てよ。
人間の生み出すもので、真に中立で公正なものなんて本当にあるのだろうか。
正反対の立場の人間でも納得できる文章なんて本当に書けるのだろうか(ディベート慣れしている人間なら書けるのかも知れないけれど)。

複数の立場からの解釈や意見を書き、あえてそれらに対する評価(優劣をつける、など)を書かない、というならば理解できるけれど、それでは、その文章を書いた人の考えや伝えたいことはどこにあるのだ、と思ってしまう。
文章を書く人間が常に中立でなければならないなんて、窮屈でしょうがないじゃないか。

つい先日行われた第44回衆議院議員総選挙は、客観的な事実のみで説明しても、その本質を伝えるのは困難だと思う。
衆議院の総議席の3分の2を与党(しかも、ある法案への反対者を造反者と呼ぶような政党)の議員が占めることの危険さは、実際にその影響が目に見える形で現れるまでは憶測でしか語ることができない。
事実としては、しばらくは参議院がもう意味をなさない、ということだけだ。
でも、もし、たとえば人権擁護法案などが十分に議論・推敲されないまま可決され施行されたとしたら、国益を害すること著しいだろう。
そうなったら、本当にこの国はやばいと思う。
それにしても、今回の選挙でわかったことは、自民党や公明党はひたすらあざとくて、民主党はひたすら愚かだということだろう。
僕が投票した選挙区の近くでは、「カリスマ主婦」とかいう人が約8万8千票を獲得した(小選挙区では落選したが、比例で当選した。自民党の東海ブロック1位だから当然だが)。
この人は料理研究家だそうだが、そんなの政治には関係ないじゃないか。
人気があるのはわかるけど、話していることを聞いても、政治に関わる動機付けが弱すぎる。
参議院ならまだ許せるけど衆議院である。
以前からそうだけど、本当に自民党(に限らないが)は有権者をなめている(8万8千人も投票するんだから、なめられても仕方がない気がするけれど)。

閑話休題。

やはりWikiの仕組みでは、人間の労力がかかり過ぎてダメな気がする。
常時チェックしている人が何人もいるとしても、バージョン管理をしているにしても、万人が同じコンテンツを自由に編集可能にするのは全体の負担が多過ぎるし、そもそも何か大事なものを失ってしまう気がする。

一般的な編集の問題は非単調(ノンモノトニック)なことだ。
これは、前にやったことを次にやることがひっくり返してしまう(あるいは、なかったことにしてしまう)ことである。
たとえば、校正や推敲という行為は、誤りを直したり、表現を改めたりするわけだから、必然的にノンモノトニックになってしまうじゃないか、という人がいるかも知れない。
しかし、これは比較的短期間において、一人の人間が、自分の書いた文章に対して行うものだと思う(もちろん、例外はあるだろうけど)。
ここで問題にすべきは、不特定多数の人間が非同期に作成するドキュメントに関することであり、必然的にその編集の形態はこれまでとは変わっていくべきだと思う。
また、たとえ同じ人間でも、時間がたてば考え方が変わるかも知れないから、違う人間として扱ってもよいのではないかと思う。

これと反対の概念が単調(モノトニック)である。
これは、前にやったことを変えずに次のことをやることであり、以前の文章を削除したり書き換えたりせずに、次の文章を書き加えていくことに相当する。
「Aである」と書いてあるところに、「Bである」と書きたいとき、「Aである。いや正しくはBである」と書くのはモノトニックだが、「Aである」を削除して「Bである」と書くのはノンモノトニックである。

和歌の上の句と下の句を別の人が詠む連歌というものがあるが、これもモノトニックな編集(ここでいう編集は創作を含むものとする)の一例である。

バージョン管理しているんだから、削除しても戻せるから、それでいいじゃないか、と思うかも知れないが、そうではない。
たとえ、「Aである」が削除されて「Bである」が入力されたという履歴が残されていたとしても、「AとBの中間である(実は、これが一番適切だとする)」と書こうとしている人にとって、あまりうれしい情報ではないのである。
たとえば、「Bである」の状態なら、Aの説明もした上で「AとBの中間である」と書くわけだし、履歴を使って「Aである」の状態に戻してからなら、Bの説明もした上で「AとBの中間である」と書くことになり、どちらにしてもあまりうれしくないのである。
どうせなら、AとBの両方の記述が残っていたほうが書きやすいのに、と思ってしまうだろう。
つまり、バージョン管理は一般に木構造を構成し、各バージョンは枝分かれの節点となる。
一般に、分かれてしまったものを再び統合するのは容易ではないのである。

では、すべての編集をモノトニックにやる方法はないだろうか。
上の例では、「Aである」も「Bである」も「AとBの中間である」もすべて書き、いずれの書き込みもそれ以外のものを削除して行うものではない、ということである。

ただ単に、すべて書き、何も削除しない、ということではまずい。
書き込みの間の依存関係がわからなくなってしまうからだ。
多くの場合、複数人の書き込みには何らかの依存関係がある。
この場合の依存関係は、新しい書き込みが以前の書き込みを訂正したり、補足したり、批判したり、反駁したりする、などの関係である。
これらの依存関係を維持しつつ、すべての情報を読み手が混乱しないように残しておく仕組みは考えられないだろうか。

僕らの考えている仕組みはそれを可能にすると思っている。
それはアノテーションとトランスコーディングに基づくものである。
アノテーションは新しい書き込みの内容と、すでにある書き込みとの依存関係を同時に表現することができる。
それぞれの書き込みごとにレイヤーがあって、それらが重なっているというイメージで、レイヤー間に依存関係が定義される。
これはWebページ内の任意の箇所へのコメント付与として実現されているものがある。

これだけだと、ただ重なっているだけで大変読みにくいので、自動的に、依存関係のあるものをまとめて、整理して表示する必要があるだろう。
これはトランスコーディングと呼ばれる仕組みで行う。

トランスコーディングについては、いろいろなところで話したり書いたりしているのだが、今ひとつ浸透していない。
要するに、コンテンツがユーザーに届けられる過程で、アノテーション等のメタコンテンツをオンデマンドに統合してコンテンツを動的に変換する技術である。
もちろん、クライアントが十分にリッチであれば、すべての情報を取り込んでから、表示すべき内容をインタラクティブに決めればよいのであるが、読むという作業と決めるという作業を同時に行うのは結構負担がかかるから、できれば、読んでいる途中の段階ではいちいち選択したくないだろう(ハイパーテキストがいまいち読みにくいのはこのためだと思われる)。

そういえば、ハイパーテキストの発明者であるテッド・ネルソン(ちなみに、Webの発明者ティム・バーナーズ=リーはハイパーテキストに触発された自らの着想について彼の意見を伺っていたらしい)が慶應SFCで行った研究にトランスパブリッシング(transpublishing)というのがあるが、これがまさにモノトニックな編集を実現しようという試みだった。
これは、ネットワーク上での著作物に関する著作権問題を解決するために、著作物の利用をコピーではなく特殊な引用(それをtransquotationと呼んでいる)に限定して、引用元の情報(の一部)が引用先に自動的に埋め込まれる仕組みによって、その著作物の再利用を実現しようとするものである。
このような引用によって、原著作物を尊重し、その権威を保証することで、原著作者の著作物利用権の許諾は自動的に得られるという基本的な合意を、トランスコピーライト(transcopyright)と呼ぶそうである。
この研究が今どうなっているのかわからないが、まだまだ一般的に普及しているとは言い難い状況である。

著作権の問題は少々ややこしいし、それは技術だけでは解決できないと思うが、それ以外のことなら、アノテーションとトランスコーディングで解決できるだろう。
このような仕組みによって、悪意を持った書き込みを排除し(というか、表示しないようにし)、整合性のとれた書き込みのみを表示することができる。
それだけではなく、競合関係にある書き込みを比べて、どちらの主張が正しいかを検討することもできる。
これはノンモノトニックな編集(つまり、競合関係にある記述を削除して、新しいものを書いてしまうこと)では不可能であったことである。

将来は、アノテーションとトランスコーディングを利用したモノトニックな編集があたりまえのものになって、同じドキュメントでも、年齢が上がり知識や経験が増えていくに従って、異なる読み方ができるようになるだろう。

かなり前のことになるが、「本当は恐ろしいグリム童話」(KKベストセラーズ 1998)という本が話題になった。
この本は、グリム兄弟が1812年に上梓したグリム童話の初版にいくつかの解釈を加えて書かれている。
グリム兄弟はその後、当時の批判に答えるために、改訂に改訂を重ねており、1857年に第7版が出版されている。
現在、日本で一般に知られているグリム童話は、この第7版の邦訳である(ちなみに、原書はドイツ語である)。
たとえば白雪姫などは、ディズニーがさらに子供向けに改変したものが広く知られていると思う。
ディズニーの白雪姫しか知らない人(実は僕もそうであった)が、オリジナルの物語を知ったらさぞ驚くだろう(これでは白雪姫より毒リンゴを食べさせた王妃に同情したくなる)。

グリム童話は不特定多数の著者によって書かれたものではないが、そもそも民話や神話などを下敷きにして書かれたものであるし、初版の刊行後に多くの批評家からの批判を受けて改訂しているわけだから、ある意味、共同著作のようなものと考えられる。
もし、モノトニックな編集によって改訂版が書かれていたとしたら、どのような意図でどの部分を変更したか、思考の流れがしっかり読み取れたかも知れないし、著者や翻訳者が難解と判断し、削除してしまった部分も、読者のレベルに応じて詳細に表示して、より深い背景を知ることができただろうと思う。

モノトニックな編集は、人々の書き込みが集まっていくさまを忠実に残し、その総体から大きなストーリーが生み出されていく過程を表現できるだろう。

投稿者 nagao : 00:22 | トラックバック

2005年09月13日

今、本を書いています

今、デジタルコンテンツに関する新しいテクノロジーについての本を執筆しています(正確には、学生や知り合いとの共同著作です)。
実は、かなり以前から書き始めているのですが、書きたい内容が錯綜していて、なかなか筆が進まないのです。

想定する読者は、大学・企業の情報技術に関わる研究者(学生を含む)やコンテンツビジネスに関わっている人たちです。

いろいろ考えた結果、内容としては、以下のものになる予定です(全体で300ページくらいにする予定)。

1. テキストコンテンツ
 ドキュメントの構造化(XML)、
 メタデータ(Dublin Core、RDFなど)、
 言語構造とテキストアノテーション(GDA、WordNet、
 文解析、語彙解析、アノテーションエディタ)、
 テキストトランスコーディング(要約、翻訳、音声化、言い換え)

2. ビデオコンテンツ
 ビデオの構造化(音声・映像解析)、
 ビデオアノテーション(MPEG-7、Annodex、VAE、SVAなど)、
 オンラインビデオアノテーション(iVASなど)、ビデオ検索、
 ビデオトランスコーディング(ビデオ要約、ビデオ翻訳)、
 ビデオとテキストの統合(ビデオブログ)

3. 音楽コンテンツ
 音楽の構造化(GTTM、MusicXMLなど)、
 音楽アノテーション(MiXAなど)、
 楽曲検索、プレイリスト

4. 辞典コンテンツ
 オンライン辞典(Wikipediaなど)、辞典の構造化、
 辞典アノテーション、辞典コンテンツからのマイニング

5. 会議コンテンツ
 会議のコンテンツ化、会議の構造化、
 会議コンテンツの利用、ディスカッションマイニング

6. 体験コンテンツ
 体験のコンテンツ化(ライフログなど)、体験の構造化、
 体験共有とプライバシー、体験の編集と統合

7. 個人とコンテンツ
 コンテンツのパーソナライゼーション、
 パーソナルコンテンツ配信(ブログ、Podcastingなど)、
 ライツマネージメント(Creative Commonsなど)、
 フィードとシンジケーション(RSS/Atom、アグリゲータなど)

8. 社会とコンテンツ
 ソーシャルネットワーキングサービス(mixiなど)、
 ソーシャルブックマークとリコメンデーション、
 人間関係のマイニング、トラストとセキュリティ

9. 知的なコンテンツ
 コンテンツのセマンティクス、オントロジー、
 セマンティックウェブ、知識発見

あと2, 3年程度ですたれてしまいそうな内容はできるだけ書かないようにしたいと思っています(mixiが3年後まだ残っているかはあまり自信がないですが)。
少なくとも内容の半分くらいは、僕が直接関わっている技術に関するものです(だから上のリストには一般にはまだ知られていない用語が含まれています)。
僕と無関係の人が考えたもの・作ったものでも、僕が解釈をし直して解説しているものもあります(ライフログ、セマンティックウェブなど)。

この本はオンライン版と紙版の2バージョンを出そうと思います。
完成したらこのブログでもお知らせしたいと思いますが、その前に、「このトピックは押さえておくべき」というのがありましたら是非教えていただきたいと思います。

投稿者 nagao : 07:09 | コメント (13) | トラックバック

2005年09月09日

ビデオブログでできること

「ブログ 世界を変える個人メディア」(朝日新聞社 2005)という翻訳本を読んだ。
邦題は陳腐だが、原題はWe the Media: Grassroots Journalism by the People, for the People (直訳すると「われらメディア 人民による人民のための草の根ジャーナリズム」)である。
ちなみに、このタイトルは、アメリカの憲法前文の書き出しWe the People(われら人民)とかけているらしい。
著者は、ハイテク好きのジャーナリストであり、かなり早いうちからブログを書いていた人らしい。

僕が作ったものではないが、今のオンラインコンテンツ技術が、現在の社会の元凶の一つであるマスメディアに対抗する力をもたらし、膠着しかけた社会に大きな変革をもたらしていくさまを見るのはとても痛快である。
と同時に、自分が死ぬまでに社会が本質的に必要とする技術を開発・実用化して歴史に足跡を残すことができるのか、と考えるととても不安になる。
しかしこればっかりは自分を信じて前に進むしかない。

テクノロジーとして深い内容を持っているものが、社会に深い影響を与えるということではない。
深い内容を持っていたって、世の中にたいして浸透しないものが強い影響力を持つことはない。
その反面、技術的にレベルの高いことをやっているとはとても思えないものが、時代の要請に適合することによって、大きな社会的ムーブメントを引き起こしたりする。
僕は、ブログをそういうものと捉えている。

ブログ(ツール)には特別に新しい技術は含まれていない。
HTML(のテンプレート)、スタイルシート(CSS)、CGI/Perl、データベース(RDB)、RSS/Atom、そしてWeb。
ログ(日誌)という形式にしたのはよい考えだと思うけれど、それはいろいろ試行錯誤しているうちに、たまたまそのような形式のものが広く浸透したのだと思う(Wikiよりブログの方が大きな社会的インパクトを与えているような雰囲気があるが、それはたまたまである)。

ブログに実装されたもので、新しい仕組みだと思えるものはトラックバック(TB)くらいである。
正直、HTMLのハイパーリンクは単純でわかりやすいけど、リンク先のサイトやコンテンツが変更されてもHTMLの著者が対応しないと役に立たない、など、いろいろと不備が多いので、コンテンツとリンクを別に管理する仕組みにするべきだと前々から思っていた。
それによって、コンテンツの公開後にリンクを(場合によっては第3者が)編集することができ、TBのような逆リンクも簡単に実現できると思っていた。
だから、TBの発想は面白いと思った。
でも、その実装を見たときはがっかりした。
もうちょっと頭のよい実装法は思いつかなかったのか、と。
でも、TBはともかくRSSを一般に普及させた功績は大きいと思う。
たとえ、今のRSSが、技術者をあきれさせるほど単純なものだとしても。

しかし、ブログの本質は、そんな技術的なことではなかった。
先に挙げた本の著者は、ブログの効果を「ニュースのオープンソース化」だと書いている。
有名なGNUプロジェクトの創設者であるリチャード・ストールマンが始めたソフトウェアに関する活動が「草の根」ジャーナリズムに影響を与え、よくできたツールと明確な動機付けに支えられてとてつもなく大きなムーブメントをもたらした、ということらしい。

それにしても、この本は冗長な部分が多いと思う。
おそらく3分の2程度のページ(この本は本文が395ページもある)
でも原著者の伝えたいことは十分に伝えられるだろう。
それに蛇足としか言いようのない解説も付いていて、「そんなことは本文を読めばわかるよ、馬鹿じゃないんだから」と言いたくなる。

さて、この本の中に次のような記述がある。
「オーディオ、ビデオ、アニメーションなどのマルチメディアをブログに使うケースが目立ってきた。(中略)ただ、自分のブログでもオーディオとビデオを使ってみたが、あまりうまくいったとは言えない。」
オンラインビデオが十分に普及した現在であっても、依然としてブログにビデオを載せて多くの人に見せるのは大変である。

また、本の中では、コストの点についてこう書かれている。
「最も成功しているウェブサイトが、最も維持コストがかかってしまう」
これは、プロバイダが「ウェブサイトが受けるアクセスの量と、テキスト、画像、オーディオ、ビデオを読者に届けるために必要な大域幅に基づいて課金」しているからだそうで、「公開したビデオがそこそこの人気を集めただけで、サイトの開設者は、莫大な支払いを背負うはめになりかねない」のだそうである。
「これまでであれば、メディアが成功すれば、限界コストは逓減していったはず」だから、ウェブの現象はメディアの歴史上、特異なものだということである。

この本の言うように、ブログの本質は草の根メディアであると考えると、人気が出たせいで維持コストが余計にかかるというのは、あまりうれしくないことであろう。
さらに、スクープ性のあるビデオなんか載せてアクセスが急増したら大変なことになってしまう。

しかし、これからはビデオを中心としたブログのことも考えるべきだと思う。
すごく好きな映画の話を書きたいときに、言葉ですべてを伝えるよりもシーンの映像や音声そのものを示して、ここはこういう意味なんだ、みたいなちょっとしたうんちくを語りたいことがあるだろう。
もうすでに、テレビ番組のキャプチャ画像を無断でブログに載せている人もいるけれど、著作権者の承認のもとに、オリジナルのビデオを直接参照できた方が、明らかにお互いの都合がよいだろう。

あるいは自分の撮影したビデオをネットに置いて、ビデオを見る前に読んで欲しいことや、ビデオの任意のシーンに補足情報を加えたいことなどがあるだろう。
そういう、ビデオを参照しながらブログで語りたいことっていろいろあるのではないかと思う。
そんなときに威力を発揮する仕組みはないだろうか。

その一つが、僕のいる研究室の学生が研究しているビデオブログである。
ビデオブログという言葉はすでに普通に使われているけれど、僕らが研究を始めた頃にはそんな言葉はなくて、特に思い入れもなくビデオブログと呼んでいた。
ここでのビデオブログという仕組みは、ブログページにビデオを埋め込んでブログ内で視聴するものではなく、ビデオ(の全体あるいはその構成要素)について語るために、既存のブログツールを拡張したものである。

ビデオについて語るために都合のよい仕組みは、ビデオの任意のシーンにポインタを付けて、文中で参照できるものである。
そのために、オンラインビデオアノテーションと呼ばれる仕組みを利用する。
これは、ブラウザでビデオを視聴しながら、気になったシーンにマーキングするものである。
マーキングはタイプ(シーン内の人やものなどのオブジェクトか、そのシーンの出来事や会話などのイベントか、など)を選んで、ショートコメントを書き込むものや、ボタンクリックによって印象(おいしそう、楽しそう、悲しそう、など)を入力するものなどがある。

マーキング結果は、ビデオアノテーションサーバー内に蓄積される。
そのサーバーはRSSフィード機能を使って、マーキングした人のブログサーバー(アノテーションサーバーにはSNSと同様、ログインが必要で、ブログサーバーを登録できる)にその人がどんなビデオのどんなシーンが気になったかを知らせる。
すると、気になったビデオシーンのサムネイル画像と、ビデオサイトにあるそのビデオのそのシーンへのリンクが付いたビデオブログ用のエントリーの雛形が自動的に生成される。
これによって、好きなビデオの好きなシーンについて思う存分に語ることができるだろう。

ブログのエントリーそのものにビデオが埋め込まれているのではなく、シーンを表すサムネイル画像とそのシーンへのリンクが含まれているだけなので、通常のブログページと見た目はまったく同じで気軽にさくさく読むことができる。
ビデオを見るには少し待たなければならないかも知れないが、ピンポイントに、言及されているシーンに飛ぶことができるから、ブログに書かれていることを容易に確かめて、内容を理解することができる。

この文章だとちょっとイメージしにくいかも知れないけれど、実際に使ってみるとすぐにわかると思う。

この仕組みを一般に普及させるためには、いくつかの乗り越えなければならない問題がある。

最初に思いつくのは無論、著作権の問題、あるいはコンテンツホルダーがその気になるか、という問題である。
ビデオコンテンツの著作権者が、ビデオアノテーションサーバーにコンテンツを登録してくれないと、そもそもこの仕組みは運用できない。
その際に、ブログでのサムネイル引用を認めてもらわなければならない。
現在のブログがジャーナリズムのオープンソース化を目指すものならば、ビデオブログがエンターテインメントのオープンソース化に少しでも近づけるとよいと思う。

エンターテインメントのオープンソース化は、たとえば、エンターテインメントコンテンツの公開企画会議なんかを可能にするだろう。
その結果、駄作としか言いようのない映画を高いお金をかけて見せられる危険性が軽減されるだろう。

昨年公開された「デビルマン」という映画をご存知だろうか。
僕は中学生のときにこの映画の原作である漫画を筆舌しがたい衝撃を持って読んだ記憶がある。
だから映画化されたと知って、是非見てみたいと思ったのだが、劇場公開後のネット上の評判は惨憺たるありさまだった。
どのくらいひどいか僕にはうまく表現できないので、とりあえずぐぐってみてください。
あえて要約すると、偉大なる原作(原作者さえ二度と同クオリティのものを生み出せないだろう、と言われている)に汚物をなすりつけた、映画と呼ぶのもはばかられるゴミ作品なのだそうである。

この映画を企画の段階でオープンにしてコアなファンの意見に耳を傾けていればもう少し違った作品になったのではないだろうか。
たとえば、パイロットフィルムか何かをビデオアノテーションサーバーに載せ、引用を許可したとしたら、多くの人の批判と要望が自然に集められ、企画の見直しやブラッシュアップに大いに役に立っただろう。
きっと「この役はこの俳優がふさわしい」なんて投票までやってくれただろう。
また完成前に、トレイラーと呼ばれる予告編を同様に公開して引用可能にすれば、集まったコメントに基づいて、編集にひと工夫を加えて、ファンサービスシーンを追加することも考えられたかも知れない。

可能な限り多くの情報をタイミングよく公開すれば、きちんと評価して期待してくれる人も増えるだろうし、その結果、誇大広告気味な宣伝なんかやらなくても、ちゃんと世の中にアピールして、多くの人に見てもらえるものになると思う。
冒頭に挙げた本にも指摘されているように、「透明性の高さは、まず間違いなくよい結果を生む」のである。

もちろん、自信のあるクリエイターは、不特定多数の意見を聞いて方針を決めるなどということはしないだろう。
また、ネタばれによって面白さが減少するのを恐れて、秘密主義に徹することもあるかも知れない。
たとえば、スティーブン・スピルバーグは、自らの監督したAIや宇宙戦争に関して、公開ギリギリまでほとんど情報公開をせず、試写を見たマスメディアにも公開前の論評を禁止した。
その結果、多くの人にとってよい評価が得られたかというと、必ずしもそうは思えない。
むしろ、僕はAIは間違いなく駄作だと思っているし、宇宙戦争も特に見たいとは思わない。

映画が完成する前に、少なくとも公開される前に、(憶測ではなく、正しい情報に基づいて)意見をする機会は必要だと思う。
それを排除してしまうことによって、独りよがりで難解な、いわゆる駄作を生み出してしまうリスクが増大するだろう。

結局、適切な引用のようなフェアユースに限定すれば、貴重なコンテンツをビデオブログに載せても損をするどころか、制作者側が得るものは、けっして少なくないのではないかと思う。

次に、大勢のユーザーがつくかどうかという問題がある。
ビデオアノテーションサーバーはコンテンツホルダー側に制御権を与えることになると思うが、シーンのサムネイル引用の部分は、すでに普及しているブログツールのプラグインとしてフリーで公開することになると思うので、たいして敷居も高くなく、多くのブログライターが気軽に使えるものになると思う。
これを読んでいるみなさんも、僕らが近い将来、ソフトウェアを無償公開したら是非ダウンロードして試していただきたい。

現在のブログがジャーナリズムに対してそうであるように、ビデオブログは、今後のエンターテインメントにとてつもなく大きな影響を与えるだろう。

投稿者 nagao : 00:25 | コメント (2) | トラックバック

2005年09月02日

音楽アノテーションとプレイリスト

ウォークマンの第1号機が発売されたとき、僕は高校生だった。
やたらでかくて重たそうだったが、なんだかわくわくするような機械だった。
ヘッドホンを付けているときに周囲の音が聞こえなくなって不便な場合を想定して、本体に外の音をひろうためのマイクが付いていて、ボタンを押すと音楽からマイク入力に切り替わるような仕組みまで付いていた。
そんなの、ヘッドホン外しゃいいじゃん、と思っていた。
そのときはちょっと高くて買えなかったのだけど、その後大学に入ってから、爆発的にヒットしたウォークマンIIの赤を買った。
それ以降、ずいぶんいろいろな機種を買った。
でかかった最初のオートリバース機や防水型で太陽電池のついたものとか、ワイヤレスヘッドホンのもの(こいつがひどくて、同じ機種を持っている人が近くにいると、距離によってはそっちの音が聞こえてきた。満員電車の中で聞きたくもない演歌を聞かされたこともあった)、MD版の第1号機も持っていた。
録音機能も付いているすぐれものであった。

しかし、会社に入ってしばらくすると、電車の中や歩きながら音楽を聴くこともなくなってしまった。
フレックスタイムになって満員電車に乗らなくなったせいもあり、座って会社に行けるようになると、電車の中でノートPCを広げて作業をするようになった。
電車の中ではひたすらノートPCに向い、降りると目的地に向って走る。
そんな生活を続けていると、移動中に音楽を聴いている余裕もなくなってしまった。

なのに今は、iPodにはまっている。
職場が会社から大学に変わったら、再び音楽と密着した生活になった。
そういえば、通勤の途中でノートPCを開くことが少なくなった。
出張中の新幹線の中ではさすがにノートPCに向っているが、同時にiPodを聴いている。
これは生活に余裕が出てきたということだろうか。
いや、最近、プログラミングのスピードがかなり落ちてきたし、文章もろくに書いていない(だから、このブログでリハビリをしているのだけど)。
仕事のパフォーマンスがしっかり落ちているじゃないか。
ただ言い訳をさせてもらうと、学生の指導のことを考えている時間が非常に長くて、自分のことをやっている時間が減っているのである。

なぜiPodを使うようになったかというと、僕のいる研究室の学生が音楽へのアノテーションとプレイリストの自動生成などの研究を行っているからである。
僕は最初、この研究に十分な深みがあるのかどうか疑問だった。
学部生がやる研究なら、時間があまりないから、どうしても浅くなってしまうのだけど、大学院生がやる研究の底が浅いのはとてもまずい。
自分が一所懸命取り組んだものが、たいして重要なものではなかったことが後でわかったとしたら本人の落胆は小さなものではないだろう。
では、なぜ疑問だったかというと、音楽の構造や意味に関する工学的アプローチが場当たり的なものになってしまうのではないかということと、音楽の信号処理による自動解析はもうできることはほとんどやられてしまっていて、これからやれることは他の人がやらなかったニッチしかないのではないかと思ったことが主な原因である。

しかし、僕らはデジタルコンテンツ一般を対象にした研究を行っているのであるから、当然、音楽コンテンツのうまい扱い方も考えるべきだろう。
そしてそれは音楽に新しい役割を持たせることになる。

音楽へのアノテーションとは、楽曲の全体や部分に構造的な情報や意味的な情報を関連付けるものである。
アノテーションには楽曲を聴いた人の印象やコメントなども含まれる。
さらに、どんな状況で聴いたか・聴きたいかなどのアンケート的な質問の答えもアノテーションとして曲に関連付けることができる。

このような仕組みの応用に、楽曲検索がある。
曲名や歌詞、アーティスト名、さらにジャンルやヒットチャートランキング等による検索や、ユーザーの好みの類似性に着目した協調フィルタリングなどが実現できる。

さらに興味深いのは、音楽アノテーションは、鑑賞者のそのときの状況に合った楽曲集つまりプレイリストの生成に利用できることである。

プレイリストはかなり以前からあるけれど、iPodのおかげでがぜん注目度が上がってきたと思う。
AppleのWebサイトでもセレブリティ・プレイリストとかいう企画で、有名人の選んだ曲の一覧などが掲載されている。
好きなミュージシャンの好きな曲というのは興味があって当然だと思う。

もちろん、他人が作ったプレイリストより、今の自分に最も適したプレイリストを作成することの方がよほど重要だろう。
携帯用のコンテンツサービスに「着うたフル」みたいなものがあるが、オンデマンド音楽配信をモバイルでやることにそんなに意味があるとは思えない(音楽配信の敷居を下げることには貢献していると思うが、iPodユーザーならiTunesを使えるから、これは携帯しか使えない人向きのサービスですね)。
やはり、聴きたい曲を聴きたいときにダウンロードするのは、あまり効率がよくないと思う。
それよりも定期的に曲を一括ダウンロードして、全部持って歩き、何を聴くかはすでに手元にある曲のプレイリストをオンデマンドに生成したり再利用したりするのが一般的になると思う。
重要なのは、今聴きたい曲を一つ一つ選んでいくというより、今の気分に合ったプレイリストを生成あるいは選択する、ということである。


日本が世界に誇る漫画であるドラえもんの道具の中に、「ムード盛り上げ楽団」というのがある。
バイオリン・ドラム・トランペットを持った3体の小型ロボットたちが、主人の後をついてきて、BGMを奏でて気分を盛り上げてくれるというものである。
元気を出したいときはアップテンポの曲で、落ち着きたいときはスローな曲、という感じである。
今やBGMのないドラマは想像できないくらいに、BGMは人の心情や行動とシンクロして、その印象を強めることができる。

音楽が人をリラックスさせ、時に記憶の想起を促し、気力を向上させ、脳を活性化させるのは間違いがないだろう。
だから音楽を効果的に使って、人をよりアクティブに充実した時間が過ごせるようにするというのはとても意義のあることだと思う。

ところで、多くの人は自分自身のテーマソングを持っているのではないだろうか。
落ち込んでいても、その曲を聴いているうちに何となく元気になれるような音楽である。
僕は大学時代にスキー部でジャンプをやっていたせいで、Van HalenのJumpという曲がテーマソングだった(そのまんまですね)。
この歌を聴くと野沢温泉スキー場の向林ゲレンデのジャンプ台の情景が頭に浮かび、飛ぶ前の恐怖感と高揚感や、夏合宿のサマージャンプでこけて左ひざのじん帯を怪我したことなどが思い出されてくる(夏にスキージャンプはやっちゃいけません)。
いい思い出ばかりではないが、でも、気分は盛り上がってくる。

「ムード盛り上げ楽団」みたいな機械は、現在の技術で結構できるのではないかと思う。
確かに人間の気分や意図などの心的状態を知るのはむずかしいけれど、行動履歴や習慣や大雑把な生理学的情報から、多少失敗するのは覚悟の上で、適切なBGMを選択するのは可能ではないかと思う。

それに、「ムード盛り上げ楽団」は生演奏なので関係ないけれど、普通は1曲だけでは時間が合わないから、似たような曲を複数曲、いい感じで続けて流すのがよいだろう。
つまり、プレイリストである。

iPodのように何万曲も保存できるものなら、ムードを盛り上げるためにわざわざ新しい曲をダウンロードする必要なんてないから、プレイリストだけオンデマンドに生成できれば十分である。

人間のそのときの状況に関する情報と音楽へのアノテーションを用いることによって、その人の気分を盛り上げるためのプレイリストが生成できるだろう。
最初のうちは、結構外してしまうかも知れないけれど、統計的手法による学習機能によって、徐々にその人に適合したプレイリストが作れるようになるだろう。

iPodが携帯型「ムード盛り上げ楽団」になる日は近い。
音楽が今やっている仕事を不用意に妨げることもなくなり、むしろ、気が乗らないときにもそれなりにやる気にさせてくれるかも知れない。
そうなったら、もう二度と、僕は音楽を持ち歩くことをやめたりしないだろう。

投稿者 nagao : 00:27 | コメント (5) | トラックバック