Eyes, JAPAN Blog > Web上にあるデータを興味のままに扱えるようにするにはどれくらいの手間が必要なのか

Web上にあるデータを興味のままに扱えるようにするにはどれくらいの手間が必要なのか

yahata

この記事は1年以上前に書かれたもので、内容が古い可能性がありますのでご注意ください。

cur

最近、「興味」に興味があります。

Webは興味の文化

自分はwebエンジニアですから、当然ずっとwebに興味を持って勉強しているわけですが、最近気づいたことがあります。それは、webは「興味」の集大成であるということ。

あらゆる文化が興味や関心によって形成されていくように、webという文化もまた、興味によって形成されていくのです。それを象徴しているのが、GoogleやYahoo!に代表される検索エンジン。検索エンジンを使うとき、人々は自分たちの頭のなかにあるボンヤリとした興味を、検索ワードという具象に変換することで、ようやく新たな知識を得ることができるわけです。そして、具体化された興味は、検索ランキングの変動という形でwebに反映され、新たな文化を形作っていきます。

ここで気になるのが、興味を言葉に変換する段階で生じるデータ欠損です。

興味から言葉への変換

「ググり力」という言葉があるように、興味を言葉に変換するのは高度な技術です。例えそれが、自分自身の頭のなかにある興味だったとしても。反対に、検索される側のコンテンツも、情報を正確に言葉に表現できているかというとこれもまた疑問です。

本当はこうなのだが… ↓

 

 

cur1

検索はこうなる↓

cur2

そもそも言葉や文字というものは、対人での情報伝達プロトコルとしてはあまり優れているとは言えません。それぞれの脳に流れる電流をお互いに交わらせることができれば、微細なニュアンスまでも高速に伝達することができるはずです。
とはいえ、今日の状況を見るに、言葉や文字が別のプロトコルに取って代わられるというのは現実的ではなさそうです。

デートに使える(かもしれない)RDF

さて、Web上にあるデータをLinkedDataとして扱えるようにするにはどれくらいの手間が必要なのかという記事ではRDFが紹介されていました。RDFとはまさに、「興味」という曖昧な概念を正確かつパワフルに扱うための重要な技術です。

例を挙げてみましょう。

あなたは今、恋人とデートをしています。一日中歩きまわってくたびれてしまいました。ぶらぶらと繁華街を歩いていると、隣にいる恋人が「夕飯、何にしようか?」と尋ねてきました。そういえばお腹が空いた。あなたの脳内には「そうだなあ…日本料理か、フランス料理か…」と料理の選択肢がぼんやり浮かんできます。

まさにこの時、あなたは「料理」に対して興味を持っています。早速、DBpediaの料理のページでRDFデータを見てみると、日本・イタリア・トルコ・中華・台湾・メキシコ・スペイン・ベトナム・コスタリカ…山ほど出てきます。危ない危ない。もう少しで「日本料理 店 ランキング」などという面白みのないワードで検索するところでした。今夜は初めてのコスタリカ料理に決まりです。ありがとうRDF!

でも、ちょっと待って

確かにDBpediaで調べると「料理」の関連ワードがたくさん出てきました。でもちょっと待って下さい。そんなのいちいち調べるより、食べログで店を探したほうが早いですよね。

実は、RDFで「料理」を調べることの利点はそこではないのです。

御存知の通り、webの世界にはwebサービスと呼ばれるものが数多くあります。Google Mapsも、食べログも、クックパッドも、全部webサービスです。RDFの真価は、それらwebサービスがweb上のデータを共有資源として使えるということなのです。

curmap (1)

星3つのレストランがいいな。店の評価は食べログから。
早速レストランに向かおう。店の位置データはGoogle Mapsから。
これ、家でも作りたい。レシピはクックパッドから。

異なるwebサービス同士が、RDFという共通言語で会話し、横断的な情報を提供してくれる。これがRDFの真価です。

実現への道のり

では、どうやってこれを実現していくのでしょうか?それは我々web開発に携わる者の使命でもあります。

例えばschema.orgは、Google, Microsoft, Yahoo!が共同で策定している、構造化マークアップのためのボキャブラリです。

schema.org に関するよくある質問 – ウェブマスター ツール ヘルプ

最近は、オープンデータをRDF形式で公開している組織も増えてきています。しかし、webの世界の中で流動的にRDFデータを扱っていくには、HTML文書自体がRDFを用いて記述されていることが必要です。
schema.orgはそんな取り組みの一つであり、webコンテンツの意味付けを行うためのボキャブラリを提供してくれているのです。

自分たちが目指すもの

RDF関連技術は、まだまだ一般に浸透しているとは言えない状況です。そんな中で自分たちができることは、提供者・利用者の双方の視点からRDFを活用し、人々に広めていくことだと思っています。

(個人的な)webの面白さは、JavaScriptの言語仕様とかHTMLのパースアルゴリズムとかレスポンシブデザインとか色々ありますが、RDFもその一つ。

ちなみに自分は今年度から新入社員としてお世話になっていますが、RDFがもたらす新しいwebの変化に、開発サイドから関わっていけるのが非常に楽しみです!

担当:八幡(タイトルの答えは「いつか手間がなくなる」です)

  • このエントリーをはてなブックマークに追加

Comments are closed.