2005年07月26日
ソーシャルブックマークと検索:ロボットと人
[web]
HepCat Dev and Test: ソーシャルブックマークについて検索エンジンの超短い版の歴史としては:
1.Yahooがはじめた特定の人が収集・分類するディレクトリ型のサイトー>Webの情報量が多すぎて破綻(一時期Googleの検索エンジンを使い最近独自のエンジン開発)。
2.Googleによる、機械的に何でもかんでもすべての情報を集め、高度なアルゴリズムによって多種多様でごった煮の情報から有益な情報を絞りだす検索エンジンの登場。
そこで次にくるのは:
3.ソーシャルブックマークを利用した不特定多数のユーザーによるユーザーのための民主的な検索エンジンの登場...。というのがあっても良いのではと思います。(Open Directory dmozはコケ気味だけど...)
先日yasuhisaさんと話していた時に
同じような話になったことがありました。
情報にリーチする方法として
1.yahoo:人間が情報を分類する。ディレクトリ・ツリー。サイト単位。
情報量が増大・爆発して全てを分類することが困難に。
ディレクトリ・ツリー構造にあてはめることも大変な状況。
基本的にはリンク集。
2.google:ロボットが情報を分類する。ページ単位。ページランク。
情報の重み付けはページランクで可能だが、意味・評価は難しい。
情報過多になっている。いわゆるSEO SPAMとの戦い。
ページデータベース。
3.SBM:人間が情報を評価する。ページ単位。
ページに関する評価データベース。
という、人→ロボット→人という流れがあるんじゃないかなと。
1,2,3は排他的ではなくて、新たな方法として追加されていくという形。
ソーシャルブックマークは「人」がページに評価・重み付けをするもので
その次はある程度タグが自動的に判別されたりしそうな気はしますが
それでも重要なのは「人の評価・判断」かなと。
評価・判断が表にでているのがタグとコメント。
日本語に限ると「タグ」によるfolksonomyがどの程度効果的かという部分で
英語よりも表記の揺れが大きい分精度が低くなりそうな気はしますが
その辺りは自然言語処理の研究とかでなんとかなるのかな。
4でもう一度「ロボットが効率的に自動化するよ」みたいなことになって
またその次に「やっぱ人が判断しなきゃね」的な流れが来たりするのかなぁ
と無根拠にぼんやり考えたりしてます。
ただ、現状のSBMが有用なのは、使っている層がある程度限られているから
といった状況も無視は出来ないと思っています。
bulkfeeds等のrss検索エンジンも情報が雑多になりすぎてspamがたくさん
混ざってくるようになると、それはそれでページランク的な「評価」を
しなくてはいけなくなってくるわけで、SBMも新着一覧等々は情報に埋もれる
という事態がそのうち発生してくるんだろうなと。
ロボットによる効率的処理と人間による評価・判断。
これをどうmixしていくか、ということが重要なのだろうと思います。
投稿者 kengochi : 2005年07月26日 11:02