2005年07月29日
情報に対するラベリングの主権
伊藤直也の「アルファギークのブックマーク」キーワードでも情報のつながりは表現できていたのですが、そのつながり具合は del.icio.usなどのつながりとだいぶ性質が違う、機械的で硬い繋がりでした。
naoyaさん@はてな のfolksonomyについての記事。
いつものように非常にわかりやすくまとめられています。
ただ、上に引用した部分については僕の感想と少し違ったので書いてみます。
はてなのキーワードは文章の中身を解析して単語をピックアップしています。
(よね?これが違ったら前提が違ってしまうので以下の文章は全部無意味です!)
del.icio.usや現在はてなブックマークに実装されているタグは
閲覧者が勝手につけるラベルです。
ページ内容(テキスト)からキーワードをピックアップしていくと、
情報の中身的には対して意味が無いものの
単語単体で重み付けをするとそこそこ意味のある単語があがってくることがあります。
また、キーワード抽出ということは必然的にテキストから情報を拾ってくるわけで
例えばある特定の画像に着目した場合などはテキスト内にそのラベルに
ふさわしいものがなければキーワードを拾ってくることができません。
テキスト内にある単語からしかラベルをつけることができない
という制限がはてなのキーワードには存在します。
#ロボット型検索エンジンにも似たような制限がありますが
googleの場合は被リンクのアンカーからもキーワードを拾っています。
タグの場合は閲覧者が勝手にラベルの文言を選択することができます。
テキスト内に入っていない文字列をタグ付けすることも可能なわけです。
これは情報(ページ)にラベルをつけるのが
情報(ページ)の発信者なのか閲覧者なのか
というところに一番大きな差があるんじゃないかと思っています。
#実際は発信者が直接キーワードを制御することはできませんが。
当初ははてなブックマークに対して
「キーワードじゃなくてタグにしてほしいなぁ」と思っていたわけですが
実際にタグが実装されてからは違った感想をもつようになりました。
機械的-人間的という対比よりは
「発信者主体のキーワード」
と
「閲覧者主体のタグ」
の違いなのかなと。
また、その両立というのは案外面白いなぁと最近感じています。
この記事のタイトルで「情報に対するラベリングの主権」と書いています。
記事の書き始めの時点では主権が発信者から閲覧者に移動したと思っていたのですが
「発信者にあった主権がある程度閲覧者に分散したのだ」と言えそうです。
投稿者 kengochi : 11:00
2005年07月28日
awsで文字化け
- [web]
Amazon.com Discussion Boards #9265.1レポートありがとうございます!ECS3については文字化け確認しました。調査します。
ECS4についてはこちらで確認できないのですが、例のREST URLなどを送っていただけませんか?よろしくお願いします!
とのこと。
今朝から色んなところでaws使ってるサービスが文字化けしているようなのですが
amazonから返ってくるデータ自体がなんか変だと。
仕様変更でもしたんすかね。
調査中とのことなので、そのうち治るんだとは思いますが
こういうトラブルがあるとawsの利用範囲の大きさを実感します。
[2005 7/28 12:17追記]
XSLTの問題は確認しました。ECS3と4の両方でXSLTに問題があります。調査修正します。
XSLTの不具合のようです。
文字化けっていうのも便利なというか曖昧な言葉だな。
web関係のユーザーサポートやってると
「文字化けしてます!」
なんて報告が来ることがよくあるわけですが
原因は色んなところにある。
ブラウザ・webクライアントの問題
htmlの問題
cssの問題
プログラムの問題
等々。
手元で再現しない場合には原因の特定が難しいんだけど
再現しないって事はクライアントの問題なのだろうと推測したり。
今回の件はある程度特定できたようなので
もうすぐですかね。
[2005 7/28 16:47追記]
修正された予感。
[2005 8/1 10:31追記]
Amazon Web Service で文字化け: blog.bulknews.net
生のXML を見てみると Perl の Unicode フラグまわりで起こる iso-8859-1 -> UTF-8 アップグレードの化け方に似ている気がします宮川さんのところで面白い考察が。 文字化けにも癖ってあるんですね。
投稿者 kengochi : 10:53
小学館:画像使用・著作権
- [web]
小学館:画像使用・著作権小学館はインターネット及びイントラネット上において、
当社の出版物を以下の行為に使用することを禁止しております。・出版物の装丁及び見開きなどの画像の全体又は一部を掲載すること。
・出版物の内容及び目次などの全体又は一部を掲載すること。
えー。
これだとamazonとか駄目になっちゃうんですけど。
amazonから画像ひっぱってくるのも駄目になっちゃうんですけど。
> 守っていただけない方には法的手段を講じることもありますので、ご注意ください。
実際法的手段を講じたケースってあるんだろうか。
使っていいですか?と正面から聞けば
「いいですよ」とは言いづらいんだろうけども
黙認の範囲かどうかっていうのは気になるなぁ。
投稿者 kengochi : 02:32
2005年07月26日
ソーシャルブックマークと検索:ロボットと人
- [web]
HepCat Dev and Test: ソーシャルブックマークについて検索エンジンの超短い版の歴史としては:
1.Yahooがはじめた特定の人が収集・分類するディレクトリ型のサイトー>Webの情報量が多すぎて破綻(一時期Googleの検索エンジンを使い最近独自のエンジン開発)。
2.Googleによる、機械的に何でもかんでもすべての情報を集め、高度なアルゴリズムによって多種多様でごった煮の情報から有益な情報を絞りだす検索エンジンの登場。
そこで次にくるのは:
3.ソーシャルブックマークを利用した不特定多数のユーザーによるユーザーのための民主的な検索エンジンの登場...。というのがあっても良いのではと思います。(Open Directory dmozはコケ気味だけど...)
先日yasuhisaさんと話していた時に
同じような話になったことがありました。
情報にリーチする方法として
1.yahoo:人間が情報を分類する。ディレクトリ・ツリー。サイト単位。
情報量が増大・爆発して全てを分類することが困難に。
ディレクトリ・ツリー構造にあてはめることも大変な状況。
基本的にはリンク集。
2.google:ロボットが情報を分類する。ページ単位。ページランク。
情報の重み付けはページランクで可能だが、意味・評価は難しい。
情報過多になっている。いわゆるSEO SPAMとの戦い。
ページデータベース。
3.SBM:人間が情報を評価する。ページ単位。
ページに関する評価データベース。
という、人→ロボット→人という流れがあるんじゃないかなと。
1,2,3は排他的ではなくて、新たな方法として追加されていくという形。
ソーシャルブックマークは「人」がページに評価・重み付けをするもので
その次はある程度タグが自動的に判別されたりしそうな気はしますが
それでも重要なのは「人の評価・判断」かなと。
評価・判断が表にでているのがタグとコメント。
日本語に限ると「タグ」によるfolksonomyがどの程度効果的かという部分で
英語よりも表記の揺れが大きい分精度が低くなりそうな気はしますが
その辺りは自然言語処理の研究とかでなんとかなるのかな。
4でもう一度「ロボットが効率的に自動化するよ」みたいなことになって
またその次に「やっぱ人が判断しなきゃね」的な流れが来たりするのかなぁ
と無根拠にぼんやり考えたりしてます。
ただ、現状のSBMが有用なのは、使っている層がある程度限られているから
といった状況も無視は出来ないと思っています。
bulkfeeds等のrss検索エンジンも情報が雑多になりすぎてspamがたくさん
混ざってくるようになると、それはそれでページランク的な「評価」を
しなくてはいけなくなってくるわけで、SBMも新着一覧等々は情報に埋もれる
という事態がそのうち発生してくるんだろうなと。
ロボットによる効率的処理と人間による評価・判断。
これをどうmixしていくか、ということが重要なのだろうと思います。
投稿者 kengochi : 11:02
2005年07月25日
近鉄百が京都店閉鎖へ 伊勢丹に客足取られ
- [kyoto]
Yahoo!ニュース - 共同通信 - 近鉄百が京都店閉鎖へ 伊勢丹に客足取られ2000年に大型専門店を導入しプラッツ近鉄に業態転換したものの、不振から脱却できなかった。
まじでかー!!
プラッツ近鉄になってからは、かなりよく行ってたんだけどなぁ。
GAP、無印、コムサ、ソフマップ、旭屋書店…。
この辺りって伊勢丹に客足取られたっていうわけでもなさそうなんだけど。
地下の蓬莱でよく豚マン買ったなぁ。
2005年07月22日
空手バカボン再発!
- [music]
ナゴム再生委員会空手バカボン ナゴムコレクション
上記タイトルにつき、収録曲、曲順が決定いたしましたので、お知らせいたします。
空手バカボンのアルバムが再発されます!!!!
おおもうけバカボンとかから笑ふ孤島の鬼とか
日本の米とか労働者Mとか
筋肉少女帯でもやってましたっけね。
聴いたことないんだけど「バカボンと戦慄」『バカボンと戦慄PART2』
超聴きたい!著作権者ってやっぱKing Crimson?
8月24日発売タイトル
こちらを見ると
TITLE:空手バカボン ナゴムコレクション ARTIST:空手バカボン
■4200円(2枚組/税込) ■DDCH-2503〜2504
とのこと!
2005年07月21日
google moon
- [web]
月面着陸記念日ということで
今日はいつものようなロゴだけでなくてgoogle moonというサイトまで
イベントというかジョークで立ち上げちゃってます。
面白いなぁ。
でも企画ものなので月面写真も一部しかないですよ!
投稿者 kengochi : 00:11
2005年07月20日
SMAPの新譜、というよりブンブン
SAMPLE BANG !海外の精鋭クリエーター達がSMAPのヒット曲を極上リミックスする『KAIZOKU BANG!』
DISC [2]
3.SHAKE(BOOMBOOMSATELLITESREMIX)
SMAP自体にはそんなに興味ないのですが
KAIZOKU BANG!に収録されているというBOOM BOOM SATELLITES Remix
というのがめっさ気になります!
"SHAKE"は元曲もCHOKKAKUのアレンジがけっこう好きだったので
どう変わってるのか楽しみ。
投稿者 kengochi : 18:44
DreamTheater来日決定
- [music]
CDJournal.com - ニュース - ドリーム・シアター、来日決定!<ドリーム・シアター来日公演日程>
2006年
1月 7日(土)大阪 大阪国際会議場メインホール
1月 8日(日)福岡 福岡市民会館
1月 9日(月・祝)広島 広島アステールプラザ 大ホール
1月11日(水)愛知 愛知芸術文化劇場
1月12日(木)東京 東京国際フォーラム ホールA
1月13日(金)東京 東京国際フォーラム ホールA
おー、来日決定!
前回はちょうど引っ越しと重なったので行けずじまい。
新譜かなり気に入ってるので是非行かねば!
でも来年の話なのでまだまだかなり先ですね。
東京公演のどちらかでおそらく恒例の丸ごとカバーがあると思われます。
今回は何やるんだろう。JudasPriestかな。
あ
> 東京公演のチケット一般発売は、新作のタイトル(Octave=第8音)にちなんで8月8日午後8時開始となっています
とのことなので、発売日はそろそろ。
私の新譜レビュー
chiastic slide | Dream Theater / "Octavarium"
投稿者 kengochi : 15:46
2005年07月19日
ブックマークの森
- [web]
[N] ブックマークの森
googleでとあることを検索していたら
自分のブックマーク(del.icio.us)にでくわしました(笑)
なんだろなと思ってよくよく見てみると
ブックマークの森
というサイトで色んな人のブックマークが集積されている模様。
ちなみに私は「カテゴリー分け準備中」というところに入っていました。
分類するなら、んー、ウォッチですかね。
いつも見てるブックマークもあるものの、ここで見つけてラッキーってなものもあり。
なんかあれですね、Netry BlogCastとか思い出しました。
はてなアンテナなんかも同じようなイメージなんですが
こうして同じ内容のページがコピーされるようなものは
検索結果に出てこない方がありがたいなぁ。
投稿者 kengochi : 00:20
2005年07月18日
アイデアのアウトプットと再発見
C O U L D:アイデアのアウトプット実はそういったアイデアはいつも頭の片隅にあるものの具体的になっているわけじゃないんですよね。つまり、そういう話の中で声を出してアウトプットしているからこそ形のあるアイデアに初めてなるのではという気がします。あと、会話というインターアクションがあるからこそ相乗効果のようにどんどんおもしろいアイデアが生まれるような気がします。会話がお互いの脳を刺激して良いアウトプットに変わるんでしょうね。
最近読んだ本の中で「アウトプットする自分とインプットする自分は別」(超意訳)
というような内容が有りました。
既に頭にある内容には違いなくても、一度アウトプットとして形にして
それを再度インプットすることで理解できる、というようなことです。
声や文字やその他の形でアウトプットしないで頭の中にあるままでは
自分で認識できているとは言えない状態の物事も多い、と。
それはやはりyasuhisaさんの記事同様に実感でもあります。
以前からブログや日記はまず第一に自分との対話だなと思うことがあって
まさにその通りのことが頭の中で起こっていると知ったのは興味深い出来事でした。
しかもそこに会話という言葉のキャッチボールがあることで
自分では届かない部分にも刺激が伝わる感覚があります。
リラックスした状態で、近い意識/知識レベルの人と会話するのが
一番のブレインストーミングになるように感じます。
で、私はそういったアウトプットをまず最初にノートに残しています。
前職で今と同様web関係の仕事に就いた2001年9月10日から
A5のダブルリングノートをずっと使い続けています。
バイブルサイズの手帳だとどうも書くエリアが小さすぎるんですよね。
仕事のメモや議事録、電車の中での思いつき、会話から出たアイデア、スケッチ等々。
2001年からで現在通算10冊目です。
最近そのノートを読み返すということをしはじめました。
案外いいこと書いてるなーと自画自賛したりしていますが
やはりどんなことであれ残していくことは重要だなと思います。
当時から軸がぶれていない部分も有れば、ずいぶん知識レベルが変わった部分も有り。
その中から今自分が直面しているシーンに適用できそうな内容を
適宜ピックアップして、また内容を練り直したりしてみようと思います。
貯めておくだけではなくて、新たに光をあてる
といった作業もなかなか刺激的なのではないでしょうか。
アイデアの再発見だけでなく、自分自身の再発見もあると思います。
けっこうおすすめですよ。
ちなみに僕が一番気に入っているノートは
無印良品のダブルリングノート。
無印良品[ポリプロピレンカバーダブルリングノート・A5 ]
いろいろ試してみようとは思ったりするのですが
一番使いやすいのでついつい同じものを使ってしまいます。
10冊中7冊はこれですね。
投稿者 kengochi : 01:41
tigerインストール後のshell/コマンド関係調整
- [osx]
@ parallel minds: OSを入れた後にインストールするアプリケーション
アプリケーションの他にやること忘れてました。
shell/コマンド関係の調整。
fswapというコマンドをつくる。
/user/local/bin/ #! /bin/sh # swap 2 files if [ $# -ne 2 ]; then echo "usage:needs 2 args!!" exit 1 else TEMPFILE='tempfile' mv $1 $TEMPFILE mv $2 $1 mv $TEMPFILE $2 fi
これでファイルの相互置換が簡単になる。
前の会社でずっと使い慣れてたので無いと不便。
次は.bashrc
.bashrc alias ls='ls -Fv' alias ll='ls -la' alias rm='rm -i' alias mv='mv -i'
llも前の会社で使い慣れたので同じく無いと不便。
あとは.bash_profileの変更。これはほぼコピペ。
.bash_profile if [ -f ~/.bashrc ]; then . ~/.bashrc fi stty cs8 -istrip -parenb # Usrt specific enviroment PATH=$PATH:/usr/local/bin:/usr/local/mysql/bin BASH_ENV=$HOME/.bashrc export PATH BASH_ENV
投稿者 kengochi : 01:03
2005年07月13日
vodafone3Gの写メールが仕様変更
- [mobile]
みるくここあ: ボーダフォン3G対策。いつのまにやらボーダフォンの3G携帯は写メールの仕様を変更していたらしい。。。
ぐあ。
それでモブログできなくなってたのか、ということで
ボーダフォンウェブ My Vodafone 各種変更手続き「オリジナルメール設定・各種メール設定」 暗証番号入力 1.各種メール設定 4.画像自動変換機能 送信時の設定 「利用しない」にチェックして OKボタン参考URL:
http://www.vodafone.jp/japanese/live/helpinteroperability.html
とすると仕様変更前の状態に戻ります。
いきなりhtmlメールに変更されても困ります。
ていうか3Gの仕様って固まってるのか?ぐらいの謎な状況。
特に702NKはゲームとかアプリとか動かないのばっかりだし。
でも神機なんすけどね。
投稿者 kengochi : 11:04