もぶろげっとの研究発表
もぶろげっとの中の人が 修士論文の発表をするという情報をゲットしたので行ってきました。 最初はもぶろげっとの発表だけ聴くつもりだったんですが、 直前のロボカップサッカーの 発表も面白かったです。
発表自体は面白かったんですが、 もっと質疑応答の時間があればもっとよかったです。 3分でしたっけ。
訊きたいことはいろいろあったんですよ。 負荷をどうやって捌いているのかとか、 検索の自然言語処理の側面はどうなってるのかとか、 HTMLを解釈する話はあったけどRSSはどうしてるのかとか、 ポルノ関係はフィルタリングできないかとか、 精度を上げるにはどんな方法がいいのかとか。
1つだけ質問もしました。 「実験で検索クエリの上位30語を使ってるけど、具体的には何?」。 アニメ関係、アイドルの名前、「無印良品」だそうです。 無印良品がよくわかんない。 エッチな言葉は実験には使ってないけど、上位のかなりの部分を占めているそうです。
クエリの件はけっこう予想通りかな。 画像つきブログ検索はブログ記事を探すのに便利、 文字だけより写真があった方が楽しい、みたいな建前なんですが、 実際にはエロ画像収集とかに使われてるんじゃないですかね。
あ、今思いついた疑問なんですが、この研究の目的は 「クエリに適合した画像を検索する」のと 「クエリに適合した記事を検索する。 記事をよりわかりやすくするため画像を表示する」のと、どちらなんでしょう。 前者かな。