知能情報・生体工学研究室 > 自然言語処理グループ > 吉田光男 > コンテンツ抽出ルール(CSS)自動獲得

コンテンツ抽出ルール(CSS)自動獲得

「CSSセレクタで表現されたコンテンツ抽出ルールの自動獲得(楽天研究開発シンポジウム2009)」のデモシステムです。

URL 1 :
URL 2 :
URL 3 :

抽出ルールを獲得したいブログサイトの記事URL(パーマリンク)を3つ入力してください。

獲得したルールは、 Firefox の ユーザスタイル機能Web Developer を利用すれば適用・表示ができます。

ソースコードは ExtractUniqueBlock に組み込んで公開を予定しています。

※利用者のIPアドレスを記録しています(頻度の高い連続利用はDoSアタックとなりうるため)


2009.11.13 更新
2009.11.13 公開