知能情報・生体工学研究室 > 自然言語処理グループ > 吉田光男 > コンテンツ抽出ルール(CSS)自動獲得
「CSSセレクタで表現されたコンテンツ抽出ルールの自動獲得(楽天研究開発シンポジウム2009)」のデモシステムです。
抽出ルールを獲得したいブログサイトの記事URL(パーマリンク)を3つ入力してください。
獲得したルールは、 Firefox の ユーザスタイル機能 や Web Developer を利用すれば適用・表示ができます。
ソースコードは ExtractUniqueBlock に組み込んで公開を予定しています。
※利用者のIPアドレスを記録しています(頻度の高い連続利用はDoSアタックとなりうるため)
2009.11.13 更新2009.11.13 公開