‘perl’ タグのついている投稿

Web::ScraperでHTML::Elementを抜き出したい件

2009年7月21日 火曜日

もっぱらHTMLからのデータ抽出ではWeb::Scraperを使っているんですが、
時々タグの中身や属性ではなく、HTML::Elementを抽出したくなる時があります。

(続きを読む…)

perlでTreeTaggerを使う

2009年5月3日 日曜日

英語の文章からキーワードを抽出したくなったので
形態素解析ツールを探していた所、TreeTaggerというツールを見つけました。
英語の他にもフランス語、ドイツ語など色々などにも対応しているようです。

英語以外は解りませんので、英語をインストールしました。

(続きを読む…)