‘perl’ カテゴリーのアーカイブ

cpanの使い方の整理

2009年7月30日 木曜日

cpanのモジュール群を使いたいというのでperlを使い始めたんですが、肝心のcpanの使い方がイマイチ解っていなくて、いつも恐る恐る使っていたので、メモ代わりにまとめる事にしました。

(続きを読む…)

Web::ScraperでHTML::Elementを抜き出したい件

2009年7月21日 火曜日

もっぱらHTMLからのデータ抽出ではWeb::Scraperを使っているんですが、
時々タグの中身や属性ではなく、HTML::Elementを抽出したくなる時があります。

(続きを読む…)

ネストしている要素をXPathのpositionを使用して取得する

2009年7月8日 水曜日

解りにくいタイトルですね。例えば以下のようなHTMLを考えます。

(続きを読む…)

perlでTreeTaggerを使う

2009年5月3日 日曜日

英語の文章からキーワードを抽出したくなったので
形態素解析ツールを探していた所、TreeTaggerというツールを見つけました。
英語の他にもフランス語、ドイツ語など色々などにも対応しているようです。

英語以外は解りませんので、英語をインストールしました。

(続きを読む…)