配列や連想配列をディスパッチテーブルとして利用していると、キーに正規表現を使いたくなる事があります。perlだと既にRegexp::Assembleというモジュールを使う方法が書かれていますが、僕はpythonで書きたい訳です。
Pythonで辞書のキーに正規表現を使いたいという話




2010年2月12日
BeautifulSoupでスクレイピングのまとめ




2010年2月10日
何度かBeautifulSoupについては書いているのですが、未だに使い方が覚えられずにイライラします。仕方が無いのでまとめて置く事にしました。BeautifulSoupはHTMLから情報を取得するだけ無く、HTMLの編集もできますが、ここではスクレイピング用途のみに絞っています。
XML::Simpleっぽいpythonモジュール書いた




2010年2月4日
Yahooの形態素解析APIを使おうと思ったら、XML形式しか対応してなかったので、Perlで言うところのXML::Simpleなpythonモジュールを探したのですが見つかりませんでした。XML::SimpleはXMLとPerlのハッシュ(と配列の混合オブジェクト)を相互に変換するモジュールで、ちょっとしたXMLの処理をするには非常に便利なので残念です。普通にDOMを弄っても良かったのですが、Python クックブックにベースとなるコードを見つけた事もあり、勢いでXML::Simpleを(中途半端に)移植してみました。
[perl] ハッシュのスライスと多次元ハッシュのエミュレーション




2010年1月28日
XML::Simpleのコードを読んでいると以下の様な表現が頻繁に出てきました。問題は8行目なのですが、ハッシュをリストコンテキストで扱っているのですが、初めて見る表現で、調べるのにも少し手こずったのでメモしておきます。
#!/usr/bin/perl use Perl6::Say; use YAML; my @keys = qw(key1 key2); my @vals = qw(val1 val2); @dic{@keys} = @vals; # 問題の行 say Dump \%dic; # 出力は以下のようになります # --- # key1: val1 # key2: val2
wordpressを整備した(2)




2010年1月13日
半年前に少し整備したこのブログですが、整備の甲斐があったのか少しずつアクセスが伸びていて結構嬉しいです。平日は150 ~ 300、休日で50 ~ 100程度のアクセス数になりました。そこで恥ずかしくないように、年末から年始にかけて整備を進めました。