クローラで日本語情報を収集してると、ひらがな・カタカナを相互に変換したい事が割とあります。毎回適当に処理するのが嫌になってきたので、相互変換するpythonモジュールを書きました。
使い方は以下の様な感じです。
>>> from jcconv import * >>> print hira2kata('あいうえお') # hiragana to katakana アイウエオ >>> print kata2hira('カタカナ') # katakana to hiragana かたかな >>> print half2hira('ハンカクカタカナ') # half-width kana to hiragana はんかくかたかな >>> print half2wide('hello jcconv') # half-width alphabet to wide-width hello jcconv >>> print wide2half('WIDE') # wide-width alphabet to half-width wide
unicodeを入力したらunicodeで、stringを入力したらstringで変換後の文字列が返却されます。上の例でも書いている様に、平仮名・カタカナの変換に加えて全角英数字・半角英数字の変換もできます。
今回も調子にのってpypiに登録したのでインストールはeasy_installから。
$ easy_install jcconv
ちなみにjcconvはJapanese Characters CONVerterの略で、JoshiChugakuseiCONVerterではありませんのであしからず。
2009/12/14 追記
全角・半角変換でascii記号の変換も行うようにしました。
>>> print half2wide("^^;)") ^^;)

