ひらがな・カタカナ・半角カナを相互に変換するjcconvを書いた

クローラで日本語情報を収集してると、ひらがな・カタカナを相互に変換したい事が割とあります。毎回適当に処理するのが嫌になってきたので、相互変換するpythonモジュールを書きました。

使い方は以下の様な感じです。

>>> from jcconv import *
>>> print hira2kata('あいうえお')   # hiragana to katakana
アイウエオ
>>> print kata2hira('カタカナ')     # katakana to hiragana
かたかな
>>> print half2hira('ハンカクカタカナ')      # half-width kana to hiragana
はんかくかたかな       
>>> print half2wide('hello jcconv') # half-width alphabet to wide-width
hello jcconv
>>> print wide2half('WIDE')     # wide-width alphabet to half-width
wide

unicodeを入力したらunicodeで、stringを入力したらstringで変換後の文字列が返却されます。上の例でも書いている様に、平仮名・カタカナの変換に加えて全角英数字・半角英数字の変換もできます。

今回も調子にのってpypiに登録したのでインストールはeasy_installから。

$ easy_install jcconv

ちなみにjcconvはJapanese Characters CONVerterの略で、JoshiChugakuseiCONVerterではありませんのであしからず。

2009/12/14 追記
全角・半角変換でascii記号の変換も行うようにしました。

>>> print half2wide("^^;)")
^^;)

Leave a Reply

Your email address will not be published. Required fields are marked *