Social IMEをコマンドラインから
Web 2.0時代のかな漢字変換Webサービス「Social IME」がAPIを公開している。これがWebサービスとかRESTとか、JSONとか、そんなややこしいものじゃなくて、単に「/api?string=」で文字列を渡せば、ペロンとタブ区切り、改行区切りの変換候補文字列がプレーンテキストで返ってくるというシンプルさ。
http://www.social-ime.com/api/?string=ここにかなもじをいれる
というので、Rubyでやってみた。
#!/usr/bin/ruby require "open-uri" require "uri" require "kconv" API = "http://www.social-ime.com/api/?string=" str = ARGV.shift open(URI.escape(API+str)) do |f| f.each do |line| print "[", line.toutf8.split.join("、"), "]\n" end end
$ ruby sime.rb あなたとはちがうんです [貴方とは、あなたとは、アナタとは、貴女とは、貴男とは、アナタトは、アナタトハ] [違うんです、ちがうんです、ちゃう((〓_〓 )( 〓_〓))ちゃうんです、 ヾ(〓o〓;)チガウッテバ、、、んです、チガウンデス] $ ruby sime.rb きかんしゃとーますにのりたいね [きかんしゃトーマスに、機関車トーマスに、きかんしゃとーますに、 キカンシャトーマスに、キカンシャトーマスニ] [乗りたいね、のりたいね、載りたいね、ノリタイネ] $ ruby sime.rb きかんしゃ [機関車、帰還者、気管支ゃ、機関紙ゃ、季刊誌ゃ、機関誌ゃ、機関士ゃ、帰還しゃ、 帰艦しゃ、帰館しゃ、期間しゃ、機関しゃ、季刊しゃ、器官しゃ、基幹しゃ、旗艦しゃ、 気管しゃ、既刊しゃ、奇観しゃ、貴官しゃ、きかんしゃ、キカンシャ]
うーん、分節区切りは最長一致かしら。