Social IMEをコマンドラインから

Web 2.0時代のかな漢字変換WebサービスSocial IME」がAPIを公開している。これがWebサービスとかRESTとか、JSONとか、そんなややこしいものじゃなくて、単に「/api?string=」で文字列を渡せば、ペロンとタブ区切り、改行区切りの変換候補文字列がプレーンテキストで返ってくるというシンプルさ。

http://www.social-ime.com/api/?string=ここにかなもじをいれる

というので、Rubyでやってみた。

#!/usr/bin/ruby
require "open-uri"
require "uri"
require "kconv"

API = "http://www.social-ime.com/api/?string="

str = ARGV.shift

open(URI.escape(API+str)) do |f|
  f.each do |line|
    print "[", line.toutf8.split.join(""), "]\n"
  end
end
$ ruby sime.rb あなたとはちがうんです

[貴方とは、あなたとは、アナタとは、貴女とは、貴男とは、アナタトは、アナタトハ]
[違うんです、ちがうんです、ちゃう((〓_〓 )( 〓_〓))ちゃうんです、
ヾ(〓o〓;)チガウッテバ、、、んです、チガウンデス]

$ ruby sime.rb きかんしゃとーますにのりたいね
[きかんしゃトーマスに、機関車トーマスに、きかんしゃとーますに、
キカンシャトーマスに、キカンシャトーマスニ]
[乗りたいね、のりたいね、載りたいね、ノリタイネ]

$ ruby sime.rb きかんしゃ
[機関車、帰還者、気管支ゃ、機関紙ゃ、季刊誌ゃ、機関誌ゃ、機関士ゃ、帰還しゃ、
帰艦しゃ、帰館しゃ、期間しゃ、機関しゃ、季刊しゃ、器官しゃ、基幹しゃ、旗艦しゃ、
気管しゃ、既刊しゃ、奇観しゃ、貴官しゃ、きかんしゃ、キカンシャ]

うーん、分節区切りは最長一致かしら。