Baidu IME問題から改めてIMEってそもそも何かまとめてみる(追記:早速修正版simeji 6.6.2が公開)

先日からBaidu IMEの情報送信問題が盛り上がっています。
百度バイドゥ)側は許可を取ったものと言っていますが果たしてどうなんでしょうね。
 
確かにIMEを利用する時、情報をクラウドに上げたり取り出したりする際には全ての情報と識別するIDを渡さないといけないというのは理解できます。この辺は色々と論議があると思いますので注目していきたいと思います。
 
追記:早速修正バージョンが出たようです。デフォルトでクラウド機能がオフになっているようですね。 simeji 6.6.2
 
せっかくの機会なのであまり意識した事がなかったIMEについてまとめたいと思います。なんだかんだで無意識に使っていた気がします。
 
IME(Input Method Editor)とは、コンピューター上で日本語など非アルファベット文字の入力を補助するソフトウェアの事です。
そう、パソコンで日本語のようなマルチバイト文字を表現する時に欠かすことができないのがIME。もう少し詳しく書くと、アルファベットは全て半角だけで表現することができますが、日本語の場合、ひらがなもカタカナも漢字もあり入力する時もローマ字入力であれば複数文字の組み合わせで表現しています。こういった文字の変換の際に欠かせないのがIMEです。
 
実はIMEにも色々と種類があります。フリーソフトにも日本語入力ソフトという事でたくさんのフリーソフトがあります。Google 日本語入力を筆頭にATOKMicrosoft IME、Office IMEまで色々ありますね。このサイトにもBaidu IMEはあります。
 
Windows を使っている方は無意識のうちにMicrosoft IMEを利用している方も多いかもしれません。Office IME 2007の時には色々とあって結局標準のMicrosoft IMEに戻したような記憶もあります。もう修正されていると思いますが。
それでも変な変換が許せない人は日本製老舗ソフトのATOKジャストシステム)を使っているかもしれません。昔の一太郎で使われていたものですね。
 
基本的にパソコンのローカルにインストールされているソフトウェアなのですが今回のBaidu IME等はクラウド上にデータストアを持っていてそこで管理されている入力変換候補を使うものです。
 
主にやっている事は
・辞書登録の取得
・変換候補自動学習の取得(クラウド変換)
 
では何が便利なのか
辞書登録と学習、これはローカルでもやっていた事ですが、クラウドIME(勝手に命名)所謂クラウド変換の場合はローカルでない分、どのデバイスでも同じような辞書を使えて変換候補を使う事ができるので使えば使う程制度が高くなる(はず)
 
それによって変換の効率がよくなります。人それぞれ使うよく使う単語違う場合もあるし業界特有の専門用語などを辞書登録して業務の効率化を図る場合もあるでしょう。
 
ただ、世の中そんなにいい事ばかりではなくて自動学習にも弊害はあります。
よく使う単語が恥ずかしいものであった場合、人に見せられないような単語が登録されて恥ずかしい辞書が出来上がっている可能性もあるし、当然、誤字を蓄積することで誤字が先に出ることもあるのである程度のメンテが必要な場合もあります。
 
ちなみにこんな使い方はNGだと思います。
毎回クレジットカードナンバーを入力するのが面倒だから、くれじっと、と入力するとナンバーが表示される。私には怖くてできません。
 
ちなみにメンテ方法です。
ただ辞書ツールを使って変換候補に変なものがあれば削除すれば大丈夫です。クラウド変換の方法はよく分かりませんでしたがiphoneの場合はユーザー辞書で削除できるようです。
 
ここまで書いてきてやっとIMEってこんなものなんだという事が多少なりとも見えてくると今回気をつけないと行けない点が見えてきます。Baidu IMEが有効になっていない時は送信はされていません。有効時というのはひらがなや漢字を入力して変換をかけた時に有効になります。ということは変換が必要ない半角入力の際には動きません。と言う事は直接入力をしているパスワードについては基本情報が送信されたという事は無いはずです。ただ全角入力をしたり変換をかけた場合はその限りではありません。
 
こういった内容を頭に入れておくと使っていいのか悪いのか判断がつくと思います。
パソコンだスマホだと色々なデバイスが周りにたくさん有る訳ですから利用者が少しでもそういった知識を頭に入れておいて自己防衛して行かないといけない時代なのかもしれませんね。
 
このサイトはとても今回のBaidu IMEの問題について詳しく書いています。
 
是非参考に見ていただければと思います。
 
最後に、実際はsimejiの日本語入力は賢いという情報もあったくらいで利用者側も便利な恩恵を受けていた訳ですし全部が悪と言えるのか、どうなんでしょう。
ネットエージェンとはアップデートをされるまで利用は控えるようにとの事でしたがバイドゥ側も早急にアップデート(simeji 6.6.2)を出していますので確認してみるといいと思います。
あくまで知らないで使っているという状況がマズいという事を再認識する事案だったのではないでしょうか。
 
 
今回のBaidu側の対応等の情報
 
simejiの問題を修正したバージョンの情報 simeji 6.6.2