今週気になったニュースです。

 参考記事
『「私はロボットではありません」AIで突破 他のディープラーニングより"300倍"効率的なモデルが登場』(2017.10.27 ITmedia NEWS:http://www.itmedia.co.jp/news/articles/1710/27/news112.html)

Gmailとかのサービスを使うときによく見る変形した文字を読み取る認証方法が「CAPTCHA」と言うんだけど、これに表示される文字を認識出来る学習モデルを作成出来てしまったというお話。

正確にはもともと文字を認識するモデル自体はあったみたいだけど、その効率が300倍と劇的に向上したらしい。
「再帰的皮質ネットワーク」というモデルでおなじみの人間の脳の働きを参考にして作成されている。
少数の例から学習して一般化出来る能力をヒントにしたみたい。

この結果1文字当たり5つの訓練用の変形された文字を用意するだけで、他の変形した形でも認識が出来る様になった。
具体的には文字画像の文字ベースで94.3%、単語ベース66.6%の精度で認識出来るとのこと。
まだまだ熟語での正答率が高くないとは時間の問題なんだろうな。


この学習モデルがもし悪意あるハッカー等に渡れば・・・、後はもう何も言う必要も無い。


「CAPTCHA」の人間だと判断するアルゴリズムに修正が必要なのは間違いない。