2017年06月09日

機械学習の落とし穴

こんにちは。
マーケティング・営業担当の池田です。

さて、もうだいぶ前から「弊社でもAI人工知能)に取り組んでいる」というようなことを言っておりますが、
現時点で、AIを用いたアプリケーションを提供できるところまでになってきました。
現在は、AIが取り込む学習データをチューニングして、その精度をあげることに注力しているところです。
当然、データサイエンティストなどいるはずもなく、四苦八苦、試行錯誤の日々です。
実際に作業しているのは私ではありませんが(苦笑)
ただ、マーケティング・営業担当としては、苦労は苦労でリアルにお伝えすることが役目と思っています。
よりリアルにお伝えするためには、それなりの知識を身に付けなければ・・・
というわけで「それにはまず機械学習からでしょう」という発想に至り、
機械学習について時間があればいろいろ調べたりなどしております。

そこで今回は、まだ知識が浅いなりに「機械学習」について語ってみたいと思います。
まぁ“語る”とは言っても当然内容は薄いので、自分のための備忘録程度にしかまとまりませんが(苦笑)、
「素人はこんなことを思うのだなぁ」という目線で何かの役に立てれば幸いです。

では、ここからが備忘録です(笑)

昨今のAIの盛り上がりによって「機械学習」という言葉もよく耳にするようになりましたが、
機械学習を端的に一言で表現すると・・・

機械学習(きかいがくしゅう、英: machine learning)とは、人工知能における研究課題の一つで、
人間が自然に行っている学習能力と同様の機能をコンピュータで実現しようとする技術・手法のことである。
出典:Wikipedia

この説明からも分かる通り、
AIとは機械学習のことである」
AIを知ることは機械学習を知ること」
などと言っても言い過ぎではないほど、AI機械学習は密接に関係しています。

ちなみに、AI人工知能)についてのWikipediaの説明はこちら。

人工知能(じんこうちのう、英: artificial intelligence、AI)とは、
人工的にコンピュータ上などで人間と同様の知能を実現させようという試み、
或いはそのための一連の基礎技術を指す。
出典:Wikipedia

人工知能AI)」と「機械学習」のそれぞれの説明の一部を並べてみます。

「人間が自然に行っている学習能力と同様の機能をコンピュータで実現しようとする技術・手法のことである。」
「人工的にコンピュータ上などで人間と同様の知能を実現させようという試み、
 或いはそのための一連の基礎技術を指す。」

人工知能AI)」と「機械学習」、どちらを主語にして読んでみても違和感ありませんよね?
仮に最初から入れ替えて文章を見せられたとして、私だったらそれに気が付く自信はありません(笑)

機械学習」という言葉は、昨今のAIの盛り上がりによってよく耳にするようになりましたが、
特段、新しい考え方ではありません。
今のこのAIブームが「3次」と言われるようにAIそのものが最新技術というわけではありませんので、
前述の通り機械学習無くしてAIはあり得ないということを踏まえれば、機械学習は以前から存在していて、
AIの注目度と共に機械学習も多くの人の関心を引くようになったということにすぎないわけです。
そのような背景もあり、機械学習については長い間に渡って研究されてきている概念ですから、
調べてみると情報量もハンパではありません。
しかも、「特微量」「パーセプトロン」「バックプロパゲーション」など、
とにかく次から次と(私にとっては)新しい単語に出会います。
それも難解な数式と共に。。。
学術的に理解するとなると今の私の手には負えませんので、
そちらの分野の説明はここでは割愛させて頂きますね(苦笑)

では、機械学習の何をまずは知るべきかと言うと、“手法”でしょうか。
問題と正解のデータを与えてその特徴を学ばせる教師あり学習
正解データだけを与えて自ら特徴を見出すように学ばせる教師なし学習
長期的に考えた時に価値を最大限化する行動を重視する強化学習
などがあります。
実はここから更に細分化された手法が数々ありますが、また学術的な話になりますので割愛、と。。。(笑)

ところで、AIを賢く育て上げたいならデータを大量に与えれば与えるほど良い
というイメージがありませんか?
しかし、データの与え方を上手くコントロールしないとオーバーフィッティングという
弊害を招く恐れがあるようです。
オーバーフィッティングとは、日本語に訳すと「過学習」、統計学では「過剰適合」とも呼ばれるそうですが、
どのような状態かと言うと・・・

過剰適合(かじょうてきごう、英: Overfitting)とは、統計学や機械学習において、
訓練データに対して学習されているが、未知データ(テストデータ)に対しては適合できていない、
汎化できていない状態を指す。
出典:Wikipedia

つまり、人間で言えば、丸暗記と同じような学習の仕方をするようになってしまうのだそうです。
通常なら、訓練データから特徴や傾向をつかんで類似の事柄に適応していくようになっていくはずですが、
丸暗記ですからそんな応用力など身に付くはずもありませんよね。
AIも、楽をしたいと考えるようになるのでしょうか?
そう考えると、なんだかとても人間臭い感じがしてきますね。

過学習の防止策としてはドロップアウトという手法を用います。
機械学習の方法によってドロップアウトの具体的手法も異なりますが、
簡単に言ってしまえば「楽をして覚えさせない」ということになるでしょうか。
私には詳細を正しく説明する自信がありませんので(苦笑)、
具体的手法を知りたい方は他のサイトをご覧下さい。

さて、弊社のAIプロジェクトの訓練状況ですが、過学習どころかまだまだ未学習に近い状態です。
これからどんどん教え込む必要がありますが、
ある時期を過ぎたら「確信度が100%に近づいた!」と安易に喜ぶのは早計だ、
という心構えは必要なのかもしれませんね。
今後の学習状況については、ご報告できることがあればお伝えしていきますので、お楽しみに!


posted by CBIT池田 at 17:15 | Comment(0) | その他 | このブログの読者になる | 更新情報をチェックする

2017年05月26日

AI(人工知能)がデザインする世界

こんにちは。
マーケティング・営業担当の池田です。

冒頭では毎回「マーケティング・営業担当の・・・」と自己紹介しておりますが、
実は時々、デザインも担当することがあります。
「デザイン」と言ってしまうと大げさですが、主な作業はバナーやアイコンなどの作成です。
「わざわざ外注するまでもないけれど、ちょっとした画像が必要」という場合の役どころです。
でも、これが結構時間かかるんですよ(苦笑)
プロのデザイナーならささっと作れてしまうのでしょうけどねぇ。
イメージをなかなか形に出来なかったり、そもそもイメージさえ思い浮かばなかったり・・・

しかし、AI人工知能)はそんなデザインの悩みも解決してくれそうです。

AIによるロゴデザインサービス Logojoy
https://www.logojoy.com/

ロゴデザインのサービスはいくつか見かけますが、
「Logojoy」AI機械学習のノウハウを活用しているそうです。

使い方は簡単!
  1. 社名やサービス名などを入力する。
  2. サンプルの中から好きなデザインを選ぶ。
  3. カラーパターンを選ぶ。
更に、キャッチコピーやシンボルを入れることも出来ます。
気に入ったロゴが出来るまでいくつでも作れます。

なかなかいい感じではありませんか?
海外のサービスなので日本語での作成が出来ないのが惜しいですね。
それと、作成は無料ですがダウンロードするとなると購入する必要があります。

ところで、AIの分野では画像認識が最も進歩していると言われていますが、
Googleからこんなゲームがサイト上で公開されているのを知っていますか?

あなたが描いた絵をAIは理解できるか? Quick,Draw!
https://quickdraw.withgoogle.com/

Google翻訳の文字認識の技術を応用したもので、キーワードで出されるお題に絵で答えるゲームです。
6問連続で出題され、1問につき制限時間は20秒。
お題は「自動車」「フクロウ」「口紅」など様々ですが、
戸惑っているとあっと言う間に持ち時間がなくなります(汗)
終了すると、描いた絵がお題通り認識されたかどうかが結果として出ます。
また、他の人が描いた絵を見ることも出来ます。

おもしろいので試してみました。

AIからのお題は・・・
「map (地図)」
「potato (じゃがいも)」
「necklace (ネックレス)」
「firetruck (消防車)」
「piano (ピアノ)」
「flashlight (懐中電灯)」

「地図」「じゃがいも」「ネックレス」までは比較的描きやすいお題だったのですが、
「消防車」「ピアノ」「懐中電灯」って・・・いきなり難易度高くない?!

とりあえず、結果だけお見せしますね。
base64test

下手な絵の割に、意外に成績は良かったような・・・?
「ピアノ」なんて、「こんな絵なのによくぞ認識してくれた!」という感じです(苦笑)
AIの進歩が証明されましたね(笑)

まぁ、上の絵をご覧の通り、少なくとも私が「デザインが苦手だ」と言うことはお分かり頂けたことでしょう。




社内情報共有・ナレッジマネジメントなら「ナレッジリング」
posted by CBIT池田 at 12:42 | Comment(0) | その他 | このブログの読者になる | 更新情報をチェックする

2017年05月14日

人工知能(AI)と法律

こんにちは。
ナレッジリング開発・マーケティング担当の鈴木です。

5月ですね。
この時期になると新聞やテレビなどで良く目や耳にする言葉に「五月病(ごがつびょう)」
という言葉があります。
「五月病(ごがつびょう)」とは
「新人社員や大学の新入生や社会人などに見られる、
新しい環境に適応できない事に起因する精神的な症状の総称」
だそうです。
(出典:wikipedia)

日本では新年度が4月となる会社や学校が多いため、新しい環境にうまく適応出来ずに、
長期休暇となるゴールデンウィーク中に疲れが一気に吹き出す事が多いので
ゴールデンウィーク明けのこの時期にこの症状を訴える人が多いのだとか。
それなのでゴールデンウィークの無い諸外国には五月病という言葉はないそうです。
その代わりにキリスト教圏ではクリスマス時期の長期休暇後の憂鬱な気分を表す言葉として
January Blues(1月病)という言葉があるそうです。
ちなみにこれらの憂鬱な気分は医学的には「適応障害」や「うつ病」と診断されるようです。
五月病の対応策ですが「ストレスをためないように心がけるのが良い」とwikipediaに書いてありました。
「それは果たして対応策なのか?」そういう疑問が頭にこびりついて離れない今日この頃です。

さて、今回も人工知能(AI)に関する話題を一つ。
先月になりますがちょっと興味深い記事を見つけましたのでこの場を借りてご紹介させていただきます。
なんでも「人工知能がレンブラントの“新作”絵画を描いた」のだとか。
(出典:itmedia)

レンブラントと言えば、ご存知のように17世紀のオランダ人の画家でバロック絵画を代表する画家の一人です。
このほどMicrosoft、オランダのデルフト工科大学などの共同チームが約1年半をかけて
レンブラントが描いた前346作品をスキャンした画像データをディープラーニングで人工知能に学習させた後に、
「帽子を被り、白い襟付きの黒い服を着た30〜40代の男性」というテーマを与えて
3Dプリンタを使用してレンブラントの新作を描かせたそうです。
出来上がった作品はレンブラントの347番目の作品といわれてもわからないほど精巧な出来栄えに仕上がった
ようです。

このように人工知能が作った創作物は現行の法律ではどうなっているのでしょうか。
仮に現行の法律を全くいじらなかった場合、AI創作物に関する権利は下図のように整理されるようです。
無題.jpg

(出典:「次世代知財システム検討委員会 報告書」23ページ目より抜粋])

上から
  1. 人間による創作 → 権利が発生
  2. AIを道具として利用した創作 → 権利が発生
  3. AIによる創作 → 権利は発生しない?
となっていて、今回のレンブラントの新作の場合には3のAIによる創作にあたるので、
現行の日本の法律では著作権者が存在しないパブリックドメインの作品(著作権フリー)という見方
になるようです。
ただし、現行法のままですと
こうした分野での人工知能(AI)を利用するビジネス上のメリットが少ない事から、
人工知能(AI)関連の投資が活発となるように
今後法律が見直されていく方向に進んでいくのではないでしょうか。
内閣の知的財産戦略本部では「知的財産推進計画」として議論が継続しているようなので
今後の動向を見守っていきたいと思います。
自動運転に関連してもそうですが人工知能関連の技術の進展にしたがい
法律が見直される段階に来ているのかも知れません。

最後になりましたが弊社の人工知能に関する取組みですが、ゆっくりとですが進んでおります。
まだ具体的に何がどうこうとご報告できる段階ではございませんが、
もう少し形になりましたらご報告させていただければと思います。
それでは今回はこのへんで!




続きを読む
posted by CBIT鈴木 at 17:57 | Comment(0) | その他 | このブログの読者になる | 更新情報をチェックする