SSブログ
人口知能 ブログトップ

「おしゃべりな人工知能入門講座」を連載開始! [人口知能]

おしゃべりな人工知能入門講座」は、手軽に読める、会話形式で進む人工知能入門講座です。豊富なイラストで、機械学習やディープラーニングの基本原理、最新の自然言語処理の仕組みが、楽しく面白く、しかも深く理解できます。数式を使わずユーモア小説のように読めてしまう、エンターテイメントな教養書です。

最初は人工知能研究の長い歴史から始め、人工知能とはどのようなものか、どのように研究が進んできたのかを語ります。そして機械学習の原理、深層学習(ディープラーニング)の原理、自然言語処理も詳しく説明していきます。

長期連載になりますので、ぜひお読みください。

■粗筋
地方都市にある企業の研究施設が舞台。そこで開催される2日間の人工知能講座で、大学のイケメン講師が、3名の男女社員に教えることで起きる大騒動。
タグ:人工知能
nice!(0)  コメント(0) 
共通テーマ:パソコン・インターネット

AIがネット小説を分析アドバイスするサービスが始まる [人口知能]

ソフトバンクグループの「ツギクル」が、12/20から小説を分析し、作者によりよい書き方を助言するサービスを始めた。ツギクルは、ネット小説サイトを運営しており、誰でも自分の小説を登録・公開ができ、アクセス数などの人気指標ランキングが見られるサービス。

このAI技術を応用した新たな取り組みでは、ツギクルへの投稿作品を自動分析し、2日ほど経ってから作者にそのレポートを送ってくる。その分析内容は、ツギクルのテキスト解析エンジンが事前に学習したデータをもとにした、「作品に対する総評、カテゴリーとの相性、構成要素、文章の読みやすさ、文章の傾向、文章の構造、相性のよい作品に関する分析」などとなっている。

そこで、さっそく私も12/22の朝9時に、私が書いたホラー系のショートショート(2124文字)を分析依頼したところ、12/24の朝9時に結果のレポートが送られてきた。きっちり2日間で回答している。その結果レポートは以下のようだった。

—【総評】——————————————————————————————
いつもWEBコンテンツポータル「ツギクル」をご利用いただき、ありがとうございます。
ファンタジーブレインで分析した結果、ファンタジーとの相性は512aiと判定されました。
ファンタジー作品の中でも珍しい設定がたくさんありますね。
なかなかバランスが取れた作品ですね。
全体の印象からすると、恋愛の要素も多くみられますので、より意識してみても良いかもしれません。
適度な割合で用語を用いてしっかりとした文章構造になっている作品ですね。
あとは分析結果をチェックしてみてはいかがでしょうか。

素敵な物語をありがとうございました。
分析結果を是非、小説執筆の参考にしてみてください。これからもツギクルをよろしくお願いします!

———————————————————————————
「構成要素分析と相性診断」や「文章の読みやすさ、文章の傾向、文章の構造」のグラフは、私のホームページにある通り。この「ファンタジー」にある「読みやすさ」「傾向」「構造」の分析結果は、文章を形態素解析して「標準的な小説」との分析結果を統計処理しているだけにみえる。だから、ここで比較対象する「標準的な小説」次第で、大きく分析結果が異なるとは思う。どんな小説を「良い」小説としたのか興味はあるので、公開してもらいたいものだ。
このサービスでの「キモ」は、円グラフの「構成要素分析」にあると思うのだが、「恋愛要素」「ホラー要素」「青春要素」「現代文学要素」「童話要素」「その他」の観点で分析されている。サンプルを見ると、これ以外に「SF要素」「ミステリー要素」「ファンタジー要素」などもあり、どうも作品登録時にどのカテゴリーで登録したかで決まるようだ。
私の作品は、小学生が主人公のホラーっぽいショートショートなのだが、なぜか「恋愛要素」が18%と最多要素になっている。作品は公開しているので読んでもらえれば分かるが、恋愛要素は皆無だ。どのように分析しているかは不明だが、おそらく形態素解析した後「特徴となる言葉」を抽出し、その言葉がどんな属性なのかで決めていると想像される。ま~自分で形態素解析して、特徴語を抽出してみれば判明するだろうが、おそらくチューニングしていけば次第に分析レベルは向上していくはず。
ソフトバンクグループが最初にこのようなサービスを始めたのは意外だった。しかしAIというか自然言語処理が着実に高度になってきたので、今後もこのようなサービスが確実に増えていくだろうな。

TickTack World

AI「東ロボくん」は東大入試を諦めるのが早過ぎる [人口知能]

東京大学へ合格することを目指し、センター試験の模試を毎年受けてきた人工知能の「東ロボくん」が、東大合格を諦めたそうである。
毎年、着実に模試の成績を向上させ、今年は有名私立大学に合格したほどの成績だったのに残念なことだ。理由としては、問題文を読み解く「読解力」がなかなか向上せず、国語や英語などの科目で、現在の技術では今後の成績向上が望めないとのこと。

教科書に必ず解答がある歴史や、数式を知っていれば解ける数学などは、AIは得意とするところだ。しかし英語や国語だと、設問に対する直接的な回答が教科書にはないので、正解にたどり着くのは非常に難しいことは容易に想像がつく。しかし、そんなことは2011年に「東ロボくん」というプロジェクトを立ち上げた時点で、判っていたはずだ。

人工知能の分野で、昔から難問と言われている問題に「フレーム問題」と「シンボルグラウンディング問題」がある。「フレーム問題」とは、人間なら誰でも知っている「一般常識」を、どこまで人工知能に学習させなければならないか、という問題。例えば、水が満杯のコップを移動しようとする場合、人間なら水がこぼれないようにそっと持ち上げるだろう。しかしロボットにやらせる場合だと、空のコップと水の入っているコップ、内容物がアイスクリームなら多少傾けても大丈夫だの、ありとあらゆるケースを想定しないといけない。単純な動作でも、その背景に膨大な知識「常識」を用意しなければいけないことが「フレーム問題」である。
「シンボルグラウンディング問題」とは、言葉の持つ意味を理解できるか、という問題だ。つまり、「水」という単語には「液体」とか「透明」とかのような定義がされてはいるだろう。しかし「水」の概念を把握するためには、「飲める」とか「蒸発する」のような外界との相互作用まで把握していないと「理解」したとは言えない、という問題だ。体を持たない人工知能には「意味」を獲得できない、という身体性アプローチの考え方である。

 「東ロボくん」のスタート時点では、ディープラーニングはまだ登場していなかった。したがって、あくまで想像だが「東ロボくん」のアプローチは、従来からある自然言語処理と検索手法、コーパスなどを地道に改良していく手法と思われる。ディープラーニングの最大の成果は今のところ画像認識にあり、入試問題には直接利用できないし、LSTMを応用して作文ができるほど日本語レベルが高いとも思えない。
 とにかく、言葉の持つ意味を理解していない限り解けない「読解」の問題は、「シンボルグラウンディング問題」そのものだ。機械翻訳が構文から文章を作成する方式から、統計学を応用した方式に転換したように、「読解」には何らかのパラダイムシフトが必要なのは確かだ。意味を内包する「概念」にラベリングしたものが言葉なのだから、その概念を何らかの表現形式、コンピュータ内部にメモリ出来るフォーマットに落とし込めれば可能のはず。少なくとも人間の頭脳では実現できているので、ニューラルネットワークの延長線上で実現できそうな気もするのだが・・・。
ま~だから当然、この「東ロボくん」プロジェクトメンバーは、この大問題に真正面から取り組んでいるものだと思っていた。それがわずか5年程度で投げ出してしまったとは情けない。
DeepMind社は10月、ディープラーニングの大きな欠点「破滅的忘却」を、次世代ニューラルネットワーク(Differentiable Neural Computers:DNC)で解決できたのだ。やはり日本もここはあきらめずに、日本の英知を結集して、AIの進化に貢献してもらいたいものだ。

■TickTack World
タグ:人工知能 AI

「よくわかるディープラーニングの仕組み」を出版 [人口知能]

DNN_topHP.jpg10月1日より、ディープラーニング(深層学習)の入門書「よくわかるディープラーニングの仕組み」をAmazonから出版しました。

本書は、従来の数式ばかりの専門家向けディープラーニング解説書とは異なり、カラフルで分かりやすいイラストを多用し、数式は必要最小限に留め、専門家以外の人でもディープラーニングが理解できるようにしています。学生や文系ビジネスマンから、人工知能のプログラミングを始めたい人まで、ディープラーニングとは何か、そして何ができるのか、今後はどのような分野で活用できるのかが理解できると思います。
ディープラーニングの原型であるニューラルネットワークの原理から説き起こし、画像認識のCNN、時系列データを扱うRNN、自然言語処理分野で活用が始まったLSTM、誤差逆伝播法など、最新技術までその仕組みをわかりやすく解説しています。本書を読むことで、ディープラーニングの原理から、その秘めた能力まで理解し、身に付くことができるはずです。

なぜAIは恋愛相談ばかり答えるか [人口知能]

9月6日からNTTレゾナントの「教えて!goo」は、AIが恋愛のお悩みに回答するサービスを始めた。つい先日、「Yahoo!知恵袋」がIBM の「人工知能」Watsonを活用した、恋愛成就の可能性をすぐに答えてくれるサービス「脈ありチェッカーβ」を開始したばかりだ。なぜか最近、AIが回答する恋愛相談所が流行っているようだ。
この「教えて!goo」は、恋愛相談カテゴリーに投稿された質問に、人工知能(AI)の「オシエル」が、過去に投稿したQ&Aから最適な回答を探して回答するというサービス。わざわざ「恋愛系に特化」と明記されてあるのが興味深い。

NTTレゾナントのプレスリリースには、『世界初!AIによる長文回答生成技術』とあり、

=====================================

時系列ディープラーニングを質問と回答のマッチングに応用し、「AIによる長文回答生成」に世界で初めて取り組んでいます。
AIによる回答は、以下の手順で生成されます。
(1) 3,000万件以上のQ&Aデータから、使われている単語の意味やQ(質問)と A(回答)の対応関係、A内の文の組合せを、ディープラーニング(深層学習)を用いて学習し、モデル(型)を作る
(2)投稿されたQに対して、上記(1)で学習したモデルを用いて、質問にマッチする「共感」、「結論」、「理由」を含む文を回答集合より抽出、抽出した文を組み合わせて新たにAを生成する
この技術は、NTTレゾナントが独自に開発したものです。人生相談など答えが決まっていない質問に対し、ディープラーニングを用い、複数の文を組み合わせ、自然な回答を生成する技術としては、世界で初となります。今回、その技術を用いて、サービス化を実現しました。

=====================================

とある。ディープラーニングRNN(Recurrent neural network)の、Bi-LSTM(Bi-directional Long short-term memory)を使っているようだ。『恋愛相談に特化した単語ベクトルを生成し、単語の持つ意味を多次元で数量的に表現することで、表記のみでは捉えられない暗黙的な意味を表現する』とあるが、これが本当なら凄いこと。3000万件の日本語の文章を、LSTMのような計算量の多い処理をするだけでも、莫大な計算機リソースが必要なはず。しかも回答文は、『質問への共感となる文、結論となる文、例示となる文の3文の組合せを、現在の質問に沿って柔軟に組み替え、新たな回答文書を生成して回答』するのだそうだ。

Yahoo!の「脈ありチェッカーβ」の方は、一般的な自然言語処理で質問を感情分析しているだけで、回答も「脈あり」「脈なし」といたってシンプル。それに比べると、さすが日本語処理のトップNTTだけあって、似たようなサービスでもレベルが違う。それにしても、質問に対してAIが日本語で回答する初のサービスを、恋愛相談に特化させる理由はどこにあったのだろうか。

これは私の想像だが、「回答に正解がない。曖昧な回答でも許される。質問と回答の例が膨大にストック内にあり、前例のない質問がないはずなので、必ず回答例がストック内にある」からではないだろうか。もし正解が一つしかない質問だと、不正解ではAIの面目が丸つぶれになる。しかし恋愛相談なら、たとえテキトーに答えても「苦笑」で終われるので都合がよいのだろう。ま~それでも、まっとうな日本語で答えられるのだから、日本語処理の技術レベルは間違いなく日本のトップレベルだろう。
http://gagbot.net/

タグ:人口知能
nice!(0)  コメント(0)  トラックバック(0) 
共通テーマ:日記・雑感
人口知能 ブログトップ

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。