ビジネスで使う機械学習：SSブログ

	ブログをはじめるログイン

「おしゃべりな人工知能入門講座」を連載開始！　[人口知能]

「おしゃべりな人工知能入門講座」は、手軽に読める、会話形式で進む人工知能入門講座です。豊富なイラストで、機械学習やディープラーニングの基本原理、最新の自然言語処理の仕組みが、楽しく面白く、しかも深く理解できます。数式を使わずユーモア小説のように読めてしまう、エンターテイメントな教養書です。

最初は人工知能研究の長い歴史から始め、人工知能とはどのようなものか、どのように研究が進んできたのかを語ります。そして機械学習の原理、深層学習（ディープラーニング）の原理、自然言語処理も詳しく説明していきます。

長期連載になりますので、ぜひお読みください。

■粗筋
地方都市にある企業の研究施設が舞台。そこで開催される2日間の人工知能講座で、大学のイケメン講師が、3名の男女社員に教えることで起きる大騒動。

タグ：人工知能

2019-06-10 13:32 nice!(0) コメント(0)
共通テーマ：パソコン・インターネット

「未来IT図解これからのAIビジネス」を発売します　 [AIビジネス]

「未来IT図解これからのAIビジネス」を執筆しました。全国の書店で買えますので、ぜひお読みください。

内容は「AIビジネス」の入門書で、AIビジネスの勘所やノウハウ、さらにはAI時代にふさわしい人材になるどうすればよいか、日本の将来像までを描きました。AI時代に備えて、ビジネスパーソンはどうすべきか、学生は何を勉強すればよいかが分かるはずです。

目次は以下のようになっています。
序章　人工知能の登場
第1章　人工知能とは何か
Section1-1：AIテクノロジーの応用領域
Section1-2：機械学習の種類
Section1-3：機械学習の特徴
Section1-4：予測の仕組み
Section1-5：分類の仕組み
Section1-6：ニューラルネットワークとは
Section1-7：画像生成とは
Section1-8：自然言語処理
Section1-9：自然言語処理２
Section1-10：強化学習
Section1-11：スパースモデリング
★コラム「天才アラン・チューリングの栄光と悲劇」
Section2-1：AIビジネスのマーケット
Section2-2：自動運転車
Section2-3：自動運転車の技術
Section2-4：自動運転車でのAIテクノロジー
Section2-5：自動運転車における課題
Section2-6：ヘルスケア
Section2-7：ヘルスケア2：医療画像解析
Section2-8：ヘルスケア3：診断支援
Section2-9：ヘルスケア4：創薬
Section2-10：フィンテック1
Section2-11：フィンテック2
Section2-12：HRテック１
Section2-13：HRテック２
Section2-14：チャットボット
Section2-15：スマートスピーカー
Section2-16：インフラ1
Section2-17：インフラ2
Section2-18：マーケティング
★コラム「仮説設定ができる夢の人工知能」
第3章　AI活用の時代
Section3-1：AIテクノロジーの特性
Section3-2：AIテクノロジーの特性2
Section3-3：AIビジネスの課題
Section3-4：AIビジネスの条件
Section3-5：PoCでの課題
Section3-6：クライアントとベンダーの役割
Section3-7：AIビジネスの投資効果
Section3-8：デジタル・ディスラプターの脅威
Section3-9：労働人口の減少と労働生産性
Section3-10：企業のサバイバル術1
Section3-11：企業のサバイバル術2
Section3-12：労働生産性向上の方策
Section3-13：RPAとは
Section3-14：RPAから始める理由
★コラム「人工知能研究の創始者ミンスキー」
第4章　AI時代の人材
Section4-1：AIテクノロジーの汎用性
Section4-2：AIが職業に与えるインパクト1
Section4-3：AIが職業に与えるインパクト2
Section4-4：政府の人材政策1
Section4-5：政府の人材政策2
Section4-6：求められる人材
Section4-7：高速進化の続くIT業界
Section4-8：求められる変化への対応力
Section4-9：サバイバルに勝つスキルとは1
Section4-10：サバイバルに勝つスキルとは2
Section4-11：サバイバルに勝つスキルとは3
★コラム「人工知能はデータサイエンティストを駆逐するか」
第5章　変容する社会における企業の姿
Section5-1：世界の新しい潮流-SDGs
Section5-2：日本の方向性-Society 5.0
Section5-3：Society 5.0が描く将来の日本1
Section5-4：Society 5.0が描く将来の日本2
Section5-5：Society 5.0が描く将来の日本3
Section5-6：人工知能の産業化
Section5-7：企業とビジネスの未来
★コラム「人工知能の未来」

タグ：AI ビジネス

2018-11-01 15:28 nice!(1) コメント(0)

AIがネット小説を分析アドバイスするサービスが始まる　 [人口知能]

ソフトバンクグループの「ツギクル」が、12/20から小説を分析し、作者によりよい書き方を助言するサービスを始めた。ツギクルは、ネット小説サイトを運営しており、誰でも自分の小説を登録・公開ができ、アクセス数などの人気指標ランキングが見られるサービス。

このAI技術を応用した新たな取り組みでは、ツギクルへの投稿作品を自動分析し、2日ほど経ってから作者にそのレポートを送ってくる。その分析内容は、ツギクルのテキスト解析エンジンが事前に学習したデータをもとにした、「作品に対する総評、カテゴリーとの相性、構成要素、文章の読みやすさ、文章の傾向、文章の構造、相性のよい作品に関する分析」などとなっている。

そこで、さっそく私も12/22の朝9時に、私が書いたホラー系のショートショート（2124文字）を分析依頼したところ、12/24の朝9時に結果のレポートが送られてきた。きっちり2日間で回答している。その結果レポートは以下のようだった。

—【総評】——————————————————————————————
いつもWEBコンテンツポータル「ツギクル」をご利用いただき、ありがとうございます。
ファンタジーブレインで分析した結果、ファンタジーとの相性は512aiと判定されました。
ファンタジー作品の中でも珍しい設定がたくさんありますね。
なかなかバランスが取れた作品ですね。
全体の印象からすると、恋愛の要素も多くみられますので、より意識してみても良いかもしれません。
適度な割合で用語を用いてしっかりとした文章構造になっている作品ですね。
あとは分析結果をチェックしてみてはいかがでしょうか。

素敵な物語をありがとうございました。
分析結果を是非、小説執筆の参考にしてみてください。これからもツギクルをよろしくお願いします！

———————————————————————————
「構成要素分析と相性診断」や「文章の読みやすさ、文章の傾向、文章の構造」のグラフは、私のホームページにある通り。この「ファンタジー」にある「読みやすさ」「傾向」「構造」の分析結果は、文章を形態素解析して「標準的な小説」との分析結果を統計処理しているだけにみえる。だから、ここで比較対象する「標準的な小説」次第で、大きく分析結果が異なるとは思う。どんな小説を「良い」小説としたのか興味はあるので、公開してもらいたいものだ。
このサービスでの「キモ」は、円グラフの「構成要素分析」にあると思うのだが、「恋愛要素」「ホラー要素」「青春要素」「現代文学要素」「童話要素」「その他」の観点で分析されている。サンプルを見ると、これ以外に「SF要素」「ミステリー要素」「ファンタジー要素」などもあり、どうも作品登録時にどのカテゴリーで登録したかで決まるようだ。
私の作品は、小学生が主人公のホラーっぽいショートショートなのだが、なぜか「恋愛要素」が18%と最多要素になっている。作品は公開しているので読んでもらえれば分かるが、恋愛要素は皆無だ。どのように分析しているかは不明だが、おそらく形態素解析した後「特徴となる言葉」を抽出し、その言葉がどんな属性なのかで決めていると想像される。ま～自分で形態素解析して、特徴語を抽出してみれば判明するだろうが、おそらくチューニングしていけば次第に分析レベルは向上していくはず。
ソフトバンクグループが最初にこのようなサービスを始めたのは意外だった。しかしAIというか自然言語処理が着実に高度になってきたので、今後もこのようなサービスが確実に増えていくだろうな。

TickTack World

2017-01-09 15:26 nice!(0) コメント(0) トラックバック(0)
共通テーマ：パソコン・インターネット

AI「東ロボくん」は東大入試を諦めるのが早過ぎる　 [人口知能]

東京大学へ合格することを目指し、センター試験の模試を毎年受けてきた人工知能の「東ロボくん」が、東大合格を諦めたそうである。
毎年、着実に模試の成績を向上させ、今年は有名私立大学に合格したほどの成績だったのに残念なことだ。理由としては、問題文を読み解く「読解力」がなかなか向上せず、国語や英語などの科目で、現在の技術では今後の成績向上が望めないとのこと。

教科書に必ず解答がある歴史や、数式を知っていれば解ける数学などは、AIは得意とするところだ。しかし英語や国語だと、設問に対する直接的な回答が教科書にはないので、正解にたどり着くのは非常に難しいことは容易に想像がつく。しかし、そんなことは2011年に「東ロボくん」というプロジェクトを立ち上げた時点で、判っていたはずだ。

人工知能の分野で、昔から難問と言われている問題に「フレーム問題」と「シンボルグラウンディング問題」がある。「フレーム問題」とは、人間なら誰でも知っている「一般常識」を、どこまで人工知能に学習させなければならないか、という問題。例えば、水が満杯のコップを移動しようとする場合、人間なら水がこぼれないようにそっと持ち上げるだろう。しかしロボットにやらせる場合だと、空のコップと水の入っているコップ、内容物がアイスクリームなら多少傾けても大丈夫だの、ありとあらゆるケースを想定しないといけない。単純な動作でも、その背景に膨大な知識「常識」を用意しなければいけないことが「フレーム問題」である。
「シンボルグラウンディング問題」とは、言葉の持つ意味を理解できるか、という問題だ。つまり、「水」という単語には「液体」とか「透明」とかのような定義がされてはいるだろう。しかし「水」の概念を把握するためには、「飲める」とか「蒸発する」のような外界との相互作用まで把握していないと「理解」したとは言えない、という問題だ。体を持たない人工知能には「意味」を獲得できない、という身体性アプローチの考え方である。

　「東ロボくん」のスタート時点では、ディープラーニングはまだ登場していなかった。したがって、あくまで想像だが「東ロボくん」のアプローチは、従来からある自然言語処理と検索手法、コーパスなどを地道に改良していく手法と思われる。ディープラーニングの最大の成果は今のところ画像認識にあり、入試問題には直接利用できないし、LSTMを応用して作文ができるほど日本語レベルが高いとも思えない。
　とにかく、言葉の持つ意味を理解していない限り解けない「読解」の問題は、「シンボルグラウンディング問題」そのものだ。機械翻訳が構文から文章を作成する方式から、統計学を応用した方式に転換したように、「読解」には何らかのパラダイムシフトが必要なのは確かだ。意味を内包する「概念」にラベリングしたものが言葉なのだから、その概念を何らかの表現形式、コンピュータ内部にメモリ出来るフォーマットに落とし込めれば可能のはず。少なくとも人間の頭脳では実現できているので、ニューラルネットワークの延長線上で実現できそうな気もするのだが・・・。
ま～だから当然、この「東ロボくん」プロジェクトメンバーは、この大問題に真正面から取り組んでいるものだと思っていた。それがわずか5年程度で投げ出してしまったとは情けない。
DeepMind社は10月、ディープラーニングの大きな欠点「破滅的忘却」を、次世代ニューラルネットワーク（Differentiable Neural Computers：DNC）で解決できたのだ。やはり日本もここはあきらめずに、日本の英知を結集して、AIの進化に貢献してもらいたいものだ。

■TickTack World

タグ：人工知能 AI

2016-11-22 08:19 nice!(0) コメント(0) トラックバック(0)
共通テーマ：パソコン・インターネット

「よくわかるディープラーニングの仕組み」を出版　 [人口知能]

10月1日より、ディープラーニング（深層学習）の入門書「よくわかるディープラーニングの仕組み」をAmazonから出版しました。

本書は、従来の数式ばかりの専門家向けディープラーニング解説書とは異なり、カラフルで分かりやすいイラストを多用し、数式は必要最小限に留め、専門家以外の人でもディープラーニングが理解できるようにしています。学生や文系ビジネスマンから、人工知能のプログラミングを始めたい人まで、ディープラーニングとは何か、そして何ができるのか、今後はどのような分野で活用できるのかが理解できると思います。
ディープラーニングの原型であるニューラルネットワークの原理から説き起こし、画像認識のCNN、時系列データを扱うRNN、自然言語処理分野で活用が始まったLSTM、誤差逆伝播法など、最新技術までその仕組みをわかりやすく解説しています。本書を読むことで、ディープラーニングの原理から、その秘めた能力まで理解し、身に付くことができるはずです。

タグ：ディープラーニング人口知能

2016-10-03 16:23 nice!(0) コメント(0) トラックバック(0)
共通テーマ：パソコン・インターネット

なぜAIは恋愛相談ばかり答えるか　 [人口知能]

9月6日からNTTレゾナントの「教えて！goo」は、AIが恋愛のお悩みに回答するサービスを始めた。つい先日、「Yahoo!知恵袋」がIBM の「人工知能」Watsonを活用した、恋愛成就の可能性をすぐに答えてくれるサービス「脈ありチェッカーβ」を開始したばかりだ。なぜか最近、AIが回答する恋愛相談所が流行っているようだ。
この「教えて！goo」は、恋愛相談カテゴリーに投稿された質問に、人工知能（AI）の「オシエル」が、過去に投稿したQ&Aから最適な回答を探して回答するというサービス。わざわざ「恋愛系に特化」と明記されてあるのが興味深い。

NTTレゾナントのプレスリリースには、『世界初！AIによる長文回答生成技術』とあり、

=====================================

時系列ディープラーニングを質問と回答のマッチングに応用し、「AIによる長文回答生成」に世界で初めて取り組んでいます。
AIによる回答は、以下の手順で生成されます。
(1) 3,000万件以上のQ&Aデータから、使われている単語の意味やQ（質問）と A（回答）の対応関係、A内の文の組合せを、ディープラーニング（深層学習)を用いて学習し、モデル（型）を作る
(2)投稿されたQに対して、上記(1)で学習したモデルを用いて、質問にマッチする「共感」、「結論」、「理由」を含む文を回答集合より抽出、抽出した文を組み合わせて新たにAを生成する
この技術は、NTTレゾナントが独自に開発したものです。人生相談など答えが決まっていない質問に対し、ディープラーニングを用い、複数の文を組み合わせ、自然な回答を生成する技術としては、世界で初となります。今回、その技術を用いて、サービス化を実現しました。

=====================================

とある。ディープラーニングRNN（Recurrent neural network）の、Bi-LSTM（Bi-directional Long short-term memory）を使っているようだ。『恋愛相談に特化した単語ベクトルを生成し、単語の持つ意味を多次元で数量的に表現することで、表記のみでは捉えられない暗黙的な意味を表現する』とあるが、これが本当なら凄いこと。3000万件の日本語の文章を、LSTMのような計算量の多い処理をするだけでも、莫大な計算機リソースが必要なはず。しかも回答文は、『質問への共感となる文、結論となる文、例示となる文の3文の組合せを、現在の質問に沿って柔軟に組み替え、新たな回答文書を生成して回答』するのだそうだ。

Yahoo!の「脈ありチェッカーβ」の方は、一般的な自然言語処理で質問を感情分析しているだけで、回答も「脈あり」「脈なし」といたってシンプル。それに比べると、さすが日本語処理のトップNTTだけあって、似たようなサービスでもレベルが違う。それにしても、質問に対してAIが日本語で回答する初のサービスを、恋愛相談に特化させる理由はどこにあったのだろうか。

これは私の想像だが、「回答に正解がない。曖昧な回答でも許される。質問と回答の例が膨大にストック内にあり、前例のない質問がないはずなので、必ず回答例がストック内にある」からではないだろうか。もし正解が一つしかない質問だと、不正解ではAIの面目が丸つぶれになる。しかし恋愛相談なら、たとえテキトーに答えても「苦笑」で終われるので都合がよいのだろう。ま～それでも、まっとうな日本語で答えられるのだから、日本語処理の技術レベルは間違いなく日本のトップレベルだろう。
http://gagbot.net/

タグ：人口知能

2016-09-13 12:57 nice!(0) コメント(0) トラックバック(0)
共通テーマ：日記・雑感

AIが書いた本「賢人降臨」が与えるインパクト

クエリーアイ株式会社は、人工知能「零」が書いた書籍「賢人降臨」（けんじんこうりん）を、8月24日電子書籍で出版した。この「賢人降臨」は、クエリーアイがディープラーニングで福沢諭吉「学問のすゝめ」、新渡戸稲造「自警録」の二冊を学習させ、文章を創作させたものだ。

お題は以下の五つで、本書はこのお題の答えを零が著したもの。それぞれ第一から第五の章とした五章構成で、総計約六万文字、一般的な新書の約半分に相当する量だ。
「若者」、「学問を修め立身」、「世界を制する」、「成功とは」、「人とは何を示すもの」

ここから導きだされた、それぞれの最初の文は、以下になる。

「若者もあり、あるいは才智｜逞《たくま》しゅうして役人となり商人となりて天下を動かす者もあり・・・」
「学問を修め立身分を用うるの理あり。・・・」
「世界を制する者ははなはだ少ない。・・・」
「成功とはなんぞまらぬことである。・・・」
「人とは何を示すものでない。いつぞそういう者でもよい。・・・」

このクエリーアイ社は2010年創業で、名古屋大学と産学共同研究を行っているベンチャー企業。ディープラーニング特にRNN（Recurrent neural network）を得意としているようだ。この再帰型ニューラルネットワークは、画像処理で用いられるディープラーニングCNNと異なり、音声のような可変長データを扱うためのディープラーニング。文章も可変長データであり、対象となる単語の前後にある単語と関係が深いため、最近は自然言語処理にも、このRNNを用いた研究が進んでいる。

人工知能に小説を書かそうという試みは、「きまぐれ人工知能プロジェクト作家ですのよ」が「星新一賞」へ応募で一躍有名になった。しかし、現段階では人工知能が100%書いているわけではなく、かなり人出をかけているのが実態だ。しかし「賢人降臨」は、人が本文の校閲、校正を一切していないとのことだから、一気にレベルアップしている。

自然言語処理でディープラーニングを用いる場合、RNNでも最近はLSTM（Long Short-Term Memory）が流行り。これはシーケンシャルに入力されてくる「言葉」を、その前後関係も含めて「予測」する場合、長期間の前後関係まで考慮しようとすると、計算量が爆発してしまう。しかし、このLSTMは長期の依存関係を学習できる素晴らしいアルゴリズムなのだ。クエリーアイ社はLSTMを得意としており、IBMのSoftLayerにGPUを搭載した物理サーバを持っているようなので、この「賢人降臨」が出来たと思われる。

ただ小説と異なり、この「賢人降臨」には、ストーリーがあるわけではない。「学問のすゝめ」と「自警録」を学習させたRNNに、「お題」を与えて「予測」させたものだ。したがってRNNは与えられた「お題」、例えば「若者」という単語に続く「出現頻度の高い文章」を生成したものと解釈ができる。

それにしても、人がまともに読める文章が自動で生成できたのだから、素晴らしい成果と言えるだろう。単純に、LSTMに大量の文章を読み込ませただけでは、まともな文章は出力されないはず。何かノウハウがあるはずだが、まあ大学ではないので企業秘密だろうな。

タグ：人口知能

2016-08-27 16:23 nice!(0) コメント(0) トラックバック(0)