読了「人工知能は人間を超えるか/松尾豊」(その3)

人工知能は人間を超えるか/松尾豊

人工知能の入門書とも言われている本書。感想まとめ第3弾です。

第1弾はコチラ
https://r2d.info/2017/10/30/matsuo1/

第2弾はコチラ

読了「人工知能は人間を超えるか/松尾豊」(その2)





第6章:人工知能は人間を超えるか

6章には今後の人工知能の展望を予言して、最終的に「人工知能が人間を支配するような未来はこない」と締めくくっています。今後の人工知能ロードマップは各地で謳われているものでして、把握しておいた方が良いでしょう。

抽象化:
物事の類似・対比・因果といった「隠れた仕組み」を見つけ出すこと。

①画像特徴の抽象化:
既にディープラーニングの登場で実現されつつあるレベル。画像から「ヒト」や「ネコ」の概念を抽出する。

②マルチモーダルな抽象化:
画像だけでなく音やセンサ値も合わせて認識をする。

③行動と結果の抽象化:
コンピュータ自らの行動と、結果として得られる外部情報の因果関係を抽象化して理解する。このあたりから身体性が強くなっている気がする。ブロックを押せば動くといったことを理解する。この段階までくると、何の行動が何に影響するのか因果関係を理解し始めるのでフレーム問題を解決しうる。

④行動を通じた特徴量の獲得:
ややわかりにくいが「一連の行動の結果として世界から引き出せる特徴量」を得ることができる段階。例えば、ゲームをプレイしてみて難しかった・簡単だったということを認識するといった具合だ。コップを強く握ったら割れたということを学習しだすと知能の環境適応がすすむ

⑤言語理解:
概念と記号を結び付けて、シンボルグラウンディング問題を克服する。

⑥知識獲得:
文章等から知識を獲得・創出する。

所感としては、身体性の獲得によってフレーム問題の解決、言語理解によってシンボルグラウンディング問題を解決というのがポイントであろう。


終章:変わりゆく世界

終章では今後の人工知能による事業展開、日本業の課題などが記されている。

この図を見れば早いので引用しておく

出典源:http://www.soumu.go.jp/main_content/000400435.pdf

 

以上、最後は駆け足でしたが、まとめでした

読了「人工知能は人間を超えるか/松尾豊」(その2)

人工知能は人間を超えるか/松尾豊

人工知能の入門書とも言われている本書。感想まとめ第2弾です。

第1弾はコチラ
https://r2d.info/2017/10/30/matsuo1/

第3弾はコチラ
https://r2d.info/2017/10/31/matsuo3/


第3章: 第2次 AIブーム(1980~1995)

エキスパートシステム:
専門分野の知識を大量に取り込み、推論を行う。

MYCIN(マイシン):
1970年代にスタンフォード大学が開発した人工知能。伝染病の血液疾患の患者を診断して抗生物質を処方する。膨大に蓄積された知識を基に、患者の症状に対してIF文を繰り返すことで症状を判定する。

エキスパートシステムの課題:
・専門家の知識ヒアリングに膨大な労力がかかる。
・ルールに一貫性が保たれない。
・曖昧な状態を表現でき無し。
・人間にとって常識的な知識を導入しにくい。

オントロジー研究:
「概念化の明示的な仕様」と定義され、知識を記述するときの仕様を定義しようとする研究。このように、エキスパートシステムの課題を受けて知識をどう定義するかの研究が盛んになった。

ヘビーウェイト・オントロジー:
人間によって概念間の関係を正確に定義して、知識を記述する。

ライトウェイト・オントロジー :
効率性を重視して、正確性に少々かけても大量のデータを読み込ませて自動で概念間の関係性を見つける。Webマイニングなどと相性が良い。

Watson:
IBMが開発した人工知能。ライトウェイトオントロジーの究極系とも称され、2011年にクイズ選手権で優勝。

フレーム問題:
あるタスクを実行するうえで関係ある知識だけを取り出して使うという作業が、ロボットや人工知能にとっては難しいという問題。バッテリーをとってくることを指示されたロボットが、バッテリーに付与された時限爆弾をどう処理するか、というダニエル・デネット氏の話が有名。

シンボルグラウンディング問題:
記号(文字列・言葉)と、それが意味するものとを結び付けられていないという問題。フレーム問題と並んで人工知能の難題とされる。

 





第4章: 第3次 AIブーム①(2010~2015)機械学習

機械学習:
「学習することとは分けること」と本書には記載されている。蓄積されたデータについて、それらのデータをどうすれば目的に沿って分類できるのかというイエス・ノー問題の解き方を人工知能が自ら学習する。

代表的な分類手法①:最近傍法
1番近いデータと同じカテゴリーだと認識する。

代表的な分類手法②:ナイーブベイズ法
データの特徴ごとに、どのカテゴリに当てはまるのかを算出して加算していく。

代表的な分類手法③:決定木
ある属性の値で線引きをして、その二分割を繰り返す。空間を斜めに切ることができない点が弱点。

代表的な分類手法④:サポートベクターマシン
マージンを最大にするようにいい感じに境界線を引く。

代表的な分類手法⑤:ニューラルネットワーク
人間の脳構造をヒントに開発された技術。後にディープラーニングへとつながる。

機械学習における難題:
フィーチャーエンジニアリング(識別のための特徴量設計)を人手でしなくてはならない。深層学習の搭乗前は、いい特徴量を作るのが一番大変で、人間がやるしかないとされてた。

なぜ今まで人工知能が実現しなかったのか:
知識の記述が出来ない。フレーム問題。シンボルグラウンディング問題。特徴量設計が難しい。総じて「世界からどの特徴に注目して情報を取り出すべきか」について人の手を借りざる得なかった。(これの解決の兆しを後に深層学習がみせるわけである。)

 


第5章: 第3次 AIブーム②(2010~2015)ディープラーニング

2012年のILSVRCでトロント大学がディープラーニングにより圧倒的な勝利を収めて世界に衝撃をもたらしたこと。そこから、ディープラーニング技術の詳細が記載されている。技術的なことについてはここでは省略します。(ググればSlideShareなど山ほど資料があるので)

ディープラーニングは今まで人工知能が実現できなかった概念を自ら作り出すということを可能にしうる。最難題である「世界からどの特徴に注目して情報を取り出すべきか」を学習により解決できる可能性を秘めている。と語られている。

 

つづく、(かも

読了「人工知能は人間を超えるか/松尾豊」(その1)

人工知能は人間を超えるか/松尾豊

人工知能の入門書とも言われている本書。「人工知能とは何なのかを正しく理解しよう」というコンセプトで執筆されています。私は人工知能の開発に従事する技術者ですが、それでも「正しく理解」というフレーズを前にすると「念のため読んでおこう」という気持ちにさせられした。勘違いや思い込みとは最も恐ろしいものですからね。吉良吉影もそういってます





第1章:人工知能とは何か

人工知能の定義について、著名教授の見解紹介や、様々な角度からの定義を試みている。

人工知能研究者の目的:
人工知能研究者は構造論的に知能を解明しようとしている。対照的に、脳科学者は分析的に知能を解明。

チューリングテスト:
コンピュータと別の部屋にいる人間が画面とキーボードを通じて会話する。相手がコンピュータだと見抜けなければ合格。

AI効果:
原理がわかってしまうと「これはAIではない!」と思ってしまうこと。

AIの4段階:
レベル1 :   制御工学による制御をマーケティング的に人工知能と称している。
レベル2 :  推論探索や知識ベースにより振る舞いが多彩なもの。
レベル3 :    機械学習によりルールを自ら学習する。
レベル4 :   深層学習によって特徴量を自ら抽出する。

※一見、レベル3とレベル4が似ているように感じるかもしれません。が、これらは全然同じではありません。

「強いAI」と「弱いAI」:
強いAI:   人間の知能を工学的に実現。
弱いAI :  限定された機能によって、知的な問題解決が一見できているかのようにふるまう。

中国語の部屋:
中国語がわからないオペレーターが、中国語で問い合わせされたとい、入力された文字を膨大なマニュアルに照らし合わせながら確認し、決められた返答をしても、会話が成立したように見えるがその人は中国語を理解してはいない。


第2章: 第1次 AIブーム(1956~1970)

探索:
深さ優先探索や幅優先探索といった、場合分けによって答えを見つけ出す。

ハノイの塔:
第1次AIブームでは、単純な問題をAIで解くことができた。その例としてよく挙げられるゲーム。

ディープブルー:
1997年にチェス世界チャンピオンを下したIBMの人工知能。

モンテカルロ法の導入:
チェスや将棋における人工知能の性能を飛躍的に向上させた手法。ランダムに手を指し続けて終局させるという行為を何度も繰り返し、望ましい結果が得られた回数から、次の一手を評価する。

トイプロブレム:
ビジネスや医療など現実世界はいっそう複雑であり、AIには限定的なルールの定められた問題(トイプロブレム)しか解けないとされた。

 

つづく https://r2d.info/2017/10/30/matsuo2/

第3弾はコチラ
https://r2d.info/2017/10/31/matsuo3/

ニコラ・リバレさんの講演会(スキヤキ・ミーツ・ザ・ワールド プロデューサー)


『スキヤキ・ミーツ・ザ・ワールド』

先日、岡崎ワールドミュージックフェスタで同時開催されたニコラさんの講演会に参加しました。

ニコラ・リバレさんは富山県南砺市で毎年開催される日本最大のワールドミュージック祭典『スキヤキ・ミーツ・ザ・ワールド』のプロデューサーです。

私自身、スキヤキ・ミーツ・ザ・ワールドは未参加ですが(来年こそは必ず・・・!!)、参加している多くの友人から話は伺っていました。

集客に便利な東京や大阪ではなく富山県という開催地選択、若者に人気なJ-POPではなく世界中のアーティストを招待してワールドミュージックをするというコンセプト、地域や音楽的なカルチャーを強く感じずにはいられません。




講演内容メモ(※忘れた部分はwikiから補完)

・『スキヤキ・ミーツ・ザ・ワールド』は異文化交流を目的に開催。

・老若男女が楽しめるという目的からワールドミュージックを選んだ。

・開催中は世界各国から招いたプロミュージシャンのライブステージが行なわれる。

・プロミュージシャンが市内滞在中に、楽器演奏指導や楽器製作等のワークショップを開催して地域の方々と交流を図る。

・指導を受けた子供たちがそのまま出演してパレード演奏したりもする。

・地元住民との交流だけではなく、世界各国から集まったミュージシャン同士も滞在中に交流する。フェスティバルを通じてバンドが誕生することもあった。

・こうして、世界各国のミュージシャンと異国文化交流をはかる市民参加型フェスティバルとして続いている。


集客無くしてイベントは成り立ちませんが、異文化交流というコンセプトがぶれることなく、ここまで人気のイベントになったというのはスゴイの一言に尽きます。

集客目的の工夫をしてしまったばかりに初期コンセプトからズレてくるというのはよく聞く話ですが、スキヤキは最初から最後までワールドミュージックの祭典として、目的であった異文化交流を見事に果たしています。

特に、市内に滞在中のミュージシャンが地域住民とワークショップで交流というのは、国籍や文化が異なる人同士が音楽を通じて繋がるということを体現するかのような取り組みです。

さらに、開催中は地元飲食店によるフードブースもあり、これもまた食文化の交流ですね。

ここでは、全てのきっかけが音楽で、人がどんどん繋がっているようです。


おまけ雑談1

スキヤキの会場であるヘリオスには、音楽の都・ウィーンの音色の代名詞といわれ、世界三大ピアノのひとつとしても有名な「ベーゼンドルファー」があります。行けば普通に素人でも演奏させてくれるようです。

スキヤキで演奏したプロミュージシャンからは『今まで演奏してきたピアノの中でも1番いい!』との声が上がってるとか。


おまけ雑談2

今年のスキヤキで注目だったアーティスト。後輩に薦められてCD即買いしました。アルゼンチンの音楽って最近ちょいちょい話題になっているイメージでしたが、ひょっとしたら彼らが噂の中心?

 


おまけ雑談3

岡崎ワールドミュージックフェスタも食文化・地域・音楽といったカルチャー溢れるイベントですので是非参加してみてください。


お寺をステージにライブします


東大路丸太町にある膳洛さんのフード。こちらのお店はファンが多く、間違いなくうまいので是非一度足を運んでみてください。

 

経費、資産、償却、税、について

会社で研究開発していて、部材やパソコンを買うときによく直面するこの問題。

「消耗品費?資産?20万未満?え~っと・・・(”^ω^)」



 

というわけで簡単にまとめました。(※少額減価償却資産の特例については省略しています)

シンプルにまとめると

①1年未満しか使わないなら消耗品費として経費で支出

②1年以上使うとしても10万円以下なら消耗品費として経費で支出

③1年以上使うけど20万以内なら一括償却資産(固定資産税がかからない)

④1年以上使うし20万を越えたら堪忍して資産計上して償却する(固定資産税がかかる)

How to modify a .prototxt on Python? (Caffe)  ~.prototxtをPythonで編集する~

Caffeでディープラーニング研究開発をするにあたり、FeatureMapsの数だったりを増やしたり減らしたりしながら試行錯誤することはよくあります。

そんなとき、ネットワーク構造をPythonから自動的に変更させたくなりますよね?(あれ?なりませんか?)

とういわけでPythonからネットワーク構造定義ファイル.prototxtを編集する方法を調べました。こちらの投稿が参考になりました。




結論
・caffe_pb2 と google.protobuf.text_format を利用
・caffe.netから変更と保存できればと思ったけど無理そう

例えばprint(conv)とすると下記のように構造をとれていることがわかります。

 

なお、.caffemodelは

とった具合に編集していってください。

Watson Tone Analyzer で日本語の文章から感情推定

はじめに


いきなり釣りのようで恐縮ですが、文章から感情を推定するIBM提供サービス“Watson Tone Analyzer”は日本語対応していません

文章の多言語翻訳だったり解析系はまだまだ日本語対応していない点が我々から見たIBM社の短所です。ただでさえ AWS・GCP・Azure がクラウドビッグスリーと呼ばれて、IBM社のクラウドは後塵を拝しているので頑張ってほしいものです。

 

翻訳APIでフォロー


そんな文句はさておき、せっかくの Watson API なのでなんとか活用してみようとするのが今回の話です。結論から申し上げますと“Watson Tone Analyzer”が日本語対応していないので、文章入力前に日本語を英語に翻訳するAPIをかませるという雑アプリを設計しました。

日本語でメッセージ入力⇒日本語から英語に翻訳⇒英語化した文章から感情推定⇒グラフで結果出力

翻訳くらいはWatsonを使えばと思いましたが、翻訳APIも日本語対応完了していないため今回は下記APIを利用。(無料。ただし要登録。)

Yandex.Passport https://passport.yandex.com/

“Tone Analyzer”は設定が色々あるのですが、今回は5つのパラメータ『Anger、Disgust、Fear、Joy、Sadness』を出力する設定にしました。

 

 

しかし、なんというか、出力パラメータ5つのうち4つが負の感情ってどういうことだ・・・?

 

設計メモ


テキスト入力の受け付けはFormで適当に定義

翻訳APIは下記のようにしてhttps://translate.yandex.net/api/v1.5/tr.json/translateに投げます

データ工学の歴史と今後

巷ではビッグデータが何年も注目を浴びています。ある大学の先生は2013年時点で「もうビッグデータは古い。」と言っていましたが、2017年になっても熱は冷めません、むしろ加速しています

ただ、ブームに飛びつくのはいいですが、『データを集めて分析して、で、それからどうするの?』という声もよく耳にします。

ちょうどいい機会だと思って、ビッグデータに至るまでのデータ工学の歴史を調査してみました。それが下の図です。


もともとマイニングとは『採掘』という意味の言葉で、データマイニングやテキストマイニングは『知識を取り出す』試みです。

2010年以降はデータマイニングを試みるものの、公知である当たり前の知識抽出しかできず、学会には『研究の結果、ラーメンの伸び具合と、麺のゆで時間には強い相関があるとわかった。』みたいな発表が散見される時期もありました。

ただ、IoT等の技術発展によりデータ量が爆発的に増加している近年では、データマイニングによって今までなかったような知識発掘への期待が高まっています。製造業や物流業界ではデータマイニングによって、気づかなかった無駄を発見&削減によって効率化を図ったりと、実績が出ています。

このような最適化が現在のデータマイニングの目指すところですね。




では、今後のデータ工学はどのような方向に進むのか?

有識者の方々からは自律社会、パブリックデータ(オープンデータ)などがキーワードとして挙げられています。が、私個人としてはデータの質を重視する流れが高まり、質の高いデータを収集する仕組み作りとデータクレンジング技術に注力するのではないかと思っています。

データの質と量についての議論はよくされていますが、結局両方必要です。ずいぶんデータ量が確保できるようになってきたので、そろそろ質も伴わねばならないフェーズに移行して来ていると私は考えています。

CEATEC 2017:衛星みちびきによるcm単位の自車位置測位(三菱電機)

CEATEC2017より注目技術を紹介。

それが下記リンク記事にある高精度測位サービス『CLAS(シーラス)』。

https://response.jp/article/2017/10/04/300657.html

簡単に言うとGPS測位がセンチメートル単位の誤差範囲に高精度化されたサービスといったところ。

自動運転といった小さな誤差も許されないような領域での活用を狙っている様子。一方でGoogleMapみたいな応用領域では誤差が数メートルあっても困らないので出番はなさそうですね。

測位精度が高いのは素晴らしいですが、一方で即時性が気になります。通信がボトルネックになって即時性が失われるようなシステムならば命を預けられないので。

また、「例えば雪が積もって道路が判別しにくい厳しい状況でも、高精度な自律走行が可能になります」と述べられてます。が、これについては衛星による走行制御が先か、コンピュータビジョンのロバスト性確保が先か、、、(や、両方進めればいいんですけどね)

 

 

1人でもアンチがいたら周囲からの評価が下がる?

たまには専門外の論文を読んでみるのもいいなと思い、今回は『心理学研究』の論文を漁ってみました。

今思えば大学時代は一般教養科目で妙に人気だった心理学、いったいどんな論文が投稿されているのでしょうか・・・

今回は優秀論文賞を受賞したものから「表情の快・不快情報が選好判断に及ぼす影響」という論文を読みました。

https://www.jstage.jst.go.jp/article/jjpsy/advpub/0/advpub_87.15043/_article/-char/ja/


要約

内容①:対象物Xへの選好判断は、周囲の人物から対象物Xへのシグナルにより影響を受ける。

そりゃそうだって感じですね。みんなが好きなものは好きになってしまうのが日本人。行列があれば並びたくなるのが日本人ですからね。

内容②:他者が示すシグナルによる選好判断への影響を調査する。
内容③:無意味図形を好感度評価の対象として実験を行う。

無意味図形を使うというのは面白いですね。理由は好きや嫌いの事前情報が存在しにくいため。食べ物や芸能人だったら他人が示すシグナルに影響を受けようが「好きなものは好き!」となってしまいますから。

内容④:無意味図形を表示後に他者の表情を変化させて実験する。

むむむ、このあたりから怪しくなってきた・・・。つまり無意味図形の周辺に何人かの顔画像(無表情)が表示されて、図形表示後に喜んだり嫌悪感を示したりするということ。これで問題設定がきちんとモデル化できてるのか少々疑問です。

内容⑤:周囲が喜びを示すと、対象物に好感を抱く場合が多い。

なるほど、ここまでは直感と一致した結果ですね。

内容⑥:参加者のうち喜びを示す割合が多いほど好感を抱きやすい。
内容⑦:好感度の上がり具合には、喜びを示す絶対数ではなく割合が重要。

これは予想外。つまり50/100よりも6/10のほうが好感度の上がり具合が大きいということ。まぁたしかにファンが何人いるかということよりも、誰もが好きって方が説得力を感じなくもないですね。

内容⑧:嫌悪を示す人がいると好感度は下がる。
内容⑨:割合に関係なく1人でも嫌悪を示す人がいると好感度は下がる。
内容⑩:好感度の下がり具合は人数と関係なく、1人でも10人でも同程度下がる。

これですよこれ。つまり1人でもアンチがいればそれだけで好感度を下げうるということ。好感度を上げるのはあんなに大変だったのに。

これも直感通りと言えば直感通りかもしれません。火の無いところに煙は立たないというように、1人でもアンチがいれば「ひょっとして…」と思うのが人間の心理なのでしょう。Amazonレビューでもそうな気がします。


まとめ

おおむね直感通りでしたが、無意味図形を用いるなど実験環境の問題設定だったり、他要因の排除だったりに工夫を感じる研究でした。