体内Suicaをスウェーデン鉄道会社が導入

Futuristic hand implant microchip as train tickets


Image: SJ Railway

http://www.independent.co.uk/travel/news-and-advice/sj-rail-train-tickets-hand-implant-microchip-biometric-sweden-a7793641.html


スウェーデン鉄道会社が社内検札にマイクロチップを用いた乗車システムを導入。ポイントは「マイクロチップが旅客の手に埋め込まれている」こと。(biometric chip implanted into their hand と引用元に記載されている)

技術としてはお財布ケータイやモバイルSuicaでお馴染みのNFCが使われている。

「ついにマイクロデバイスの体内埋め込みが本格化してきたか!!」と驚いたのですが、既にスウェーデンでは2000人程度がインプラントしているという話の方が驚きました。(Around 2,000 Swedes have had the surgical implant to date, most of them employed in the tech industry. と引用元に記載されている)

家や車の鍵の代替としてマイクロチップを体内に、、、みたいな話も以前からよく聞きますが、個人的には今回の話も含めて「スマホでよくない??」と思ってしまいます(もしくはスマートウォッチ)。機種変更しても情報損失するようなことも減ってきてますし、破棄や売却したスマホから情報漏えいするリスクも対策が練られていますし。

ポケットやカバンにカード(または専用機器)を入れておけば、手や足裏で通信できる人体通信技術も伸びてきてますし、そっちの方が日本では普及しそうと私は考えます。というのも人体へチップ埋め込むことへの抵抗が強そうなので。

国内市場が小さく外需思考なので研究開発に力を入れ、さらに低い人口密度故に通人技術が発達した国、そんなスウェーデンからこういった技術が出てくるのは自然な流れだとは思いますが、、、、今後の行く末に注目ですね。

学習用画像を水増しする(データオーギュメンテーション)

深層学習では学習データの確保がポイントとなります。

画像認識でいうと、1枚の画像でもコントラストを変えたり、伸縮したり、拡大縮小したり、ノイズ付加したりすることで、学習データの水増しが可能です。

試しに実行してみたので、環境構築から手順をまとめてみました。


環境:Windows7、64bit

・Anaconda4.4.0 For Windows(Python3.6 ver)をコチラからダウンロード

 

・ダウンロードした”Anaconda3-4.4.0-Windows-x86_64.exe”を右クリックで管理者として実行

 

・”Add Anaconda to my PATH environment variable”にチェックを入れるのを忘れずに

 

・”pip install opencv-python”によってopencvをダウンロード(これがないとimport cv2が動きません)

 

・今回はbohemian916さんのコチラのプログラムを拝借しました

・引数に水増ししたいベースとなる画像を指定して実行

 

今日はここまで

「指示待ち」はホントに本人が悪いのか?

こんにちは、ロードローラーです。最近は職場で後輩がいっぱい増えたということもあり、指導について考えることが多くなりました。

ポイントは「自発的な行動を促す」こと
気をつけたいのは以下の点
・自発的に動くことは難しい
・出来るようになるまで時間がかかる
・自発的に動く機会はいともたやすく奪われる
 
これは『指示待ちになっているのではなく、自分が知らず知らずのうちに彼ら彼女らの行動や思考の機会と自由を奪っている可能性がある。』ということです。

<悪い例>

<良い例>

 
 
「自発的に動かないから強制的に動かす」というのは目標達成できる可能性が高いですが、「今はまだ自発的に動けないなら、自分から行動したくなるような環境を作る」ことに力を入れる方が建設的です。
 
以前に紹介したエディージョーンズ氏の本で「コーチングはアートである」と記されていました。そこでは1人1人にあった方法を見極めるのが最も難しく、最も重要な任務と表現されていました。
自発的な行動は誰にでもとれるものではなく、1人1人にあった方法を見極めるてそれを促すことも同じく一筋縄ではいかないのでしょうね。そこに努力できるかどうかが、指導者としての腕の見せ所です。
 

データマイニングにおけるAnomalyDetection(異常検知)は何故難しいのか?

おはようございます、ロードローラーです。本日はAnomalyDetectionについて整理します。


AnomalyDetectionとは?

異常検知、または、外れ値検知とも表現されます。データをじ~っと眺めていて「いつもと違う、おかしい!」という事象を検出することです。


AnomalyDetectionの難しさ

これはシンプルに下記2点に付きます

① 「What is 異常?」 の定義
② 「What is 正常?」 の定義

簡単に言えば「何を正常として、何を異常とするか」という定義が一番難しいんですね。

その原因の1つ目はデータ収集の困難さ。例えば製造現場で異常検知したいといった場合に、異常の発生率が製品10万個に1つだったとすると、正条例のデータは溢れるほど手に入りますが、異常例のデータがなかなか手に入らず、定義および学習が困難です。(※特に流行りの深層学習を用いた認識器では学習データが大量に必要です。)

対策として、正条例を熟知した教師無しの認識器を用いるのがポピュラーです。ここでは異常検知と言っても「何かおかしい!」というレベルの検出で、具体的に「XXが原因で、YYという異常が発生しています。」というレベルの検出ではありません。

「いつもと違う」ことの検出には「いつも」さへ知ってればいいというわけですね。しかし、まだまだ精度が十分に出ていないとの報告があります。

原因の2つ目は統制環境か非統制環境かという点。工場のように「いつも同じことをしようとしている」統制された環境ならば正常の定義は簡単です。

一方で、生活空間における事故を検出しようとした場合、そもそもの行動がバラエティに富んだ非統制環境なので正常の定義が困難です。「夜は寝て、朝に起きて、日中はテレビを見て過ごす」といった正常の定義だと、来客があった瞬間に「なんだこのパターンは!?異常だ!!」となるわけですね。

 

今日はここまで

 

深層学習はデータさえ集まれば何でもできるのか!?

結論:そんなわけない

こんばんは、ロードローラーです。出落ちみたいになりましたが今回はそういうお話。

データを入力すれば認識に必要な特徴量を自動抽出してくれることで有名な深層学習ですが、「データさえ集まれば何でもできるんでしょ?」というわけではありません。

深層学習にはネットワーク設計、入力値の見極め、ハイパーパラメータ設定など、職人技が求められる要素がてんこ盛りです。こういった難しさを乗り越えて、使いこなして、やっと初めて「データあれば認識器を構築できる。」という境地に辿り着きます。

なんだかこういった理解・知識がある人とない人が混在していて、すごく日本語に不自由している感があったので、いまさらながら記事を書かせていただきました。

こういうすれ違いでストレス抱えている人、実は多いのではなかろうか、と思ったり思わなかったり・・・

 

 

エレクトロ・ミュージックの本場ベルリンで出会った素敵音楽

こんばんは、ロードローラーです。ドイツで出会った素敵音楽を今日は紹介します。

海外出張でベルリンに行ったとき、中古レコードショップに行って大量のジャケ買いをしました。そのときに出会った1枚がコチラ。

Schillerによる『Weltreise』というアルバムです。

強烈に惹かれてしまいました、はい。是非おすすめしたい1枚ですね。

軽快なギター、透き通るような音、キャッチーな歌手、、、クラブが盛んなベルリンなのでもっと重い音のイメージがあったのですが(偏見)、寝る前に洒落乙にキメたいナンバーですね、これ。

Wikipedia先生によるとアルバムリリースは2001年7月30日。4週連続してドイツのロングプレーチャートのトップになる。2016年に20万枚売り上げてPlatinum達成(なんだその時差は??)、国際的にも販売されていたようなので、私が知らなかっただけでそこそこ有名な1枚だったようです。

自由主義か、保護主義か? ~オープンイノベーションと自前主義~

こんばんは、ロードローラーです。
最近は「経済は世界史から学べ!(ダイヤモンド社)」を夢中で読んでいます。

私は子供の頃から経済に全く興味がなく、社会の授業も無関心で、近年の経済の流れにとても疎い状態です。本書は「経済のことをよく知らないまま大人になってしまた方」をターゲットとしていて、ちょっぴり悔しいですが、たしかに読んでて新鮮だし楽しい内容となっています。

で、今回取り上げるのは本書で登場する次の節。


発展途上国は保護主義をとるべき
(アメリカ・ドイツ・日本の)例を見れば、発展途上国が先進工業国に転換する過程において、保護主義の採用が効果的であることが歴史的に証明できます。「自由主義か、保護主義か」という論議は、その国の経済的な発展段階によって結論が違ってくるといえるでしょう。(※抜粋)


書いてることは概ねagreeです。歴史的にもそうなってますし。

私が気になったのは、技術屋さんがオープンイノベーションまたは自前主義を使い分ける際にも似たようなことがいるのか?という点です。

手元にある既存市場に対して、自社技術による参入障壁が築けていない状態で優れた他社技術を導入してしまうと、顧客を奪われる。(発展途上国が自由主義で失敗するパターン)

優れた自社技術により、既存顧客に対して「我々にしか提供できない価値」を用意したうえで、優れた他社技術を取り入れ、さらなる付加価値向上に努めるとうまくいく。(経済競争力を身に着けたうえでの自由主義)

 

その他にも、技術屋さんにとって当てはまりそうな事例がちらほらありました

「日本とメキシコは競合分野がほとんどないから自由貿易協定がうまくいった。」⇒ オープンイノベーションも、互いの強みを生かし、弱点を補強しあう関係だと上手くいく。

「保護主義から独占市場である植民地の奪い合いに至り、最後は戦争が起きた。」⇒ 限りある市場を奪い合いコストダウンの渦に巻き込まれ疲弊する。

 

貿易も技術も、同じくビジネスという枠組みに収まっているのであれば、歴史から学ぶところは大きいですね。

協調フィルタリング② ~Amazonは協調フィルタリングを本当に使っているのか検証する~

おはようございます、ロードローラーです。以前に協調フィルタリングについて記事「協調フィルタリングが面白い!」を書きました。今回はその続編です。




Amazonで『この商品を買った人は、こんな商品もチェックしてます』と表示されるのが協調フィルタリングの有名例とされています。

先日、この話を友人としていました。そのときに「未だにマンガの最新刊を買ったときに1巻をレコメンドしてくる」という話で盛り上がっていました。

協調フィルタリングはドメイン知識が不要でレコメンドが可能というメリットがある反面、「最新刊を買う人は既に全巻そろえてる人、または、全巻大人買いの最中の可能性が高い」といった知識を反映できないんですね。

しかし、本当にそんな化石みたいなレコメンドをするのか、半信半疑だったので検証しました。


ジョジョリオン最新刊で検証

現在発売中のものでは14巻が最新だったのでカートに入れる。

その結果……

でたよ、ほんとにでたよ、1巻をレコメンドしてきましたよAmazonさん。。。(※右端がジョジョリオン1巻)

 


プラチナエンド最新刊で検証

今度はプラチナエンドで試してみました。

プラチナエンドの最新刊をカートに入れる。。。

そして結果は……

 

あれ、、、??

今回はいい感じのレコメンドになっています。プラチナエンドの1巻が見当たりません。

ジョジョリオンに続いてプラチナエンドをカートに入れたから、私が「多種類のマンガを買う人」として認識されて、レコメンド方針が変わったのかな?


まとめ

思ったよりちゃんとしてたようです。(メデタシメデタシ

ラグビー日本代表ヘッドコーチ エディー・ジョーンズとの対話

こんばんはロードローラーです。今回は“ラグビー日本代表ヘッドコーチ エディー・ジョーンズとの対話 コーチングとは「信じること」”という本を紹介します。


コーチングとは

2015年ラグビーワールドカップで南アフリカに勝利して「史上最大のアップセット」を称されたラグビー日本代表。本書はそのヘッドコーチであるエディージョーンズ氏との対談を1冊にまとめたものです。

タイトルには「コーチングとは信じること」とありますが、書内ではむしろ「コーチングとはアートである」という表現が一貫して使われており、コーチの役割について語られています。

この本の良いところは、対談の書き起こし形式が中心なので変にフィルターのかかっていないエディー氏のストレートな言葉に触れられる点です。(といっても日本語訳されている時点でフィルターはかかっていますが)。エディー氏は有名なほどの辛口でして、その言葉はかなりグサッときます。


話が長い人は要注意

私のお気に入りは下記発言

能力のないコーチはオプションを提示しすぎるんです。選手に決断を促すのではなく迷わせてしまう。混乱している選手は傍からは懸命にプレーしていないように見えてしまうものです。それでまたコーチに怒られる。

でも、アスリートはプレーするにあたって100%全力を尽くすものです。それが100%に見えないときはふたつの理由しかありません。フィジカル面で疲労が起きているか、メンタル面で混乱しているかのどちらかです。

スポーツでも仕事でも、集団で何かをするときに私は必ずこのシーンに遭遇します。

思いつくまま話をだらだら続ける人、指摘を延々と続ける人、選択肢を提示するだけで満足感に浸る人、無責任に「せっかく道筋を示してやったのに」と後から嘆く人、要点を絞らず全部しゃべって「だから言ったのに…」と自分に保険を掛ける人。

相手を迷わせた挙句、そんな自分の失敗を相手のせいにすると、指導者としては二流ですね。

ちょっと油断すると自分がそうなってしまいかねない、という自戒を込めて、この文章を取り上げさせていただきました。

今日はここまで

 

協調フィルタリングが面白い!

Webマイニング分野でポピュラーな「情報推薦」、そこで頻繁に使われるのが協調フィルタリングですね。私も興味を持ったので調べました。

1番最初に詰まったのが「推薦方法には(1)コンテンツベース手法と(2)協調フィルタリング手法があり、協調フィルタリングには(2-1)アイテムベース手法と(2-2)ユーザベース手法がある。」という説明。コンテンツベースとアイテムベースって同じようなものに聴こえたんですけど・・ん?(混乱)

というわけで、このあたりの違いに着目しながらまとめます。ポイントはコンテンツ特徴に着目するのか、購買履歴に着目するのかです。

コンテンツベースフィルタリング(content-based filtering)

コンテンツ特徴に着目して情報推薦する手法。推薦は応用範囲が広く、店頭に並ぶ製品に加えて観光地・音楽・映画などが挙げれます。これらをまとめてコンテンツと呼びます。

コンテンツベースフィルタリングでは各コンテンツに手動で特徴設定が必要です。これにはセンスが問われます。例えば、「君の名は。」の特徴には「アニメーション」「新海誠」「恋愛」などが考えられます。

これらを特徴ベクトルで表現して、距離定義に基づいて算出した類似度でソートすることで、検索キーワード(例『映画、新海誠』)に対して「君の名は。」を推薦できます。

ここで「ん?」と思った方がいるかもしれません。「君の名は。ってジャンル『恋愛』なの?」「もっと色々な特徴あるんじゃないの?」と。

実はコンテンツベース手法には次の弱点があります。
①特徴設定に専門性(ドメイン知識)が求められる
②特徴の多様性に欠ける

そこで協調フィルタリングの出番です。

協調フィルタリング(collaborative filtering)※アイテムベース

協調フィルタリングにはアイテムベースとユーザベースとありますが、ここではアイテムベースの説明をします。

協調フィルタリングではコンテンツの特徴ではなく購買履歴に着目します。各コンテンツがどんなものなのかという特徴を職人が知恵を凝らして設定するのではなく、「ユーザからの評価は?」「どんなコンテンツと一緒に購入された?」といった購買履歴を分析して特徴抽出します。

コンテンツベース手法には①専門性が求められる、②多様性に欠けるという弱点がありましたが、購買履歴を分析するので手動の特徴設定が不要()、購買行動はコンテンツの特徴に基づいて発生する()ことから弱点を解決しています。

ここでいう特徴とはジャンルや作家といった明確なものではなく、「こんな人たちに売れてる」という程度の曖昧な数値です。推薦とは「コレが好きな人はコッチも好きだろうな」というコンテンツ同士の類似度が必要で、コンテンツがどんな特徴を持っているか曖昧でも成り立つのです。

協調フィルタリング(collaborative filtering)※ユーザベース

同じく購買履歴に着目します。先ほどはコンテンツを分類しましたが今回はユーザを分類します。この背景には「ユーザの購買行動には傾向と特徴があり、分類可能である。」という仮定があります。そこでユーザ類似性を算出して「似たユーザには同じものを推薦すればいい。」という考えから、何を推薦するのか決定します。

以下のGifがわかりやすいのでご覧ください。


By MoshaninOwn work, CC BY-SA 3.0, Link

ColdStart問題

購買履歴がないと協調フィルタリングは使えません。つまり新規ユーザや新商品には適用できない問題があります。新商品は誰もまだ購入していないため「この商品は誰にも買われていません」という結果になります。

市場投入してしばらく経つのに購入されてないならレコメンドしないのが正解ですが、市場投入したばかりで購入履歴がないからレコメンドしないのは不適切ですよね。

このようにデータが足りない状況を欠損値問題といい、欠損値をどう補うのか様々な研究がされています。

少数派問題

独特な好みを持つユーザや、今までに類がないような斬新な商品といった少数派には、類似するものを見つけられないため協調フィルタリングが有利に働かないという問題も報告されています。

協調フィルタリングのまとめ

・購買履歴から似たユーザ、似たコンテンツを定義

・ドメイン知識が不要

・ユーザが多いと購買履歴が集まりやすいので有利

・新商品投入など新陳代謝が激しい場合は不利

・類似する仲間がいなければ推薦できない少数派問題