AlphaGo Zeroに再び衝撃
AlphaGo Zeroに再び衝撃
GoogleDeepmind社から衝撃的なリリースが再び
http://www.huffingtonpost.jp/2017/10/18/alphago-zero_a_23248198/
囲碁の人工知能研究には一区切りで、ライフサイエンスなど他分野に注力してるものと思っていたので、新しいバージョンが発表されるとは思ってませんでした。
◆これまでのAlphaGoの進化
AlphaGo Fan (AGF) 2015年アマの欧州王者ファンフェイと打った時の最初のバージョン
AlphaGo LeeSedol(AGL) 2016年 世界トップ選手の李セドルと打った時のバージョン
AlphaGo Master(AGM) 2016年~2017年60連勝して、ランキング1位柯潔と打った時のバージョン
AlphaGo Zero(AGZ) 今回の発表
強さのレベルはDeepmind社が出しているイロレーティング(EloRating)を参照
今回は下記の表のように40日間で今までのAlphaGoを越えた。
◆今回の発表の骨子とは?
簡単にいうとこんな感じ?
・教師データなしの強化学習のみを進めて、これまでのバージョンを越える勝率の人工知能は開発した。
・極めて早い速度で人間はおろか、これまで発表したAlphaGoを越えた
※3日でAGLレベル、21日でAGM、40日で前人未到領域のレーティングに到達している。
・評価関数をこれまでのポリシーネットワークとバリューネットワークを使用するのではなく、統合された一つのネットワークを使用している。
・これまでのロールアウトは使用しない。(すなわちモンテカルロ探索によるランダムシュミレーションしないということ)
・消費電力は最新型AGMと同じく初期バージョンの1/48でかなり効率的
http://news.mynavi.jp/column/tpu/003/
◆ぞっとさせる進化の意味合いとそのスピード
なんか色々まじかよ。。。
としか思えないのですが、どういうアルゴリズムの設計をしているのか、興味があります。説明を受けてもわからない可能性大ですが。。
上記の意味合いを解釈すると、こんな感じでしょうか。。
これまでディープラーニングではこれまでの大量のデータがあってこそ、強力な人工知能を創り出すことができるというように思っていたのですが、その論をちょっと修正して過去のデータがなくてもシュミレーションにより大量のデータを創り出すことができる場合は、可能だということ。
寧ろ下手したら人間の手垢がついていない状況のほうが、より革新的な成果を生むことができる。
しかもそのスピードは極めて早い。※人間よりシュミレーションにより圧倒的に経験量を増やす環境がある場合においてはですが
ちょっとよくわからんのが、これまでの評価関数をどのように統合しているのか?
人間に置き換えるとポリシーネットワークは直感(第1感)でバリューネットワークは大局観。
これが統合されたということであれば、どんな評価関数を創り上げているんでしょうか?
上記の新しい評価関数の評価による決定で、これまでのランダムシュミレーションをなくしているみたいだし、あるいみ非連続変化だと思う。
重要なのはこのアルゴリズムをつくる上で、これまでのAlphaGoのバージョンの経験蓄積があったからできた変化なのか、そうではないのか?
僕は多分前者だとは思うのですが、後者だったりしたらえらいこっちゃとしか言いようがない。人類史に革命を何度起こすつもりですかね。。
これまでのAlphaGoに関する投稿
ジャンプ展にいってきて、経営戦略的にジャンプの凄さを理解した
週刊少年ジャンプが創刊50周年。
8月に六本木ヒルズで開催されている週刊少年ジャンプ展に行ってきました。
※明日10/15まで開催!
https://shonenjump-ten.com/
ジャンプ黄金時代で少年期を過ごした自分にとっては、童心にかえる最高の展示会でした(笑)
「オラ、ワクワクしちまうぞ!」みたいな気持ちでいったのですが、ジャンプ創刊からの歴史を改めて見たときに、とても勉強になったので簡単に自分の備忘もかねて思ったことをメモまで。
※写真はコラボハンバーガー
◆歴史を観たときに、実はとっても戦略的な週刊少年ジャンプ
あんまり認識していなかったのですが、週刊少年ジャンプはマガジンやサンデーに対して後発参入の雑誌とのこと。
漫画雑誌のKBF(顧客が購入する要因)が漫画が面白いこととするならば、漫画雑誌のKSF(成功要因)の一つはオモシロイ漫画家を押さえること。
しかしながら当時の人気漫画家はすべて他誌に押さえられていて、ジャンプで連載してもらうのは難しかったそうです。
そこで週刊少年ジャンプがとった戦略とは、若手漫画家を登用して挑戦・育成の場とすることでした。
創業期の若手の中でジャンプを引っ張ったのが本宮ひろ志さん(「男一匹ガキ大将」)と、永井豪(「ハレンチ学園」)だったみたいです。
お二人とも有名な作品を数多く出していますが、ジャンプで見出された作家だとは知りませんでした。
人気漫画家を押さえ続けるための専属契約制度と、「MBAマーケティング」の事例でも取り上げられているアンケートシステムで常にマーケットリサーチと改善と不人気漫画の排除が行われ、PDCAがかなり早く回される仕組みが作られました。
漫画の「バクマン」ではさらっとしかみていなかったけど、育成して戦うという戦略を考えたら極めて合理的です。
過去の漫画の歴史をみると、かなり漫画のポートフォリオを意識している(バトル、ギャグ、ラブコメなど)のもわかります。
また時代ごとにかなりチャレンジングなとがった漫画を出してきていますが、リーンスタートアップにも通じる考え方のように感じました。
コンテンツビジネスの一つの成功パターンとして学ぶべき事例が多いように思えます。
実際本宮さんのアシスタントから車田正美(聖闘士星矢)、宮下あきら(男塾)、武論尊(北斗の拳)など出てきてこのへんが当初のジャンプ本流になった後、多くの漫画家がジャンプから誕生しました。
今回の展示会は1980年代まででしたので、鳥山明(ドラゴンボール)、北条司(シティハンター)、ゆでたまご(キン肉マン)、高橋陽一(キャプテン翼)など歴史に名を残す漫画家が出てきて、これから黄金時代へというところで終わりました。
次回の展示会が楽しみです。
◆週刊少年ジャンプは今なお変化し続けている。
外部環境をみたときに出版業界というのは、かなり厳しい環境にあるように思えるのですが、その中でジャンプ施策や取組は目を引きます。
国内の人口減、IT環境が整ってきたことによるチャネルの変化など環境変化が激しいですが、コンテンツビジネスとして取るべき施策を取り続けているように思えます。
週刊少年ジャンプは、雑誌から週刊ジャンプ+というアプリケーションに、コンテンツを出すプラットフォームの比重を重くしていたり、育成という視点から電子空間で発表する場「ジャンプルーキー」や作成支援ツールの「ジャンプペイント」、自社コンテンツから収益性を高めるための数多くのタイアップ施策など必要な施策をとりつづけています。
現代の編集者は、コンテンツプロデューサーというだけでなく、ビジネスプロデューサーでなくてはいけないのだと思わされます。
個人的にはオモシロイ漫画がこれからも出続けることを期待しながら、次なるジャンプの施策も一ファンとして楽しみにしています。
北朝鮮のミサイル問題について思うこと
頭がおかしい指導者(通称ロケットマン)に率いられた北朝鮮というテロリスト国家が存在する。
北朝鮮がミサイルを日本の上空に打ちまくっていて、いつ日本にミサイルが実際に飛んでくるかわからない。
そんな報道が多いように感じるけど、ちょっと違和感を感じてしまいます。
(※Jアラートのニュースが流れていたころに書いた文章なので、多少古いかもしれないですが)
◆北朝鮮は基本的に合理的な選択を行っている。
北朝鮮の目的は何か?という問いを考えると、「生存すること」と思います。
北朝鮮は自国の生存戦略のために、「核開発」と「ミサイル開発」を行っています。
核は現代世界における最も強力な交渉力を持つカードの一つ。
北朝鮮にも当然言い分はあるわけで、自国の安全保障は自分たちで行うしかなく、自分たちを攻撃すると「核」と「ミサイル」で報復するぞといいたいわけですね。
いじめられっこがいじめられないために脅しの武器を持とうとしてるようなものです。
◆このミサイル問題の当事国は日本ではない。
このミサイル問題の主要な当事国はどこか?となると、国際関係を整理したときには実は日本ではないと思います。
関連国を整理すると下記。
①核開発とミサイル実験を繰り返す北朝鮮
②北朝鮮と直接的な国境を接して、最も近い米軍基地が存在して数十年戦争状態にある韓国
③北朝鮮に対して最も安全保障を脅かす存在としての米国
④北朝鮮の資源や経済など深い関係を築きライフラインとなっている中国
⑤北朝鮮に軍事技術や経済面で支援し、建国以来の関係にあるロシア
⑥米軍基地が存在してミサイル実験の際に破片が落ちる可能性がわずかにある米国の同盟国日本
日本は北朝鮮と戦争状態にある国というより、戦争状態の対象の同盟国ということで、攻撃対象としての優先順位は北朝鮮から見たときは、韓国などに比べると高くはないでしょう。
ただ北朝鮮を攻撃可能な基地が存在するということで、実際に戦争状態になった場合は、日本に存在する基地攻撃をやはり考えることかと思います。
この北朝鮮は20世紀のもっとも強力な覇権国家アメリカ合衆国に対して、最も対抗する大国ソヴィエト連邦との対立によって産み落とされた国家であり、現在はソ連の崩壊とともに孤立化した状態にあります。
この問題の深層はパワーを喪失しつつある覇権国アメリカと、次世代の覇権を取ろうとする中国との力の綱引き上で起きているトラブルなのだろうと思います。
いま日本方面にミサイル実験をどんどんやっているので、いかにも日本が攻撃されているような錯覚を覚えてしまいますが、北朝鮮がミサイル実験をするためには日本方面に行うしかありません(公海がそっちにしかないから)
ミサイルの軌道を地図上でみると北朝鮮は実験を行う上で最大限被害が出ないように配慮しているようにみえます。
◆日本が選択できるオプションは限られている。
このミサイル問題に関しては、日本のできることは正直限られます。
・外交努力
そもそも当事国の度合いが低い日本では、あまり北朝鮮に安全保障を担保するためのキラーカードを持ち合わせていないように思います。
これを主張するコメンテーターは、北朝鮮に対して何を与えて交渉するつもりなんでしょうか。
そもそも攻撃能力を持ち合わせてないわけで、攻撃しないよと保障することもできません。
拉致問題などもあって、ミサイル以外の別の問題解決の突き上げもありますし外交でミサイルや核開発問題を解決するのは困難だと思います。
・敵基地への先制攻撃
このオプションは平和憲法を順守する以上、事実上不可能。
また敵基地攻撃能力は自衛隊の現在の配備ではきついと思われる。(しらんけど、論理的に考えるとそんな能力は今の枠組みでは備えていないでしょう)
・ミサイル迎撃能力の向上
結局これが一番いまのところ現実的ということで、PAC3やイージス艦が今後増設されるらしい。
100%撃ち落とすことは、大量に撃ってきた場合は難しいかもしれないけど、まあ妥当な対策かなと思います。
◆今後の展望について
基本北朝鮮を攻撃するというオプションは、米中露3国が戦後のことも合わせて合意してからはじめて行われるのではないかなと。米中の閣僚会談がすすんでいるようですし。難民や損害を考えるとやるかどうか知りませんが(というかやりたくないでしょうね)。
安倍首相は今回の北朝鮮のミサイル問題は、衆議院選挙の争点にしているみたいだけど、実際の危機とはそれほど感じていないのではないかなという気がします。むしろ政権にとっては追い風でしょうか?(だからこそ選挙をする)
国際協調や日米同盟の関係から表面上は北朝鮮に圧力をかけながらも、水面下では平和交渉のチャネルを開き続けて、ミサイルの標的にならないよう頑張っていただきたいものです。
私的「世界史の10人」
母校のビジネススクールのアルムナイ(卒業生)向けに、ライフネット生命の会長CEOだった出口治明さんが講義をしてくれるらしい。
以前出口さんの著書「世界史の10人」を読みましたが、恐らくは同様の内容になるのではないかなと予想してます。
歴史的な思考ってやつですかね。
詳細の連絡が後日アルムナイオフィスからくるそうなので、楽しみです。
受講するかどうかは詳細をみたいところですが
ビジネスリーダーにとって知っておくべき世界史のリーダーをピックアップしている内容でしたが、自分だったら誰を選ぶだろう?とちょっと思いをいたしました。
個人的に選びたいのは、下記10人
管仲(古代中国:斉)
藺相如(古代中国:趙)
アウグストゥス (古代ヨーロッパ:ローマ)
サラーフ・アッディーン(中世イスラム:アイユーブ)
シャルル5世(中世ヨーロッパ:フランス)
二宮尊徳(近代日本:江戸)
誰を選ぶかって、やはりその人の価値観が大きく反映される気がします。
AlphaGoの進化、今後の未来
昨日でGoogle Deepmindと中国が共同で行ったFuture of Go summitは終了しました。
世界に衝撃を与えたAlphaGoが再び観ることができて、個人的には非常にエキサイティングでした。
AlphaGoには再び登場してくれて感謝です。
Googleが昨年トップ選手であるLeeSedolを打ち破って実験は成功したにも関わらず、今回のような企画をしたのは意外でしたが、前回の打ち方でまだ完璧とはいえないことが分かったことに加え、今回は中国市場再参入のマーケティング側面もあったのではないかと思います。
とはいえ中国共産党政府にとってはGoogleは自国の情報をuncontrolableにする脅威そのものなので、今回直前で中国国内でのToutube放映がされなくなったみたいですけど。
今回対戦相手になった柯潔(KeJie)は、この三年間で世界ランキング1位を取り続けた人。
https://www.goratings.org/en/history/
レーティングの変化を観る限り、歴史上最強の一人といえそうです。
この上ない試金石です。
今回のAlphaGoの進化は、結果として圧倒的に強くなった部分を別として、昨年に比較すると主に下記の点にあると思っています。
①効率性の向上
今回のAIを稼働させる電力消費量は前回の1/10になったということ。
電力使用コストが一度アルゴリズムを組み上げていくと、かなり削減しても前回を上回るパフォーマンスを実現できることは、今後のAI革命に有意義な実証実験となったのではないでしょうか?
②着手の多様性
序盤も中盤も前回とは比較にならないぐらい多様な価値判断をするようになったように見えます。
序盤戦略では前回は割と似た布石による一本調子な点がありましたが、極めて多様な布石を打つようになりました。
中盤も優れた中央感覚に前回は驚きをもって受け止められましたが、今回は中央感覚だけでなく実利を取る感覚も優れてますし、それ以上に想定困難な手抜き感覚(盤面全体を観ての価値判断)や石の効率性の判断が衝撃的でした。
③複雑さに対する対応力の向上
前回のAlphaGoでは、第四局でLeeSedolが繰り出した100万分の一の確率の着手に、PolicyNetworkの予想外の着手を打たれた時にモンテカルロシュミレーションの弱点(ランダムシュミレーションの為)として深く正確に読むことが困難という欠点が出ました。
今回は前回以上に複雑な碁もあった上、コウをめぐる攻防(より複雑になる)もあったのですが、一回も僕には欠点は見えませんでした。
強くなりすぎてて弱点が露出しなかっただけかもしれないですが、そのへんは自己対局を観てみようかなと思ってます。
囲碁の世界に対しても、AlphaGoは確かな爪痕を残しました。
①人間の囲碁というゲームの理解度を明らかにした。
人間がどれぐらい囲碁を理解しているか?ということを今回ほど如実に示されたことは歴史上なかったと思います。
思った以上にこのゲームの底は深く、まだAlphaGoですら解は出せない世界が多くあることがわかりました。
②今後の囲碁AIの進化の道筋を示した。
中国テンセント社のAI絶芸(FineArt)や日本のDeepZenなど、Deeplearningの技術を一部開示されたことで、一気にブレイクスルーが起きて、不可能だと思われていた人間のトップ選手を越えるAIが次々出現した。
③人間の進化の可能性を示した。
中国の柯潔(KeJie)は、今回人間がAIの打ち方を学ぶことで進化する可能性を示してくれたと思います。
完敗したとはいえ人間がここまでAIに接近した打ち方ができるとは考えていなかったので、本当に驚きでした。
GoogleのAlphaGoは今後のAI革命の為のいわば巨大な「実験」でした。
アルゴリズムの実験としても、AIのマーケティングとしても、十分な成果があがったと思われます。
なので囲碁に今後それほどこだわる必要はない為、何か合理的な理由がない限り多くのリソースを割くとは思えません。
一方で囲碁業界においては産業構造に囲碁AIがどのような影響を与えるかは、まだ未知数なところがありますが、AI導入における一種の社会実験はむしろこれからなのではないかと思います。
囲碁はそういう意味ではAIによる変化の先端に位置しつづけるのではないでしょうか。
Deepmindは最後にAlphaGo同士の対局記録を50局公開してくれました。
1、2局みただけで、変化が大きすぎて意味のわからない部分が多かったですが、非常に楽しみです。
https://deepmind.com/research/alphago/alphago-vs-alphago-self-play-games/
※AlphaGoネタの記事
タイムマネジメントの相談を受けて
タイムマネジメントの件、認識を理解しました。
すごい長い文の追記で恐縮ですがすべてこれをいつもしているわけではないです。
「理不尽」の効用について
「理不尽」の効用について
ちょっと理不尽ということについて考える機会があったので、書き留めておこうかと思います。
内容としては理不尽を受け入れることの効用について書いているのですが、誤解がないように前提としておいておきたいのは、むやみやたらと理不尽に耐えろというつもりはないこと。
むしろ理不尽なことは極力なくすべきだし、理不尽な環境を変えることができるのであれば変えた方がよいに決まっています。
理不尽の許容が行き過ぎると先日の電通の事件や、ブラック企業になっていまいますので。
少なくとも自分自身の立ち振る舞いとしては、理不尽なことはするべきではないと思います。
一方で身に降りかかってくる理不尽については、全てを避けることはできるわけではありません。
むしろより積極的に受け入れた場合の効用について経験のなかから考えてみました。
■理不尽を受け入れた場合の効用(メリット)について
①現実を知る
そもそも世の中は道理では動いていないことが圧倒的に多い。
とはいえついつい忘れがちになることも多いので、自分自身のバランス感覚を取り戻すうえではよい機会になることも。
自分自身がコントロールできない「理不尽」について嘆いても仕方ないし、ある程度やむを得ないことも多いので、そういったことが起こるのが現実としてどう向き合っていくかに思考を集中させる。
②精神的に鍛えられる。
感情を制御する能力という意味と、痛みを知ることでの共感能力という意味で、精神的に成熟する機会になります。
大概強烈な理不尽を体感していたら、自分の感情と向き合いコントロールせざるをえなくなります。
その結果それ以下のことはだいたい許容できる気がするし、そもそも人間は体験していないことは想像ができないので、理不尽な経験をしている人に対して共感をすることができるようになる。
③理不尽なことを突きつける人を理解する。
理不尽を感じる時は、自然現象などには感じず、たいていは特定の誰かがいて、人間関係に起因していることが多いように思えます。
理不尽と感じるだけの要求を求めてくる人には、何か「弱さ」の裏返しがあって感情的になっているか、強烈な「価値観」に基づいた何かがあるのか、もしくはとてつもない自分本位な馬鹿な人なのか。
相手のことを本質的に理解するうえではいい機会。(もちろん自分自身がその人に感じている感情が原因の可能性も高いので、そのへんはバイアスを考慮する必要あり)
④時には同情を得たり、味方になってくれる人も
これは理不尽な扱いを受けたときの立ち振る舞いにもよるとは思うけど、周囲に配慮して道理にかなった振る舞いをしていれば、ピンチがチャンスに変わることも多い気がします。
世の中自分一人で生きてるわけもなし、理不尽は生きる上ではつきもの。
この種の悟りって、子供時代から何度も経験をするものだとは思うのですが、らせん状の成長の中で繰り返す気がします。
もちろん理不尽に対する「怒り」が変革や行動を生み出すこともあり、全てを受け入れたほうがいいわけでもないでしょう。
他人に理不尽さを受け入れるように要求する人は、たいてい身勝手な人が多いですし。
積極的に受け入れる理不尽と、徹底的に戦う理不尽を分けて、きちんと判断軸をもっておくことが重要だと思っています。
一時的には逃避という選択肢もありだと思います。もしくは戦う土俵を変えることも。
ただ延々と逃げ続けることは、人生から逃げることと同義に近いので、どこかで受け入れながらより硬軟交えて前に進む(これもある意味変革)か、ある場所では徹底的に戦う道を選ぶかは決断するんでしょう。
判断軸は現実サイドに寄せる人と理想サイドに寄せる人に分かれそうです。志などで統合されていれば素晴らしいですけど。
何事もそうだとは思いますが「正解」はないけど、自分自身の人生を生きるためにも判断軸は持っていたいですね。