今日も知らない街を歩く

雑記に近い形でちまちま書いていきます。

機械学習とは何かを学び始める

「キカガク」の「脱ブラックボックスコース」を受講している。

www.kikagaku.ai

  ずっと機械学習には興味があったものの、忙しさを理由にしたり、とっかかりが見つけられなかったりで、なかなか学習に手をつけられなかったのだけれど、正月にこの講座を発見して、「1月中には必ず少しだけでも始めよう」と決意し、本日ようやく始めることになった。

  講義の内容は、(多少予想はしていたけど)まずは数学の解説だった。最後に数学を勉強したのは高校時代で、もう10年以上数学からはなれている。そして、(この業界にいるにも関わらず)数学は不得手に近い。確率論や期待値は理解できたけど*1、幾何学的な図形の証明問題や三角関数はさっぱりわからなかった。微分・積分も、公式はうっすらと覚えているが「どのようなものなのか」「どういった考え方で用いるべきものなのか」「どういったことに役に立つのか」全く頭から抜けていた。

  そういうわけで、地道な作業を覚悟しながら動画を視聴していった。

 

  動画は1単元あたり10分前後。講義は、指数関数や対数関数、微分とはどのような概念なのか、何がうれしいのか、公式はどうやって導き出すのか、などなど基礎的なことをきちんと解説してくれるのが良かった。少し込み入った定理には触れていないようだが、おそらく基礎的な概念がわかれば機械学習の理解には差し支え無いという判断で、カットしていると思われる。

  とはいえ、動画の後で受験できる小テストは、かなり苦戦する。問題の解説が無いのが不満といえば不満で、「合成関数の微分」は大苦戦し、結局1時間以上かかって解いた。テストをスキップして次の単元に行けることはいけるのだが、これを解けるレベルでないと、また高校時代のようにさっぱりわからない公式に囲まれて嫌になるのではないかという嫌な想像から、なんとか解いて進みたいと考えてしまっている。

 

  実際のところ、この「脱ブラックボックスコース」および他の機械学習に関する単元を学習し終わったとして、エンジニアとしてこれで金を稼げる位のデータサイエンティストになれるかと言ったら、おそらく怪しい。これはキカガクという会社のカリキュラムが悪いわけではなく、そもそもの話として、以下の2つがあるからだと思う。

  • コースの終了は、データサイエンティストの出発点にすぎない

  キカガクを全て終了したとしても、データサイエンティストとしては、あくまで(ITエンジニアでいうところの)プログラミングスクールを終了した程度のレベルの人間でしかないのではないか、と考えている。基礎的なことは理解しているが、それらの知識や技術が、実務ではどのように使えるのか、相応の経験を積まなければならない。

  • 具体的な案件を探す力は、ここでは身につかない

  データサイエンティストとしての働き口をどうやって見つけるか、という営業力の話である。いわゆる具体的な案件はどこにどうやって入手するのか、ここではわからない。

  という以上2点を考えると、このカリキュラムを新しく仕事を得るために受講し、データサイエンティストになるということは、困難な道程と考えざるを得ない。

 

  しかし、このカリキュラムが全く役に立たないかと言えば、決してそんな事はない。このカリキュラムは、例えば脱ブラックボックスコースで言えば、エンジニアだけでなく、非エンジニアに対してのコースでもある。つまり、営業やセールス、マーケティングといった他の職種が、機械学習がどういうものかをより深く理解することで、ビジネスチャンスや新規事業、ある顧客に対するアプローチといった、自分の職種のドメインについて、理解が進む可能性がある。

  またエンジニアにとっても、「これだけでデータサイエンティストになるのは厳しい」と書いたが、他の技術と組み合わせることで、結果的に仕事を得ることは、まあ現実的な話になりうると思う。例えばWebサイトを作る技術、DB周りのデータ整備をする技術、インフラ運用の技術など、これまでのエンジニアのキャリアで培った技術と組み合わせて機械学習を取り入れることで、運用の効率化であったり、新たなサービスの拡充を検討するなど、用途はいろいろあるだろう。

 

  実のところ、機械学習を学び何をするのか、特にこれといったプランがあるわけではない。機械学習とは何だろうと、興味があるのに全くとっかかりがつかめない状態が気持ち悪かったから、それを解消したいという理由、それぐらいである。要するに、ただの好奇心に他ならない。しかし、こうして高校時代に全く自分を苦しめるだけだった数学が、今こうやって「何かを理解するためのツール」として目の前に現れていることは、とても新鮮だ。そして、試験をクリアするためだけだったかつての高校の勉強と違って、「公式がそうなるのはわかったけど、どうしてそうなのか理解しないとどのみち使い道がないから、必死で理解するしかない」とウンウン唸っている今の勉強は、はっきり言って楽しい。

 

  このブラックボックスコースは12時間学習時間かかるらしいが、これまでの様子を考えると、間違いなく12時間以上かかる。下手したら倍の時間はかかるかもしれない。それでも何とか食らいついて、脱ブラックボックスコースは修了しようと意気込んでいる。

*1:おかげで、バックギャモンも苦にならず勉強できている。