ド文系の『ジゴクのAI学習』【G検定・E資格】

なんとなくイメージで理解するAIの世界

【G検定】⑦ 第4章 機械学習の具体的手法(0)概要 「いよいよド文系にはジゴクの始まり」

人生で初めてブログに読者がついでくださいました…ありがとうございます!

(こんなこと、ここに書いていいのかわかりませんが。。)

 

さて、いよいよ「機械学習の具体的手法」が登場します!

これまでAIの概要や歴史、問題点等‥まだ「読めば理解できる」世界でした。

ここからがG検定のジゴク(ド文系にとっては)「読めば寝れる」世界です。

本題に入る前に『何故ド文系にとっては「読めば寝れる」世界なのか?』

これ認識しておくだけで、ちょっと心持ち楽になると思うので、ご一読ください。

 

AIの『機械学習・深層学習』は数学の世界です。

AIは「何らかのデータ(X)を入力したら、何らかの出力・予測(Y)を得る」です。

これってつまり数式です。関数です。一番シンプルな関数は、

 

Y = 🔵× X + 🔴 (色付きの〇は🔵「重み」🔴「バイアス」とか言われます。)

(正しくは『Y = W *X+b』です。「アフィン変換」というらしいです。)

 

そして機械学習はこの🔵とか🔴とかを「機械的に学習する」方法です。

どうやって機械的に?「教師あり学習」だと「教師=答え=T」があります。

この答えTと予測Yの「差=損失=誤差」を使って🔵とか🔴とかを修正していく。

ちなみにその時の「差=損失」をグラフにしたもの「損失関数」と言います。

その「損失関数が最小化=損失が少なくなるように」学習していく。という流れです。

 

すでに眠たいですか?

これが一番シンプルな『機械学習』の『式=モデル』です。

そして『何故ド文系にとっては「読めば寝れる」世界なのか?』の説明ですが、

この時の『式=モデル』や『損失関数』がこの章の『具体的手法』の正体です。

例えば、具体的手法の①線形回帰で出てくる「リッジ回帰」の関数は、

リッジ回帰式

もう寝たくなりますよね?

『G検定』ではこの式自体は問われませんが、テキストに「リッジ回帰とは?」はこの式に基づいた説明がなされているわけです。(『E資格』はバンバン出てきます)

つまり「数学的素養」が無いと「何を言いたいのか?」すらも意味不明。

「数学的素養」があれば、この式自体は解らずとも、この式から「あーなんか出力との差を二乗で和してるのが『損失関数』いうのね。それに重みの2乗和の何か係数かけたのを『正則化項』いうのか~あーなんとなくこんなグラフかな?ちょっと数字入れてみようか。」とかになる。らしいです。

数学的素養がある理系の方々は、こういう「式の『本質的なイメージ』を弄ったり組み合わせたりして理解する」事を学生時代にされてきたので、理解が早いようです。

ド文系の私はこの【式の『本質的なイメージ』】がどーにもわからないものが多々あります。その代わり私は【式の『なんとなくイメージ』】を手に入れました。そして『なんとなくイメージ』でG検定もE資格も乗り切りました。(もちろん必死に理解しようと、WEBみたりYoutube見たりした末にです。ただのイメージではないのでご安心下さい。)

つまり『なんとなく』≒『本質的』大差ないレベル(数学的に言うと「近似化されてる」)にはできてると思います…自信ないんですが。

ついでにですが『なんとなく』すらも無視しているところもあります。「もう、そういうもんやと理解しとこ。」と言うヤツです。この先ご了承ください。

 

というわけで今回のカンペノートは極少。4章の1項目のみです。

**********

4-1.機械学習の具体的手法(0)概要

機械学習の種類→「課題の構造別」モデルはたった3種類

機械学習にも向き・不向きがある※

教師あり学習・・・答え(教師)あり学習。(回帰・分類) 

教師なし学習・・・答え(教師)なし学習。(構造・特徴)

強化学習・・・それ以外学習。(行動学習)

**********

今後の項目ではこの①~③の具体的手法(例:「リッジ回帰」とか)が出てきますが、まずは「課題の構造別には3種類に分類されるんやな」とご理解ください。

ちなみに「課題の構造別」に3種類に分けてるだけで、今後「分野別に」も分けて説明始まるので「あ~課題の構造別なら3種類に分けれるんだね」ぐらいでご理解ください。これが結構混乱するハメになります。

 

それぞれがちと意味わからんかもですが、

教師あり学習というのが上述した通り「答え(教師=T)と予測(Y)の差を『誤差』として使って、回帰(売上予測とか、そういう予測の問題)や分類(写真を見せて「イヌ」とか「ネコ」とか正しく分類する問題)という問題を解くモデル」です。

教師なし学習というのが、そういう「答え(教師=T)」がないモデルです。たとえば、無数にあるニュース記事を「似たニュース同士に分類して」や、無数にある商品を「特徴や相関(お互いの関係性が強い弱い)に応じて分類して」などが該当します。分類ちゃうんか?と思われるかもですが、「答え(教師=T)」が用意されているわけではない点が違います。

強化学習は「それ以外」です…「え?」と思われるかもですが、そう認識下さい。具体的にはオセロ・囲碁などのゲームや自動運転が該当します。

 

ここで重要な事は、ご覧の通り「弱いAI」は、人のごく一部の機能を、人工知能にて解決するものですので、課題に応じて適切なモデルを選んでやる必要があります。

機械学習にも向き・不向きがある※はまさにそのことで、G検定を学ぶ最たる必要性はこの点にあるかと思います。

「ぉ~データぶち込んどいたら、なんかいい感じに応えだしてくれるのがAIのいいところやろ?」という四次元ポケットか何かと勘違いした『旧ドラえもん世代』が世の中にはまだまだ多数おられるとか。。

もしシステム発注者側の上席者がそんなことポロっとでも発言したら・・・受託側の理系エンジニアは「ジゴクの始まりか」と思うでしょうね。。。自戒。