G検定の出題問題
つい今テストが終わったので、傾向などを書いておきます。
反省
最初の30問程度は法律・倫理問題が比較的多くてググっていると無駄に時間を取られるので、後に回すべきでした。最終的には時間内に解き切れましたが、最後は速読気味で解くことになってしまいました。実際の試験形式で練習してないから時間配分とかちゃんとわかってなかったですね。でも最短時間で合格したかったので試験形式で2時間取る気はしなかったのでそこはしょうがないです。
勉強した分だけググる時間・悩む時間が減って2時間で収まるようになりそうという印象でした。出題傾向を正しく把握して事前に必要最低限を頭に入れておくのが合格への近道だと思いました。
そういえば今回の問題数は191問でした。
出題問題傾向
ここに書かれた通りの全く同じ問題が出たんじゃないかと思っています。
事前に読んではいたのですが、1問ごとに意味を調べるレベルでは見ておらず、ざっくり全体の傾向を見る程度で済ませてしまっていました。実際はほぼこの通り出題された印象で、t-SNEとかMAMLとか知らない単語がここにあったら調べて自分なりに意味を理解しておくべきでした。照応解析、談話構造解析、行動価値関数Q、んー本当にここに書いてある問題が全部そのまま出たような気がしています。
前回の問題に載ってなかった (気がする) けど、出題されたのは以下ですかね。
秘密営業
4問くらい出ました。正直名前程度しか知らなかったので困りました。どういうパターンが秘密営業にあたるかなどわかっておいた方が良さそうです。不正競争防止法絡みなんですかね。よくわかっていません。
欧州委員会
3問くらい出た気がします。
欧州委員会のAI倫理ガイドラインが出ました。これはググるってことで良いと思います。Partnership on AIとセットで出たので全く新しい問題というわけではないかもしれません。
■
昨日と今日でやった勉強
今日は公式テキストの3~4章を読みました。
問題集(公式問題集ではない) は昨日210ページまでやりました。
ただ時間が足りないので星三つの問題だけです。
■
はじめに
突然ゆうやくに負けて、当初買わないと言っていた公式テキストを買ってしまいました...
というのも、study-ai解いてみてG検定特有の知識も知っておくと良さそうだと分かったというのが一点と、もう一つ個人的に読書会に参加していて読書会で問題解いたりYouTube見てるのもなんか場違い感あるんで、読んでる感あるものが欲しかったという理由です。俺はいつになったら過去問をちゃんとやるんだ。これだから人間はダメなんだよね。
以下、テキストを2章まで読んだのでメモ
第1章人工知能とは
ここは内容が薄いのでささっと読めば良さそう。
AIブームは今回で3回目だよ、とかそういう感じ。
ロボットの研究は人工知能の研究とは呼べないのに対して、
人工知能の研究は脳以外、つまり身体的な部分も研究対象だっていうのは
第2章人工知能をめぐる動向
第一次AIブーム
この辺は高校生の時に思いつきでオセロのAIを実装したことがあるから知ってる。なぜか人間より若干弱かったので、たぶん実装ミスってたんだと思うけどw
オセロでも盤の評価が大事なわけだけど、後半戦はモンテカルロ法でランダムプレイアウトさせるという、いわば従来型のゴリゴリ全探索戦法により評価するというやり方があるらしい。これは実装しなかったなあ。
第二次AIブーム
エキスパートシステムの話。オントロジーとは、知識を概念と概念の関係のセットとみなした時の形式的表現。is-a関係やpart-of関係。手動で頑張るヘビーウェイトオントロジーの他にウェブマイニングで抽出するライトウェイトオントロジーもある。IBMワトソンはwikipediaからライトウェイトオントロジーを生成している。
第3次AIブーム
以下で取り合えた動画シリーズを見ていればだいたい知ってる内容。
知らなかったところだけメモる。
自己符号化器とは、入力と同じ出力を得られるよう学習したものであり、これを足場にすることで多層学習が可能になった。
DLの研究は2006年頃にジェフリーヒントンが始めた (名前は試験に出やすいので注意しておく)。
study-aiを解いてみた 〜問42
意外と3割くらい分からない問題がありました。
知っているはずなのに選択肢を選べない問題もあったので、知識不足の解消の前にまずは問題に対する考え方を理解した方が良さそうです。
解説動画としてYouTubeに良さそうな動画があったので、
次は↓この辺りを見て分からなかった問題の考え方を理解しようと思います。
Deep Learningの基礎
はじめに
昨日の記事で「まず過去問をやる」と書いたにも関わらず、つい誘惑に負けてDeep Learningの基本を簡単に頭に入れて全体像をざっくり理解してから進めたくなってしまいました。2時間程度で頭に入れたので今日はそれをメモろうと思います。
学習教材
14本の動画で、全部で2時間程度で全て見られます。内容が濃く大変勉強になる神教材だと感じました。2倍速再生で1時間で見ようと思いましたが、途中で理解が追いつかなくなったので結局1倍速再生で見ました。
この記事では以下、この内容をメモっただけなので、↑この動画を見た方が良いです。
(途中でメモるのさえやめました。動画を見ましょう)
Deep Learningとは
- Neural Networkの層の数を深く(3~1000層)にしたもの
- 近年インターネットによりデータが豊富になったこと、GPUにより演算性能が向上したこと、によりDLが実現可能になった
- 2011(2012?)年ごろからDLによりブレークスルーが起き性能が大きく改善し続けている
- 性能向上に必要な要素がプログラムではなくデータになった
DLでできること
「DLで何ができるか」は「ソフトウェアで何ができるか」に近い
- 物体検出:ピクセル単位で物体を識別する(セマンティッグセグメンテーション)
- 低解像度画像 -> DL -> 高解像度画像
- 発話 -> DL -> 応答
- 画像 -> DL -> 説明文
- (画像,質問) -> DL -> 回答
- 各種不動産情報 -> DL -> 不動産価格
DL設計の基礎
Convolution Neural Network (CNN)の層
- Convolution: input画像を近傍5x5ごとに切り出してフィルタをかけてoutputにする。1pxずつずらしてフィルタをかけて1つのoutput画像にする。重みwは5x5個をどの近傍でも使い回す
- MaxPooling: 隣接するピクセルの最大値を取って出力とするもの。outputは縦横半分になる。ダウンサンプリング。
- Tanh
- Convolution
- MaxPooling
- Tanh
- ここにこの層が大量にある ー> (Affine: ΣWiXi +b, Tanh)
- Softmax: 足して1になるようにするやつ
8の層は分類問題ならSoftmax
2値分類問題ならSigmoid
回帰問題(数値予測)ならなし(前の層の出力のまま)
やっぱりやめた
全部まとめようと思ったけど、無駄に時間がかかりそうなのでやめます。
元動画が無駄のない神説明なので、まとめる意味もなさそうです。
忘れたら2倍速再生で元動画を見ることにします。
G検定の対策方針
はじめに
G検定試験まで18日なので、そろそろ手をつけ始めようと思ってブログを作成しました。
このブログではこれから受験に向けてやったことを書いていこうと思います。
自分の受験全般に対する基本方針
大学受験も含めて全般に言えることですが、受験で大事なのはとにかく "過去問" です。そこで自分の場合は教科書を開くより先に過去問をまずは解く、これが基本方針です。過去問を解いて合格基準と自分の実力とのギャップを把握し、そのギャップを埋めるために必要な場所だけを参考書等々を使ってキャッチアップしていくのが受験対策です。ざっくり以下の順序になります。
- 過去問を何回分か解く
- ギャップのある分野・解法・用語を把握する
- その分野・解法・用語を勉強をする
- ギャップが消えるまで1から繰り返す (ループ)
ところが、G検定は過去問が出回っていないようです。困りました。
しかも上記のループを回すためには過去問をできれば複数欲しいです。
G検定受験対策における過去問 (相当の問題)
過去問が公開されていないため、自分を騙して以下の2つを過去問だと思い込むことにしました。
まずはstudy-ai。
どうやら本番でもここから問題が出ることが多いようです。過去問と考えて差し支えないレベルと言えそうですね。
この本も最近傾向の変わったG検定に即しているようです。この本の中身を確認し方向性がstudy-aiと同じであれば、過去問だと思い込んでも良さそうです。
黒本についてはあえて使わないことにしました。
どうやら4割程度しか本番をカバーできないらしいので、勉強効率が落ちそうな気がしています。また白本も同様の理由で読みません。