GCP PCA受験ノートまとめ

GCPのPCAに合格したので、合格をもらうまでまとめていた学習ノートをブログ形式でまとめていく。
前回のGCP PCA合格したよという記事でノートまとめまで書きたかったが、長くなったので、別記事にした。
内容は学習ノートなので乱雑、項目もノートを書き写しながらなので、随時更新追記していくだろう。

DataprocとDataflow

DataprocとDataflowの使い分けをしっかりする必要がある
どちらも大量にあるデータを短時間で処理するよというフレームワーク

DataprocはApache SparkやApache Hadoopなど、大量にある静的なデータを処理するもの。10TBの画像データを機械学習にかけるような、そういう用途に使われるもの。Hadoopが使用するファイルシステムのHDFSも知識として必要。OSのファイルシステムではなく、その上に独自でファイルシステムを構築して、大量データの単位時間あたりの読み書き速度を向上させているもの。インデックスを構築し直したようなものという認識。

DataflowはApache Beamのバックエンドで動作しているフレームワーク。こちらはストリーミングでやってくるような動的データの大量処理が得意。ストリーミングデータを並列処理させてリアルタイム分析できるというフレームワークの説明からわかるように、GCPでもストリーミングデータの処理→Dataflowがベストプラックティスという流れが定石。

同じようにストリーミングデータをどう処理するかというものにCloud Pub/Subもある。こちらも100%問題に出るようなフレームワーク。PublishとSubscribeの略。Pullでデータを持ってくるかPushでデータを送り出すか、どちらでも利用できて、どんな状況であってもデータを送受信できる→モバイルやIoTにも最適という特徴がある。

DataprocもDataflowも、大量データの処理はできるという点は同じ。そのため、やろうと思えば、Dataflowで静的データを処理させることも、Dataprocでストリーミングデータを分析させることもできる。何が違うかと言うと、料金が大きく変わる。(どれぐらい変わるかは調べてない)
餅屋は餅屋でやらせることがベストプラックティス(当たり前か)

Bigtable,BigQuery,CloudSQL,Datastoreの比較

殆どが、前述の 「GOOGLE CLOUD PLATFORM エンタープライズ設計ガイド」 に記載されていたデータウェアハウスの選択フローの通り。
PCAの試験に向けては、こう覚えていた

レイテンシ(スループット)重視→BigTable
時系列データ→BigTable
大量データ→BigQuery
分析処理→BigQuery
SQLクエリが使いたい(既存環境と変えたくない)→CloudSQL
データ量が10TB以上→CloudSQL以外
ユーザプロファイルなど消えちゃダメなやつ→Datastore
AppEngine関係→Datastore

分析のレイテンシを早くしたい場合等は、BigTableではなくBigQueryになることがあるが、だいたいこの順番で考えるとPCAは簡単だった。
未だにDatastoreの立ち位置がはっきりしてない。AppEngineのバックエンドだったり、データの整合性が重要なものはDatastoreという感じだろうか

同じデータウェアハウスとして、Spannerも重要だが、結構特殊。
Spannerに関して、どこかで特徴をまとめて書きたいが、これから業務に関係しそうで、書きにくい…
SQL文が使えて、大量データも扱える。それぐらいでいいんじゃないかなPCAに向けては

BigQueryの操作はbqコマンドで扱う。ビュー、テーブル、などBigQuery用語から、bq show、bq lsなどのコマンドオプションの知識も必要。

GCSの詳細

PCAの問題最頻出のGKEの次か同等ぐらいに多いと言われているのがこのGCS関係の問題。

バケットというオブジェクト管理で、1オブジェクト5Tまで扱える。GCS自体には無制限にデータをおける。
GCPはCUI操作だとgcloudコマンドにて扱うが、GCSはgsutilで操作する。

 58 total views

GCP Professional Cluod Architectに合格しました

GCPのProfessional Cloud Architectを受験して、合格をもらってきました。
やったね!

名前を隠すために裏垢エッチな画像みたいな写真になってしまった。
その上でフィルタ加工も入れてるもんだから余計わからん。あとモニタのモアレがすごい(小並感)

資格としてITパスポートとか、ジャブを出してからこういうのは取りたかったが、職場都合で断念
これならいいよwということで、2回受験して、合格をいただきました。
1回落ちたときはあかん!もうだめや!新人のくせに調子乗った!ってひどく落ち込んでた。
合格をもらったことで、今はとにかく嬉しい

職場都合で断念と書いてしまったが、正確には、今の職場では受験費が出ない、もしくは合格報奨金が出ない、ただそれだけ
まあ、こういう資格が絶対必要な仕事ではないからね
実は、大学留年時代、会社に就職してから基本情報とかを取ると、資格取得ということで報酬金が出るという話を信じ込んでいた
英検とか数研とか、そういう仕事に関係しない資格はさておき、基本情報に合格すると1万円もらえる!とか
それなら就職してから取得したほうがいいだろうという安易な理由で、勉強も取得も後回しにしていた。
そんなの会社によるのにね
そしてなんと、今の会社には基本情報等では報奨金がもらえないというお話
しまったなあ
この資格なら受験費用はでる。報奨金は出ない(のかな?)
ちなみに、この資格を持っている人の平均年収は1000万らしい
受かったんでこの平均年収分ください。これからも頑張るんでお願いします。
愚痴はさておき、本題

GCP Professional Cloud Architectとは

Google Cloud Platform(GCP)を「組織が」正しく扱う上で、GCP正しく理解している人に与えられる資格
そうしたGCP資格の中でも、GCP全体のアーキテクチャについての資格

そもそもGCPが提供している様々な認定試験として
・Associate Cloud Engineer
・Professional Cloud Architect
・Professional Developer
・Professional Data Engineer
・Professional Security Engineer
・Professional Machine Learning Engineer
……(等々)
がある。
これの二番目のやつを受験して、2度目にして合格をもらいました

Professional Cloud Architectの立ち位置

GCPのこと知ってますよって人がAssociate Cloud Engineer、
GCP全体のアーキテクチャを正しく理解して、GCP使えますよ、プロジェクトを正しく導けますよって資格がこのProfessional Cloud Architect(以下PCA)
要はGCP専門のプロのインフラマンみたいなもの

詳しくは以下
Professional Cloud Architect 認定資格  |  Google Cloud https://cloud.google.com/certification/cloud-architect?hl=ja

PCAの特徴

全体のことを知っているだとか、後述するがGoogleKubernetesEngine(以下GKE、kubernetesはk8s)のことを知ってるだとか、そういう知識が必要だが、
一番は「組織が」正しく扱う上で。というとこが重要だと思った。
それから、GKE、次いでGoogleCloudStorage(以下GCS)の知識がいる。
例えば、オンプレで動かしているこういうプロジェクトがある。これをGCPに移行させる。どうすればいいか?みたいな問題が多い
選択肢もいやらしい
選択肢のA案、B案、C案どちらでもできる。A案はできるが手間だ。B案は費用がかかる。C案であれば難なく移行できる。なんて解説付きだ。
GCPから模擬試験が出ている。ここの解説が資格を取る上で重要だった情報だった。ちなみに、模擬試験に極近い問題が出題されることもある。
運転免許試験かよって思っていたが、選択肢オンリーの問題なので、運転免許試験の傾向になってしまうことは全国共通なのだろうか

ちなみに、テストを受けてもフィードバックは全くない。あなたは 合格・不合格のみ。フィードバックないのは かなりキツイ

PCA受験時

テストセンターに行って受験もできるし、リモートで受験することもできる。
ただし、リモートで受験する場合、前準備というか、部屋の様子をWebカメラで見せないといけないとか、他のウィンドウが立ち上がると一発NGだとか、結構条件が面倒くさい。2回ともテストセンターで受験した。

受験時間は2時間、問題数は50問。
画面は、一つのウィンドウがあり、内部で左右に分割されている(スプリットビューみたいな感じ)画面。中央はドラッグで移動させられる。
左が問題文及び選択肢で、右側がDress4WinやTerraEarth(だっけ?)などのケーススタディ表示画面。
右側の上にドロップダウンがあり、Dress4Winなどを選ぶことで各ケーススタディのコンセプト等がでてくる。
ケーススタディの内容は何も変わることなく、ケーススタディのページのまま。コンセプト等のいかがテキストとテスト用フォントで表示されている
一応、ここにDress4WinのケーススタディのURLを貼っておく
https://cloud.google.com/certification/guides/cloud-architect/casestudy-dress4win-rev2?hl=ja
フォントサイズは多分11かな?フォントが独特なのか、 英語・ひらがな・漢字でちょくちょくサイズがおかしい。正直読みづらかった。
左側問題文画面の下に、各種ボタンが有る。
左側画面の右下には、「前の問題に戻る」「次の問題へ進む」「すべての問題を見返す」「解答を提出する」の4ボタン。(少し曖昧。もう少し文言が短かったはず)
左側画面の一番右下のボタンが「解答を提出する」ボタンなので、日頃の癖で一番右下のボタンを押すと取り返しのつかないことになる。(実際押すと、提出しても良いですか?みたいな画面に遷移した気もするが)
2つ選択しないといけない問題は、2つ選択しないとエラーが出る。前の画面に戻ることすら許されない。
左側画面の左下にある「後で見返す」みたいなチェックボックスにチェックを入れておくと、「すべての問題を見返す」により、問題番号一覧(1-50までの数字が羅列しているだけ)の番号に*マークがつく。
解答を提出すると、アンケート記述欄が出て、アンケート回答後、合否結果が出力される。

1回目受験時は1時間20分でやっと50問を解ききったという感じだった。2週目を1時間40分で終わらせて、残り20分はどんな問題が出たか覚える方に全力した。2時間経過すると突然解答終了画面に遷移した記憶がある。
2回目受験時は40分で50問終わった。わからなかったものは後飛ばしのセンター試験形式でざっと解いたんで、1時間で2週目及び全問解答、1時間20分で3週目の見返しが終わったので、1時間25分ぐらいで提出した。

受験当日、焦ったのだが、身分証明できるものが2つ必要。運転免許証だけだと不十分。社員証は持ち歩かないし、期限の切れた更新前の学生証を提出した。いけた(いいのか?)

PCA合格時の自分のノート

資格は2年で切れることもあって、テスト対策として、こういう問題出たよ、こういう感じだったということを記事にしようと思っていたが、規約で禁止されている。
ただの自慢話になってしまった。

しかし、自分がPCA合格するまでに書き込んだノートはテストとは関係がない。
俺の財産だ

PCA試験を受けるまで

まず一回目のPCAを受けるまではCourseraを受講していました。
うけたコースはこれ

Google Cloud Platform Fundamentals: Core Infrastructure 日本語版

GCP全体を学習する上ではとても役に立った。
特に、インフラ関係は独学で趣味の範囲でしか学習していないので、そのあたりを学ぶ上で大変役に立った
1週間は無料なので、受けて1週間以内で終わらせられれば無料
キャンセルするのを忘れないように
自分はキャンペーンで1ヶ月無料だったから1ヶ月やった
MachineLearning関係など、今回のPCAに向けては必要のない知識も多かった。
Qwiklabsで実際にGCPを触ることができる
が、自主的にこうするとどうなるんだ、どういう画面はどうなっているんだ、という部分がないと全く役に立たないような実践内容だった

改めて考えると、PCAを受ける上ではかなり情報不足な内容だった。
このコースだと特に、k8sに関してはhello-echo(だっけ?)をデプロイするのみだった。
PCA受験に向けて、kuberがどういう構造になっているか把握しないといけなかったり、特にローリングアップデートなど、GKEのベストプラックティスのデプロイ方法の部分をしっかり把握しないと行けないため、PCAに向けたk8sに関する多くの学習時間を用いた。

読んだ本

主に2冊を読んだ。
Google Cloud Platform エンタープライズ設計ガイド /著:小島 仁志 Amazon
GCPの教科書 /著: クラウドエース株式会社 吉積 礼敏・他 Amazon
2冊しか読んでないが、どちらか1つだけで十分だった。それよりはハンズオンなり、実際に手を動かしたり、公式ドキュメントを読んで、ノートにまとめる作業をしたほうが資格に向けては何倍もいい

Google Cloud Platform エンタープライズ設計ガイド Amazon

黄色く、A5サイズと小さい本。電車の中で読むのに最適だった。(そのため、ボロボロになるまで読んだ)
Courseraを受講しながら空き時間等に読んだ、最初の本
入門用には最適。どちらかというとGCPはどういうフレームワークが用意されているかという概念をしっかり説明してくれるという本。
AWSとの比較を交えてGCPのフレームワークを説明してくれている。だからといってAWSのことを知らなくても読めるように書いてある。(DB周りは少し難しかった記憶はあるが)
そのため、クラウドのこと何も知らんって人が読むと、GCPだけでなく、AWSを少しだけ同時に学ぶこともできる。というか、出来た。
クラウドサービスのため、アップデートが早く多く、こういう本ベースだとアップデートに対応できていないという状況がありえるが、2018年発行のこの本でも、しっかり最新のアップデート差分に対応できるような、概念的な書き方をされているイメージだった。
何より図や表が参考になり、現在でもたまに参照する。
Courseraとこの本でいいというイメージある。
ただ、やはりというか、SpannerやGKEなどは、まだまだその特徴がしっかり書かれてはいない点は否めない。とはいえ、他の本に比べて一番多く書かれており、大変参考にはなるが、、、今後、改訂版とか出てくるといいね。絶対買う。
個人的には、後ろの方に機械学習で使う場合の説明がしっかりと乗っているが、前半部分のGCEなど、より基礎的な部分を、実際のGCPの画面のスクリーンショット画像を用いて、どういう構成ができるかみたいな説明が欲しかったなあとは、再読したときに思った。
ちなみにだが、PCAでは機械学習はちょびっとしか出てこない。分析ができるようにして、機械学習による指標を活用できるようにするみたいな、そういう考えができればいい程度。SpeechAPIとかは全く出てこない(と思う)。
データストアの選択フローの図が記載されているが、GCP公式からはページが変わったのか消えたのか、参照できなかった。しかしこのフロー図は絶対必要な知識なので、この本を参考にノートをまとめた。

GCPの教科書 Amazon

1度GCP PCAの試験に落ちて、2度目の受験まで少し期間があったので(再受験規定もあり、2度目は15日、3度目は60日再受験できない等がある)、この本を復習がてら読んだ。
B5サイズで、とても分厚い。電車の中で読むには難しかった。(この頃は緊急事態宣言も有り、在宅勤務にシフトしたことで、布団の中で読んでいたのだが)
内容は入門向けには最適だが、上の「GOOGLE CLOUD PLATFORM エンタープライズ設計ガイド」に比べて今まさにGCPを使いながら勉強する人向け。
実際の画面を用いて説明があったり、Google提供の図を独自の図に置き換えて、わかりやすく説明してくれている。本の大きさも納得。
ただ、Spannerについては1ページ程度しかないみたいな、GCPアーキテクチャの知識では必要な要素も、公式ドキュメントの概要よりも情報が少なかった。とはいえ、わかりやすくは説明してくれてはいた。気になれば公式ドキュメント見てという、正しいは正しい対応だろう。そのため2冊目という点では勉強には使いづらかった。

その他ノートにまとめていたこと

長くなってきたので、一回ここで記事は切る。
別記事でノートの内容を羅列していきたい。
随時更新で

GCP PCA受験ノートまとめ https://auto.meto4d.pgw.jp/blog/?p=85

 72 total views