GCPでSparkの代わりにDataflowとBeamSQLを使ってみた

こんにちは。次世代システム研究室のデータストア全般とクラウド(分散処理)を担当している M.K. です。 過去のブログでGCPの分散処理を主にPySparkを使って検証してきました。でもGCPの分散処理はDataflow … 続きを読む GCPでSparkの代わりにDataflowとBeamSQLを使ってみた