2023/04/07 Spark NLPでTransformerモデルをスケールする HadoopHiveNLPSparktransformersデータサイエンスデータサイエンティストビッグデータ機械学習深層学習
2022/01/11 GCPの次はAWS Lake FormationとGoverned tableを試してみた(Glue Studio&Athenaも) AthenaAWSGlueGlueStudioGoverned tableHadoopHiveLakeFormationPySparkS3Sparkビッグデータ
2021/10/08 β版のDataproc on GKE (Google Kubernetes Engine) でSparkを検証してみた~ついでにBigQueryのコストも調査 Big QueryDataprocDataproc MetastoreGCPGKEGoogle CloudGoogle Kubernetes EngineHadoopkubernetesPySparkSparkビッグデータ
2021/10/02 KubernetesベースのSparkクラスターを検証するーアッドホック分析環境構築編 Big DataConoHaData EngineerDelta LakeHadoopHDFSkubernetesSparkSpark ClusterSparkOperatorビッグデータ
2021/07/07 Google Cloud PlatformでクラウドネイティブなHadoopクラスタを作ってSpark+Delta Lake+BigQueryを試してみた Big QueryDataprocDataproc MetastoreDeltaLakeGCPGoogle CloudHadoopSparkビッグデータ
2021/07/05 KubernetesベースのSparkクラスターを検証するー既存Hadoopクランスターと連携編 Big DataConoHaData EngineerDelta LakeHadoopHDFSkubernetesSparkSpark ClusterSparkOperatorビッグデータ
2021/04/08 ConoHaでHadoop(+Delta Lake)クラスタ再構築 ~Erasure Coding機能を使ってみた ConoHaDeltaLakeHadoopPatroniPostgreSQLSparkビッグデータ
2021/04/06 Conoha VPS上にKubernetesベースのSparkクラスターを検証するー環境構築編 Big DataConoHaData EngineerHadoopkubernetesSparkSpark Clusterビッグデータ