データサイエンティスト

次世代システム研究室とはGMOインターネットグループの事業領域で力を入れているスタートアップやグループ横断のプロジェクトにおいて、技術支援・開発・解析などを行い、ビジネスの成功を支援する部署です。

主な事業領域
・インターネットインフラ事業(ドメイン、クラウド、決済、EC)
・インターネット広告・メディア事業(SSP、DSP)
・インターネット金融事業(証券、銀行)
・仮想通貨事業(交換所、マイニング)

最新のテクノロジーを常に研究開発し、いち早くビジネスに投入し結果に繋げます。
ポジションの魅力
  1. 世界 No.1 規模の金融データなどを直接扱うことができ、ビッグデータを解析する技術(Hadoop・PySparkなど)を習得できます。
  2. フィンテック、アドテクといった担当する領域のビジネスを学び、最先端の機械学習・深層学習・統計手法などを常に学べます。
    • データサイエンティストに必要と考える3つのスキル(ビジネス理解・データサイエンス・エンジニアリング)を身に着け、一つ以上強みを大きく伸ばせます。
  3. グループCTO直轄の部署であり、技術の選定は現場に一任されているため、最先端の技術を自ら検証・導入することができます。
  4. 全て自社サービスのため、事業部と一緒に自ら課題を設定し解決方法を考え、データサイエンスに基づいた改善サイクルを行うことができます。
  5. 本人の実績と意欲に応じて、チームの重点テーマについて自由に研究開発する業務に挑戦することができます。
  6. アカデミックな分野で活躍してきた博士やエンジニア出身者などでチームが構成され、多様性のあるチームです。
必須の経験
(応募条件)
以下をすべて満たした方
  1. 現在主要なプログラミング言語(Python、Java、C/C++など)でコーディングを行ってきた経験。
  2. 機械学習の実践経験がある、あるいは自主的に学習し代表的な機械学習モデルを理解している。
  3. 学術機関や研究機関もしくは企業の専門部署において、統計解析を駆使してデータを処理した経験。
歓迎する経験
  • 課題解決のために機械学習モデルを作成および精度改善を行い、実際に成果を上げた経験
  • SQL を駆使してデータの抽出・加工・集計を行った経験
  • Python でのたくさんのコーディング経験。PyData (numpy、scipy、pandas、scikit-learn など) の利用経験
  • 主要なプログラミング言語によるアプリケーション開発業務の経験(設計、実装、テスト)
求める人物像
  1. どんなことにも興味をもち、情熱をもって新しい技術、新しい業務にチャレンジできる方。
  2. 一人ひとりでは到底できない大きな成果をチームで目指せる方。
  3. ビジネスの成功のため、自ら課題を見極めて、主体的に解決まで取り組める方。
  4. データや結果を鵜呑みにしないで、常にクリティカルシンキングを行える方。
仕事内容
  1. 事業部と一緒に自ら課題を設定し、どのような理論・解析手法で解決するかを考え、データサイエンスに基づいた改善サイクルを行う。
    • 解析モデルの開発は最新のOSSやライブラリを使って自分達で行います。
  2. 最新の機械学習・解析手法を検証し知見を溜めたり、任命された人がチームの重点テーマについて研究開発を行う。
  • 配属先例
例1)
経験:
前職は日本を代表する研究所で、モデル植物のアミノ酸代謝を研究。数理解析用ウェブツールの作成等も行う。
農学博士。PythonとC言語による数理モデル化、代謝シミュレーション、データ解析、時系列データに基づくネットワーク最適化・推定などを実施。
配属先:
世界 No.1 規模の金融データを扱うプロジェクトにデータサイエンティストとしてアサイン。
データを格納している Hadoop の解析基盤上で Python/PySpark や Tableau などを操り、収益改善のためのデータサイエンス業務を担当。

例2)
経験:
大学院より天体のデータ解析と天体望遠鏡の検出器の開発に従事。人工衛星プロジェクトに関与。 
理学博士。X線などから天体の特徴をモデル化、その特徴を物理パラメータとして定量化し解析。最尤法やカイ二乗検定で有意度を測定。Python利用。
配属先:
新しく立ちあがったDSP(アドテク)の入札モデル開発のプロジェクトにデータサイエンティストリーダーとしてアサイン。
ビジネス目的を深く理解した上でモデル開発・改善などのデータサイエンス業務を進め、Python/PySpark を使った実装やプロジェクト管理も担当。
能力に応じてデータ分析エンジニアとして進むことも、プロジェクトマネージャとしてのキャリアにチャレンジすることもできます。
利用技術
  • 解析手法
    • 機械学習
      アンサンブルモデル(Gradient Boost Tree + LR, Random Forest, ExtraTree , Ada Boost, XGBoost)、PCA、ニューラルネットワーク(MLP)、FP-Growth、Word2Vec、協調フィルタリング、ベイズ推定、HMMモデル(隠れマルコフモデル)
    • 統計分析:
      t検定、カイ二乗検定、F検定、二項検定、コルモゴロフ・スミルノフ検定、シャピロウィルク検定、サンプリング(MCMC,ブートストラップ法など)、分散分析
  • 開発技術/環境
    • Python/PySpark、PyData (numpy、scipy、pandas、scikit-learn など)、Scala、Java
    • Percona Server(MySQL)、Oracle
    • Hadoop/HDFS、Spark、Hive(on Tez)、Sqoop
  • 開発ツール
    • Trello、Atlassian(Jira、Confluence)
    • PyCharm、Jupyter、HUE
    • Tableau
  • 開発手法
    • アジャイル開発(scrumベース)
働く環境開発環境
WindowsのデスクトップPC、ノートPCをご用意。各自の業務内容にあわせて、メモリの増設、デュアルディスプレイ等の対応を行っています。必要に応じてノートPCをMacにすることも可能。
2年に1度、PCを最新の物に切り替え、開発環境の劣化を防いでいます。また、全員に携帯端末を貸与(必要に応じて機種変更可)。
https://recruit.gmo.jp/engineer/env/development/

GMOすごいエンジニア支援制度
エンジニア・クリエイター一人ひとりに「スペシャリスト」として、モチベーション高く技術力向上に励み、優れたサービスの開発に努めていただくことを目的とする、複数の支援プログラムで構成される制度です。データサイエンティストも対象です。
https://recruit.gmo.jp/engineer/env/support_program/

オフィス環境
GMOインターネットのオフィスは、渋谷駅から徒歩3分のセルリアンタワーにあります。
https://recruit.gmo.jp/engineer/env/office/

福利厚生
様々な福利厚生制度を用意し、仲間一人ひとりが安心して業務に集中し、その能力を十分発揮しながら働き続けることができるように、さまざまな仕組みや環境づくりに力を入れています。
https://recruit.gmo.jp/engineer/env/welfare/

社内制度
入社後に、早く当社に馴染んでいただけるよう1年を一つの区切りとして、入社後定期的にフォローアップ研修とヒアリングを実施しています。その他、イベントが多数ございます。
https://recruit.gmo.jp/engineer/env/system/
イベント社内イベント
四半期毎にグループパートナーが一堂に集う全体ミーティングを開催しています。業績報告やグループ各社の状況報告などが行われます。
https://recruit.gmo.jp/engineer/env/event/

技術系イベント
会議スペースやコミュニケーションスペース「GMO Yours」を開放して、大型イベントを定期的に開催しています。
https://recruit.gmo.jp/engineer/support/schedule/
勤務地東京都渋谷区桜丘町26-1 セルリアンタワー(本社)

◆交通 : JR・各線 渋谷駅南口徒歩5分
◆地図 : http://www.gmo.jp/company-profile/outline/
勤務時間10:00~19:00(休憩1時間、実労働時間8時間)
※業務状況により残業有
給与■年収 ※経験・能力等を考慮し、当社規定にて優遇します。
■通勤手当
■昇降給年4回(1月・4月・7月・10月)
応募方法エントリーには、履歴書 (書式自由、pdf 形式、サンプル) および職務経歴書 (書式自由、pdf 形式、サンプル) が必要です。

エントリー