データサイエンティスト(情報系博士)

グループ研究開発本部/AI研究開発室とは グループ研究開発本部は、GMOインターネットグループの事業領域で力を入れているスタートアップやグループ横断のプロジェクトにおいて、技術支援・開発・解析などを行い、ビジネスの成功を支援する部署です。

その中にAI研究開発室があり、データ解析やAIに関する支援を行っています。また、最新のテクノロジーを常に研究開発し、いち早くビジネスに投入し結果に繋げます。
AI研究開発室について:
https://recruit.gmo.jp/engineer/jisedai/ai/

GMOインターネットグループの主な事業領域
・インターネットインフラ事業(ドメイン、ホスティング/クラウド、アクセス、決済、EC支援、セキュリティ)
・インターネット広告・メディア事業(メディア、アドテク、クーポン・ポイント)
・インターネット金融事業(証券、銀行)
・暗号資産(仮想通貨)事業(交換所、マイニング、NFT)
業務内容 【プロジェクト業務】
東京大学医科学研究所様との老化細胞の共同研究のプロジェクトに参加していただきます。

・バイオインフォマティクス(ドライ解析)でホットなシングルセル解析の分野において、今もっとも注目されている研究の1つである「老化細胞」の最先端の研究
・最新の生成AIの基盤モデル(Foundation Model)や様々な機械学習を応用し、且つデータやAIモデルの本質を深く掘り下げて、老化細胞の遺伝子に関するメカニズムを解き明かす研究

プレスリリース:
https://www.gmo.jp/ir_news/article/732/
https://www.gmo.jp/news/article/8598/

また、AI研究開発室ではビジネスの様々なプロジェクトも行っており、共同研究をやりながらもしくはその後に他のプロジェクトに参加して、実績に応じて希望のキャリアを積むことが可能です。

フィンテック(Fintech)のプロジェクト
GMOインターネットグループが展開する金融サービスの本質を理解し、数理モデルや機械学習などのデータサイエンス技術を駆使しながら、予測が難しい金融データをうまく扱って収益を改善させます。

アドテク(Adtech)のプロジェクト
インターネット広告の主な仕組みの一つであるRTB(リアルタイム入札)において、広告出稿する側の費用対効果を最適化するDSP(Demand-Side Platform)の機械学習モデルの設計開発、効果測定などをメインに行います。

アプリのプロジェクト
フリーWiFi接続を容易にするアプリの新機能や施策の効果測定を因果推論の技術を駆使して行い、データドリブンに経営判断するための仕組みを整えて、サービスのKPIを改善させます。

その他のプロジェクト
暗号資産取引、不正検知などに関して、データ解析や機械学習の技術を応用して支援します。

【研究開発業務】
・プロジェクト業務を行いながら、一定の時間、全員で最先端の機械学習手法や新たな機械学習の応用を研究します。
・さらに四半期ごとに選任されたメンバーは重点的に研究開発を行います。
ポジションの魅力 ・生物学の最先端の1つである老化細胞と、最先端のAI技術を駆使する非常にチャレンジングな研究に関わることができ、人類の未知のメカニズム解明に貢献できます
・最先端の機械学習・深層学習・統計手法などを常に学べます
・重要な3つのスキル(課題解決・データサイエンス・エンジニアリング)を身につけ、一つ以上強みを大きく伸ばせます
・別のプロジェクトを担当する部署のデータサイエンティストと勉強会などで交流する機会も多く、データサイエンススキルを高められます
・グループCTO直轄の部署であり、技術の選定は現場に一任されているため、最先端の技術を自ら検証・導入することができます
・本人の実績と意欲に応じて、チームの重点テーマについて自由に研究開発する業務に挑戦することができます


また、老化細胞の共同研究以外のプロジェクトに関わる場合は以下の魅力があります。
・GMOインターネットグループの多岐に渡るサービスについて、データ解析およびAI技術によって様々な課題を解決するプロジェクトをゼロから立ち上げる機会があります
・世界 No.1 規模の金融データや、数百テラバイト規模のアドテクデータなど様々な領域のデータを直接扱うことができ、ビッグデータを解析する技術(BigQuery・PySparkなど)も習得できます
・時系列データ、ユーザー行動データ、記事といった様々な種類のデータを解析することができます
・全て自社サービスのため、事業部と一緒に自ら課題を設定し解決方法を考え、データサイエンスに基づいた改善サイクルを行うことができます
・アカデミックな分野で活躍してきた博士やエンジニア出身者などでチームが構成され、多様性のあるチームです
必須の経験(応募条件) 以下をすべて満たした方
  1. 機械学習や深層学習の理論に触れる研究の経験がある
    特に深層学習、生成AIの理論の深い知識
  2. 情報系の博士号を取得している
  3. 一通りの機械学習・深層学習の知識がある
  4. Pythonが書ける
歓迎する経験
  • 実際にプロダクトもしくは研究で機械学習/深層学習を活用して実績を出した経験がある
求める人物像
  1. 手法ありきではなく、ビジネス課題解決のためにあらゆるアプローチを考えて最適なやり方を見出すことが好きな方
  2. どんなことにも興味をもち、情熱をもって新しい技術、新しい業務にチャレンジできる方
  3. 一人では到底できない大きな成果をチームで目指せる方
  4. データや結果を鵜呑みにしないで、常にクリティカルシンキングを行える方
配属先例 例1)
経験:
大学院で光工学の分野を専攻。新卒で大手コンサルティングファームに入社し、様々な業界のクライアントのデータ活用を推進するプロジェクトでBIツール・機械学習モデルの設計・開発を行う。
配属先:
スマホアプリを運営するグループ会社のデータ活用推進プロジェクトにアサイン。バックエンドに蓄積されるビックデータを対象に、施策立案のためのデータマイニングから、ABテスト/効果測定のための統計検定および統計的因果推論まで、ビジネス施策の全フェーズをデータドリブンにしていき売上向上に貢献。Python/SQL/各種BIの利用や、分析のコンテナツール化などを実施。

例2)
経験:
前職は日本を代表する研究所で、モデル植物のアミノ酸代謝を研究。数理解析用ウェブツールの作成等も行う。
農学博士。PythonとC言語による数理モデル化、代謝シミュレーション、データ解析、時系列データに基づくネットワーク最適化・推定などを実施。
配属先:
世界No.1規模の金融データを扱うプロジェクトにデータサイエンティストとしてアサイン。
データを格納しているHadoopの解析基盤上でPython/PySparkやTableauなどを操り、収益改善のためのデータサイエンス業務を担当。

・能力に応じてデータ分析エンジニアとして進むことも、プロジェクトマネージャとしてのキャリアにチャレンジすることもできます。
利用技術
  • 解析手法
    • 機械学習:
      Transformer系(大規模言語モデル他)、グラフニューラルネットワーク(GNN)、多層パーセプトロン(MLP)、アンサンブル学習/勾配ブースティング(Gradient Boost Tree + LR, Random Forest, ExtraTree , Ada Boost, XGBoost, LightGBM)、PCA、FP-Growth、Word2Vec、Doc2Vec、協調フィルタリング、ベイズ推定、HMMモデル(隠れマルコフモデル)
    • 統計分析:
      t検定、カイ二乗検定、F検定、二項検定、コルモゴロフ・スミルノフ検定、シャピロウィルク検定、サンプリング(MCMC,ブートストラップ法など)、分散分析、因果推論(差分の差分法など)
  • 開発技術/環境
    • プログラミング/フレームワーク:
      Python、PyData(numpy、scipy、pandasなど)、Streamlit
      PyTorch、TensorFlow、LangChain、Spark(PySpark)
    • クラウド/オンプレ(ミドルウェア):
      SHIROKANE
      GPUワークステーション
      Google Cloud(GCS、BigQuery、VertexAI、Dataflowなど)
      AWS(S3、Athena、EMR/Serverless、StepFunction、SageMaker、Bedrockなど)
      MySQL、MariaDB、Percona Server、PostgreSQL、Galera Cluster、Oracle、Hive、Hadoop/HDFS
      ConoHa(GPUサーバー)
    • 大規模言語モデル(LLM)関連:
      OpenAI API、Llama3、LangChain、HuggingFace
働く環境 ローカルマシンはWindows、Macの用意があります。また、研究専用のGPUワークステーションや東大医科学研究所様のスパコンのSHIROKANEを利用します。共同研究以外のプロジェクトの場合はクラウドもよく利用します。
2年に1度、ローカルマシンを最新の物に切り替え、開発環境の劣化を防いでいます。また、全員に携帯端末を貸与しています(必要に応じて機種変更可)。

チーム体制
チームを組んで2名以上で研究またはプロジェクト業務をしていただきます。また、同じチームの仲間だけでなく、グループ研究開発本部の他のプロジェクトをやっているデータサイエンティストやエンジニアの仲間とも交流しますので、成長できる環境です。

GMOすごいエンジニア支援制度
エンジニア・クリエイター一人ひとりに「スペシャリスト」として、モチベーション高く技術力向上に励み、優れたサービスの開発に努めていただくことを目的とする、複数の支援プログラムで構成される制度です。
https://www.gmo.jp/csr/partners/engineer/

オフィス環境
当社の本社オフィスは渋谷駅前のセルリアンタワー、および渋谷フクラスです。
https://recruit.gmo.jp/office/

福利厚生
様々な福利厚生制度を用意し、仲間一人ひとりが安心して業務に集中し、その能力を十分発揮しながら働き続けることができるように、さまざまな仕組みや環境づくりに力を入れています。
https://recruit.gmo.jp/welfare/

社内制度
入社後に、早く当社に馴染んでいただけるよう1年を一つの区切りとして、入社後定期的にフォローアップ研修とヒアリングを実施しています。その他、イベントが多数ございます。
https://recruit.gmo.jp/training/
イベント 社内イベント
四半期毎にグループパートナーが一堂に集う全体ミーティングを開催しています。業績報告やグループ各社の状況報告などが行われます。
https://recruit.gmo.jp/event/

技術系イベント
テックカンファレンスや技術勉強会など開発者向けイベントを自社開催するほか、開発者コミュニティへの協賛など行っています。
https://developers.gmo.jp/event
勤務地 ◆交通 : 渋谷 JR・各線 渋谷駅西口徒歩5分
◆地図 : https://www.gmo.jp/company-profile/outline/
◆オフィスの様子 : https://recruit.gmo.jp/office/
勤務時間 10:00~19:00(休憩1時間、実労働時間8時間)
※業務状況により残業有
給与 ■年収 900万~1100万 ※スキル・経験・ポテンシャル・実績などを考慮し、当社規定にて優遇します。
■通勤手当
■昇降給年4回(1月・4月・7月・10月)
応募方法 エントリーには、履歴書 (書式自由、pdf 形式、サンプル) および職務経歴書 (書式自由、pdf 形式、サンプル) が必要です。

エントリー