インターンシップ事例紹介
こんにちは。次世代システム研究室のT.M.です。
次世代システム研究室では、Joint Lab というインターンシッププログラムを通年で実施しています。
このインターンシッププログラムでは、80 時間から150 時間をかけて、学生さんに技術を学び、会社で働くという経験をしていただいています。
今回は8月中旬から3週間ほど参加した学生さんのインターンシップの事例を紹介したいと思います。
1. インターンシップに参加してくれた学生さんについて
地方在住の情報系修士1年の女性でした。Joint Lab のインターンシッププログラムでは、報酬および交通費は支給されるのですが、地方の方の宿泊費に関しては支給されません。
エントリーの際、その旨を伝えたところ、「ホテル住まいしてでも、Joint Lab のインターンシップに参加したい」という、熱意あるお返事をいただきました。
2. インターンシップカリキュラム
カリキュラムは学生さんの要望および次世代システム研究室が提供できるリソースをもとに決めています。彼女の要望は実際のサービスに関するBigData の解析であり、次世代システム研究室には、Hadoop に関するノウハウおよびBigData とはいえませんが、大規模Eコーマスサイトのアクセスログを所有していたため、彼女のカリキュラムはHadoop を利用したGMOとくとくショップのアクセスログ解析に決定しました。
3. 具体的な取り組み内容
彼女にはインターンシップ期間中、自由に使えるGMOアプリクラウドのインスタンス7台を用意しました。その上にCDH をインストールして、MapReduce、Hive、Impara、Mahout を勉強していただきました。
それぞれの概要や使い方を理解した後、実際のアクセスログをHive、Impala を利用してデータ取得し、解析。
彼女はHadoop の利用は初めてで、SQL もあまり得意でないと言っていましたが、熱心に勉強に取り組み、試行錯誤した結果、アクセスログ解析のアウトプットを出していただきました。
4. まとめ
3週間という短い期間ですが、Hadoop を利用したことがない人が、実際のサービスデータを解析し、アウトプットを出すという、すばらしい結果を残していただけました。彼女のブログを御覧頂いて、インターンシップを体験した学生さんの生の声をお聞き下さい。Joint Lab のインターンシップは通年で募集していますので、興味のある学生さんは是非ご応募ください。