2023.04.28

ChatGPT、Stable Diffusionなど生成系AI 人気記事まとめ

いつもGMOインターネットグループ グループ研究開発本部のブログや各種情報発信をご覧いただきありがとうございます。

昨今、ChatGPT、Stable Diffusionなど生成系AIの記事へのアクセスが非常に多く、注目度の高さを感じています。
今回は実際にこの半年(22年11月〜23年4月)でアクセスの多い人気記事をまとめましたので、どうぞ御覧ください。

ちなみに各記事のリード文(要約)はChatGPT4に書いてもらいました。


生成系AI 人気記事


GitHub Copilot にいいコードを書いてもらう方法
https://recruit.gmo.jp/engineer/jisedai/blog/how-to-hack-github-copilot/
ペアプログラマーとしてのAIツール「GitHub Copilot」を使って、NestJSを用いたログイン画面の開発を体験します。作者自身が新しいフレームワークと初めて向き合う様子を通じて、このツールがどのように開発を助け、またどのような点に気を付けるべきかを詳しく解説しています。コメントの書き方の重要性、サジェストの活用法、そしてGitHub Copilotを使った開発の楽しさと注意点についても触れています。さあ、AIとともにコードを書く新たな体験に、一緒に踏み込んでみませんか?全文を読むことで、新たな開発のパートナーが見つかるかもしれません。


ChatGPTの学習データと学習方法が知りたい! 〜Q.埼玉県沖で採れるウニはいくらですか? A.ウニはいくらではない。〜
https://recruit.gmo.jp/engineer/jisedai/blog/chatgpt_please_tell_me_uni_ikura/
人工知能の会話モデルChatGPTについて深く掘り下げています。記事の中では、ChatGPTが自然な会話を生成できる一方で、文脈やバックグラウンド知識を理解するための高度な判断が必要な場合には引っかかることがあると指摘しています。その後、ChatGPTがどのように学習しているのか、そしてOpenAIがそれをどのように設計しているのかについて詳しく解説しています。具体的には、大規模コーパスのトレーニング、人間によるデータの収集とランキング、報酬モデルの作成、そして強化学習の一部であるPPOの使用について説明しています。この記事は、AIとその学習方法について深く理解したい方にとって非常に役立つ情報が詰まっています。


次世代生成モデル、Diffusion Modelの紹介
https://recruit.gmo.jp/engineer/jisedai/blog/diffusion_model/
表形式データに特化したDiffusionモデル(TabDDPM)を用いて生成されたデータについて、検証結果を紹介します。cardioデータセットとadultデータセットを用いて、生成データと元データの比較、特徴量間の関連性の維持について調査しました。全体的にTabDDPMの性能は良いと言えるものの、一部のデータでは特徴量間の関連性が失われることがあり、データ生成後のバリデーションやチェックが必要だという結果が得られました。記事の全文を読んでいただくことで、詳細な検証内容や結果を確認いただけます。


議事録作成の手間を解消?音声ファイルをChatGPTとWhisperで自動要約
https://recruit.gmo.jp/engineer/jisedai/blog/eliminating-meeting-minutes-creation-hassles-automatic-summary-of-audio-files-using-chatgpt-and-whisper/
議事録作成の手間を省くためのOpenAIのChatGPTとWhisperを用いた音声ファイルの自動要約システムの構築方法について紹介しています。記事では、Dockerを用いた環境構築、API設定、音声自動要約アプリの実装、そしてそれらの検証結果について詳しく説明されています。また、WhisperとChatGPTの利用費用や、将来の利用可能性についても言及されています。その詳細を理解するためには、以下の記事全文の読み進めをおすすめします。


Llamaindex を用いた社内文書の ChatGPT QA ツールをチューニングする
https://recruit.gmo.jp/engineer/jisedai/blog/llamaindex-chatgpt-tuning/
ChatGPTとLlamaindexを使用して社内文書のQAツールを構築する過程とその際に遭遇した課題について解説しています。記事は主に、ChatGPTに追加のデータを提供する方法、構築したいQAツール、作成したもの、システム構成、ユースケース、初期のソースコード、Llamaindexの処理フローとチューニング課題、そしていくつかのヒントに分けて説明されています。また、ベクター検索とChatGPT APIの連携を最適化するための有用な技術的詳細も提供しています。全体を通して、ChatGPTと連携したQAツールの開発に興味がある読者にとって、貴重な洞察と解決策が満載の記事です。


最後に人間(筆者)が心を込めてお知らせです


上記のようなAIで社会課題を解決する仲間を募集しています。
データサイエンティストや機械学習エンジニアが集まった組織であるAI研究開発室が2022年から設置されました。金融や広告のほか決済など様々な社会インフラを提供する当社の大量のデータを用いてビジネスゴールを導く仕事がたくさんあります。
こちらのページではその魅力の一部をご紹介しています。ぜひ御覧ください。

また今年も夏期合同インターンシップではデータサイエンス、ブロックチェーン、Web開発と3コースを用意して、IT業界を志す学生の皆さんを対象に広く募集しています。一次募集は今週末の4/30(日)、二次募集が5/31(水)(※早期締切の可能性あり)となっています。ぜひご応募ください。


AI研究開発室


夏期合同インターンシップ



  • Twitter
  • Facebook
  • はてなブックマークに追加

グループ研究開発本部の最新情報をTwitterで配信中です。ぜひフォローください。

 
  • AI研究開発室
  • 大阪研究開発グループ

関連記事