メインコンテンツまでスキップ

🤖 1-2 生成AIのモデル

押さえておきたいポイント
  • 生成AIはテキスト、画像、音声など、様々なアウトプットで生成できる。
  • 各サービスはそれぞれ異なる特徴を持つため、目的に合ったサービスを選択することが重要。
  • ChatGPTは、その使いやすさと汎用性の高さから、世界的に最も有名な生成AIサービス。
  • 日本ではChatGPTとMicrosoft Azureのサービスの認知度が高い一方、米国ではより多様なサービスが利用されている。
覚えておきたい単語

ChatGPT(チャットジーピーティー)

Gemini(日本語読み:ジェミニ)

Azure OpenAI Service(アジュール オープンエーアイ サービス)


生成AIモデルの一例

テキスト生成

※本モデルは2024年10月時点の内容です。

ChatGPT (OpenAI)

OpenAIのモデルには、複雑なタスク処理に優れた高性能モデルのGPT-4o、軽量で高速処理が可能な手頃なモデルのGPT-4o mini、そして強化学習によって高度な推論能力を備えたo1-preview / o1-miniがあります。HPからアカウントを発行することで利用することができます。
OpenAI公式HP


Gemini (Google)

数学や推論能力、長文の文脈理解、画像の理解などあらゆる性能が向上したGemini 1.5 Pro 002などのモデルがあります。Googleアカウントをお持ちの方はGoogleAIStudioからログインして利用することができます。
Google AI Studio


Claude (Anthropic)

Claude 3には「Opus」「Sonnet」「Haiku」と呼ばれる3つのモデルがあり、Sonnetは無料で利用可能です。最新モデルとして、Claude 3.5 SonnetClaude Haiku 3.5があります。アカウント作成をClaudeの公式HPから行うことで利用できます。
Claude公式HP


Llama (Meta)

Metaが開発した高性能な大規模言語モデルで、Llama3.2などのモデルがあります。オープンソース化されており、自分のパソコンにLLMをダウンロードして環境を整えた上で利用できますが、利用には少し技術的なハードルがあります。
Llama3.2

LLMの性能ってどれがいいの?
  • LLMの性能を比較し評価するためのオープンなプラットフォームChatBot Arenaが生成AI業界では有名です。
  • Chatbot Arena LLM Leaderboardより現在のLLMのランキングが確認できます。
備考

モデルが多すぎてどれがいいのかわからない、とお困りの方。スマートフォンにいろんな機種があるように、LLMにも性能が異なるモデルが色々あるとイメージしていただくのがいいかと思います。

ChatGPTは、より大衆向けに使いやすく、機能も充実している傾向にあります。

Geminiは、LLMが記憶できる文章量がとても多いので、長時間にわたっていろんな会話を継続することができます。

Claudeは、コード生成の正確性が高く、エンジニアから高い評価を得ています。さらに、日本語も流暢であるため、国内でも人気のLLMです。

Llamaは、自分の環境下で動作させることができるため、セキュアな状態でLLMを活用できる点がメリットであり、教材にもよく利用されています。

画像生成

  • DALL·E (OpenAI): テキストから画像を生成するAI。指示に基づいて、高品質でクリエイティブな画像を生成できます。
  • Stable Diffusion: オープンソースの画像生成AI。高品質な画像生成だけでなく、画像編集やスタイル変換なども可能です。
  • Flux.1 AI: X(旧:Twitter)で話題となったオープンソースの画像生成AI。リアルな画像が話題な高品質な画像生成ができます。

音声

  • Advanced Voice Mode (OpenAI): 高精度な音声認識AI。音声のテキスト化、翻訳などに活用できます。

開発環境

  • Azure OpenAI Service (Microsoft): Microsoft Azure上でOpenAIのモデルを利用できるサービス。エンタープライズレベルの高いセキュリティ、信頼性、スケーラビリティが求められる企業に最適です。
  • Vertex AI (Google Cloud): Google CloudのAIプラットフォーム。機械学習モデルの構築、トレーニング、デプロイなど、AI開発に必要な機能を提供します。
  • Copilot Studio (Microsoft): 対話型AIを利用した開発環境。AIがコード生成、デバッグ、テストなどを支援してくれます。

ChatGPTが有名な理由とは?

ChatGPTは、2022年11月の公開以降、瞬く間に世界中で有名になりました。その理由は、まるで人間と会話しているかのような自然な会話能力にあります。質問応答、文章生成、翻訳、要約など、幅広いタスクをこなすことができ、その汎用性の高さも人気の秘訣です。さらに、基本的な機能は無料で利用できるため、多くの人が気軽に試すことができたことも、爆発的な普及を後押ししました。


国内での生成AIサービス認知度

PwCの「生成AIに関する実態調査2024 春 米国との比較」レポート*によると、生成AIサービスの認知度は国内でChatGPT/ChatGPT Enterpriseの認知度が54%と最も高く、GPT-3.5/4が44%、Azure OpenAI Serviceが39%、これ以外のその他のサービスの認知度は32%以下で日本はChatGPTやAzure関連サービスに認知度が偏っていることがわかっています。

国内生成AIサービス認知度

一方、米国ではChatGPT/ChatGPT Enterpriseが79%、GPT-3.5/4が56%、Azure OpenAI Serviceが61%、Capilotが59%、Google Bard(Geminiに名称変更)が58%、Geminiが51%といずれも日本より高い認知度で、これ以外のその他のサービスの認知度も相対的に高く、米国が比較的積極的な生成AI活用を検討している可能性を示唆しています。

米国生成AIサービス認知度

このように、生成AIサービスの認知度や利用状況は、国や地域によって大きく異なることが分かります。生成AIを自社で活用するためには、それぞれのサービスの特徴やメリット・デメリットを理解し、自社のニーズに合ったサービスを選択することが重要です。次の章では、生成AIサービスの選定基準について、ご説明します。

*出典:pwc "生成AIに関する実態調査2024 春 米国との比較" https://www.pwc.com/jp/ja/knowledge/thoughtleadership/2024/assets/pdf/generative-ai-survey2024-us-comparison.pdf (参照:2024-10-31)