生成AIとは?:人工知能の基本と特徴#

はじめに#

ここまでの記事では、Pythonプログラミングの基礎から応用まで様々なトピックを学んできました。変数、制御構造、データ構造、関数、クラス、ファイル操作など、プログラミングの基本的なスキルを身につけました。

これからは、これらのスキルを活かして、最近話題の「生成AI」を使ったプログラムを作っていきます。生成AIを活用することで、テキスト生成、画像生成、コード補完など、多くの作業を効率化できるようになります。

まずは、生成AIとは何か、その基本的な概念と特徴について理解しましょう。

生成AIとは?#

「生成AI」という言葉は、私たちの日常生活でもよく耳にするようになりました。

人工知能(AI)とは、人間のような知的な行動や判断をコンピュータに行わせる技術のことです。その中でも生成AIは、コンテンツを「生成」できる人工知能のことを指します。テキスト、画像、音声、動画など、様々な種類のコンテンツを作り出すことができます。

代表的な生成AIには以下のようなものがあります。

  • テキスト生成AI:ChatGPT、Gemini、Claude など
  • 画像生成AI:DALL-E、Midjourney、Stable Diffusion など
  • 音声生成AI:Suno AI、VALL-E など
  • 動画生成AI:Runway、Pika など

これらは、与えられた指示(プロンプト)に基づいて、あたかも人間が作成したかのようなコンテンツを生成します。

生成AI Google Gemini#

この学習シリーズでは、Google社が開発した生成AIモデル「Gemini(ジェミニ)」を使ってプログラミングを学んでいきます。

Geminiは最新の生成AIモデルで、以下の特徴があります。

  • テキスト、画像、音声、動画といった複数形式のデータ(マルチモーダル)を扱うことができる
  • 長文や複雑な文脈(コンテキスト)を理解する能力に優れている
  • APIを通じてプログラムから簡単に利用できる
  • 日本語の理解・生成能力が高い

「API」とは、「アプリケーション・プログラミング・インターフェース(Application Programming Interface)」の略で、簡単に言えば、プログラム同士が情報をやり取りするための「窓口」のようなものです。

多くのサービスやアプリケーションは、このAPIを提供しており、私たちは自分のプログラムからAPIを通じて、外部のサービス機能を利用することができます。生成AIを利用する場合も同様で、APIに対して「この文章を要約してください」といった指示(リクエスト)を送ると、AIがその内容に応じた応答を返してくれます。

Geminiには複数のバージョンがありますが、この学習シリーズでは「Gemini 2.0 Flash」を使用します。このモデルは無料で利用できる枠が用意されており、学習用として最適です。

生成AIの利用には、通常、一定の使用上限が設けられています。短時間に多数のリクエストを送ると制限に達してしまう場合があるため、注意が必要です。たとえば、Gemini 2.0 Flashの無料枠では、リクエストは1分あたり最大15件、1日あたり最大1500件までに制限されています(2025年5月時点)。

これらの上限は将来的に変更される可能性もあるため、最新情報は公式ドキュメントをご確認ください。

レート制限  |  Gemini API  |  Google AI for Developers

プログラムから生成AIを使うメリット#

生成AIをプログラムから利用することには、以下のようなメリットがあります。

1. 自動化が可能#

AIとの対話をプログラムに組み込むことで、定型的な処理を自動化できます。例えば、多数の文書を要約するプログラムや、FAQに自動で回答するシステムなどが作れます。

2. カスタマイズの自由度が高い#

ChatGPTのようなWebブラウザ画面ではなく、APIを通じて利用することで、自分のニーズに合わせたカスタマイズが可能です。出力形式の指定や、複数のAI処理の組み合わせなどが自在にできます。

3. 既存のプログラムとの統合#

既存のPythonプログラムにAI機能を追加することができます。例えば、データ分析プログラムに自然言語での質問応答機能を追加するなどが可能です。

4. 一括処理が可能#

多数の入力データに対して一括処理ができます。例えば、数百の製品レビューを一度にAIに分析させるといったことが可能です。

まとめ#

この記事では、生成AIの基本と特徴について学びました。

  • 人工知能(AI) は人間のような知的な行動をコンピュータに行わせる技術
  • 生成AI はテキスト、画像、音声などのコンテンツを生成できるAI
  • API を通じて、プログラムから生成AIを利用することができる
  • プログラムから生成AIを使うと 自動化カスタマイズ が可能になる

次回の記事では、Geminiを使うための準備として、アカウント登録とAPIキーの取得方法について解説します。