オープンAI(OpenAI)は、2015年に設立された非営利の研究機関です。日本では、2022年11月に公開されたChatGPT3によって広く認知されるようになりました。2024年に入ってからも、ChatGPTはバージョンアップされ続け、さらなる進化を遂げています。
本記事では、AIの分野で先頭を走るオープンAIについて、その概要や提供サービス、そして日本における最新の動きなどをご紹介します。企業でのAI活用を検討されている担当者の方々は、ぜひ参考にしていただければと思います。
オープンAI(OpenAI)とは?
オープンAIは、2015年にサム・アルトマン氏を中心として設立された非営利の研究機関です。設立当初は、投資会社の元代表であるサム・アルトマン氏に加え、テスラやXの代表であるイーロン・マスク氏、LinkedInの共同創業者であるリード・ホフマン氏などの著名な人物が共同創業者や出資者として参加し、大きな話題となりました。
オープンAIを設立した目的
オープンAIが設立された目的は、「汎用人工知能が人類すべてに利益をもたらすことを保証すること」です。
汎用人工知能(Artificial General Intelligence:AGI)とは、人間に近い汎用的な知能を持つ人工知能を指します。具体的には、言語や画像など特定の領域に限定されず、多岐にわたる分野で自ら学習し、その能力を応用して柔軟に問題を解決できる人工知能です。
オープンAIの主な歴史
オープンAIの設立から現在までの主な歴史は次のとおりです。
2016年4月 | 強化学習用シミュレーションライブラリ「OpenAI Gym」の提供を開始 |
---|---|
2016年11月 | アメリカのMicrosoft社と提携を発表。オープンAIはMicrosoft社の実験の主要なプラットフォームとして「Microsoft Azure」を採用 |
2016年12月 | AIの一般的知能を研究開発するためのプラットフォーム「Universe」をオープンソースで公開 |
2018年2月 | 共創業者でオープンAIの幹部職を務めていたイーロン・マスク氏が退任 |
2019年3月 | それまで非営利団体であったオープンAIが「利益に上限のある」営利企業であるOpenAI LPを創設 |
2019年11月 | 言語モデルGPT-1を改良したGPT-2を発表。そして翌年6月にはOpenAI APIと併せてGPT-3を公開 |
2021年1月 | テキストによる説明で画像を生成するAI「DALL-E」を公開 |
2021年8月 | 自然言語の記述からプログラムコードを生成するAIモデル「OpenAI Codex」を公開 |
2022年9月 | 多言語の音声・言語認識、音声翻訳、音声区間検出なども可能な音声認識AIモデル「Whisper」を公開 |
2022年11月 | 会話形式でやり取りができる言語モデル「ChatGPT」を公開。6日でユーザー数が100万人を超え、約2か月後には1億人を突破 |
2022年12月 | テキストから3Dオブジェクトを生成するAIシステム「Point-E」をオープンソースとして公開 |
2023年1月 | 提携先であるMicrosoft社が今後数年で100億ドルの投資を行うことを発表 |
2023年11月 | 創業者の一人で最高経営責任者であるサム・アルトマン氏が解任され、4日後に復帰 |
2024年4月 | アジア初の拠点として日本法人を開設 |
2024年5月 | 言語モデルGPT-4を公開 |
2024年6月 | アメリカのApple社が、オープンAIとの提携で、一部のiPhoneにChatGPTを搭載した生成AIシステムを導入すると発表 |
オープンAIの持つ強み
オープンAIが設立当初から注目される大きな理由として、次のような強みが挙げられます。
AI開発に欠かせないプラットフォームの提供
オープンAIは、AI開発に欠かせない複数のプラットフォームを提供しています。具体的には、強化学習用シミュレーションライブラリ「OpenAI Gym」やAIの一般知能を研究開発するためのプラットフォーム「Universe」などです。
当初の目的を果たすべく、オープンAIはAIの研究や開発を推進する旗振り役として重要な役割を果たしているため、AI開発者にとって目の離せない存在となっています。
多様な生成AIの開発
オープンAIといえば、ChatGPTの開発を行っている団体というイメージが強いかもしれません。しかし、オープンAIの歴史でも紹介したように、画像生成AI、音声認識AI、3Dオブジェクト生成AIなど、多様なAIの開発を行っています。
オープンAIが提供するサービス
オープンAIが提供する主なサービスについて、詳しく紹介します。
ChatGPT
2022年11月に公開されたChatGPTは、テキストベースの対話型AIです。公開からわずか6日でユーザー数が100万人を超え、約2ヵ月後には1億人を突破するほどの人気を誇ります。
まるで人間と会話をしているかのような自然な言語処理能力は、2024年5月に公開されたGPT-4oでさらに進化し、回答精度も向上しています。とくに画像読み取り能力が向上しており、たとえばスーパーのレシートを読み込み、購入商品を「生鮮食品」「加工食品」「雑貨」などとカテゴリ分けすることも可能です。
また、音声認識の精度も向上しており、他の生成AIで培った技術がChatGPTの精度向上に大きく貢献しています。
ChatGPTには無料版(登録が必要)と有料版があり、以下のような違いがあります。
無料版 | 有料版 | |
---|---|---|
価格 | 無料 | 20ドル/月 |
利用可能バージョン | GPT-3.5、GPT-4o | GPT-4o、GPT-4、GPT-3.5 |
最大入力文字数 | 約10,000字 | 約25,000字 |
最大回答文字数 | 約2,048字 | 約25,000字 |
画像作成 |
DALL-E
DALL-Eは2021年1月に公開された画像生成AIです。入力したテキストに沿った画像を生成することはもちろん、自身が作成した画像のアレンジや画像の一部分のみの修正、背景の編集など、さまざまな画像生成機能を提供しています。
また、2023年9月には最新バージョンの「DALL-E 3」が公開され、翌10月からは提携先のMicrosoft Bingでも利用可能になりました。
Whisper
Whisperは、2022年9月に公開された音声認識モデルです。インターネット上にある680,000時間におよぶ音声データの学習を基に作成されており、多様な音声データのテキスト化を行えます。また、現状ではそれほど精度が高くないものの、英語から日本語、日本語から英語などの翻訳も可能です。
Whisperは、ChatGPTやDALL-Eのような専用Webサイトからの利用ではなく、公開されているAPIを使ってアプリやソフトに組み込むことで利用します。API経由の利用には1分あたり0.006ドルかかりますが、Google ColaboratoryやGitHubのオープンソース経由であれば無料で利用可能です。
OpenAI Codex
OpenAI Codexは自然言語の記述からプログラムコードを生成するAIモデルです。2024年7月現在、GPT-4oの言語モデルをベースとしており、ChatGPTの無料アカウントを持っていれば、そのまま利用できます。
オープンAIの日本での動き
2023年4月、オープンAIの最高経営責任者、サム・アルトマン氏が来日。さらに5月には再来日し、岸田首相と会談を行い、日本に拠点を設立する意向を伝えました。
そして、翌2024年4月14日、オープンAIはアジア初の拠点として東京にオープンAIジャパンを設立。日本特有のニーズに対応した安全なAI開発や機会の創出を目指し、日本政府や民間企業、研究機関などと協力していくと発表しました。
オープンAIをビジネスに活かすためのポイント
オープンAIが提供するサービスをビジネスに活かすには、まずそれぞれのサービスの特徴や強みを理解し、自社のビジネスにどう活用するかの検討が欠かせません。ここでは、今回紹介したオープンAIのサービスをどうビジネスに活かすべきか、そのポイントについて解説します。
ChatGPTをビジネスに活かすポイント
ChatGPTが得意とするのは、翻訳、要約、ビジネス文書の下書きなどです。GPT-4oになり2023年9月までのデータを利用できるようになったものの、最新データの活用はできないため、情報収集としての利用には向いていません。
具体的なビジネス活用方法としては、海外企業とのやりとりでの文書の翻訳、会議資料や論文などの要約と校正、定型メールの下書きなどによる効率化です。これまで時間をかけて行ってきた定型業務をChatGPTに任せることで、生産性の高い業務に集中する時間の確保が可能になります。
DALL-Eをビジネスに活かすポイント
DALL-Eでは、プレゼン資料のイラスト作成やロゴの作成の効率化が可能です。一旦、作成した画像の一部分を編集することもできるので、よりイメージに近い画像生成が実現します。
ほかにも自社Webサイトのレイアウト、宣伝POPのイメージなどにもDALL・Eが効果を発揮します。ただし、外部に出すものについては、盗用のリスクもあるため、似たような画像がないかどうかの確認は必ず行ってください。
Whisperをビジネスに活かすポイント
Whisperをビジネスに活かすポイントは、会議やセミナー、打ち合わせなどの文字起しです。議事録作成担当者の負担が大幅に軽減されます。
また、文字起こししたものをある程度、整えてChatGPTで要約すればさらに効率化が可能です。ただし、重要な会議の内容をChatGPTで要約するのはセキュリティリスクがあります。そのため、ChatGPTを使う場合は自社開催のセミナーなど外に出ても問題のない場合に限定するのがおすすめです。
OpenAI Codexをビジネスに活かすポイント
OpenAI Codexは多様なプログラミング言語に対応しているうえ、高度なコーディングも可能なため、プログラマーの負担軽減、作業効率向上が可能です。また、エラーチェックも行えることから、デバッグ作業の効率化も実現します。
ChatGPTでもプログラミングは可能です。ただし、OpenAI Codexのほうがより高度なプログラミングができるため、本格的に活用するのであればOpenAI Codexをおすすめします。
オープンAIのサービスを理解してビジネスの効率化、生産性向上を目指そう
オープンAIは、2015年に設立された非営利研究機関としてスタートしました。「汎用人工知能が人類すべてに利益をもたらすことを保証すること」を目的として、多様なAIサービスを提供しています。
オープンAIが提供するサービスをビジネスに活かすには、それぞれのサービスを理解することが重要です。たとえば、「ChatGPTは翻訳や要約、文書のたたき台作成が得意であり、最新の情報収集には向いていない」という特徴を理解しておく必要があります。
Appleと提携したり、日本に拠点を設立したりするなど、新たな展開を続けるオープンAI。常に最新の動向に注視し、自社に合った適切な活用でビジネスの効率化や生産性向上を実現しましょう。