対話型AI「ChatGPT」がリリースされてから、生成系AIは業務効率化を図るために広く活用され始めています。
企業でも生産性や効率化を図るために、生成系AIを活用し始めてきており、伊藤園のCMでのAIタレント起用や、auの3太郎CMのAIアニメーション生成などが有名です。
そんな中、ChatGPTなどのAIの研究・開発をしているOpenAIは2024年2月15日 に「Sora」という動画生成AIを発表しました。
Soraについてはまだ情報が少なく、活用方法や存在自体知らない人も増えているのではないでしょうか?
今回の記事ではOpen AI社の最新AIモデル「Sora」の概要についてご紹介いたします。
パート1:OpenAI Soraとは
OpenAI Soraとは、動画の生成に特化したAIです。
まだ一般公開されておらず、アーティストやデザイナー、専門家などの一部の人だけが利用できる状況です。
そのため、詳細な使い方など不明な部分が多いですが、以下の動画生成をすることができます。
- テキストから動画を生成
- 画像や既存の動画をアップロードし、取り込んだ画像から動画を生成
- 既存の動画の続きを生成
Soraの主要な特長:
- キャラクターの作成
テキストから動画を生成することができるため、キャラクターコンセプトや特徴を入力するだけでオリジナルキャラクターを創ることが可能です。
また、特定の動作をテキスト入力しておけば、キャラクターに動きをつけることもできます。 - 複数のキャラクターや背景の生成
画像をもとに動画生成ができるため、オリジナルキャラクターの画像をアップロードし、アニメーションを生成することができます。
そのため、複数のキャラクターの画像をアップロードし、想定の動作をテキスト入力することで、キャラクターを思い通りに動かすことができるでしょう。 - リアルさ
キャラクターだけでなく、人物描写をテキスト入力すれば実際にカメラで撮影したような動画を生成することができます。
例えば、「桜並木を二人の男女が歩いているシーン」などのテキストを入力すれば、ドローンで上から撮影したような動画を生成することも可能です。 - 動画の一貫性
カットが変わっても、キャラクターの動きが突然変わることはありません。シーンに応じてつながりのある動作をするため、違和感のない動画を作成できます。
エンターテイメント以外の活用方法
Soraを活用することで、自分が想像した通りの動画を作成するだけでなく、様々な分野での活用も見込めます。
- 教育分野
子供が好きなキャラクターが先生となり、教えてくれる動画の生成。
一人ひとりに合わせた教育が行えるようになり、飽きることなく、勉強できるでしょう。 - マーケティング
ターゲットに合わせた動画広告の生成。
ゆくゆくは一人一人に合わせた広告を作成することも現実味を帯びてきます。 - 製品開発
実際にプログラムを書き始める前に、製品の概念やコンセプト、デザインなどを視覚化することができます。
パート2:Sora AIはいつリリースされるのか?
Soraのリリース日はまだ確定していません。
OpenAIのレッドチーム(AIの問題点を研究するチーム)が、安全に使用できる措置を模索中です。画像生成AIの創成期にもディープフェイクの画像が悪用されるケースが多々ありました。
アーティスト目線で考えれば、可能な限り自由にクリエイティブを作りたいため、制限しすぎるとAIの柔軟性が失われます。
現在、どんなツールであれば役立つか、どの程度の柔軟性があれば良いのかを検討するために、限られたクリエイターに先行して公開している状況の様です。
なお、現時点で公開されている情報は下記です。
- リリース日
明確なリリース日は発表されていません。 - 限定公開
一部の研究者、クリエイターは先行して利用しています。 - 現在の開発の焦点
動画生成AI「Sora」が悪用されない様な設計を検討中。
パート3:OpenAI Soraの強み弱み
前述したように、OpenAI「Sora」はテキストや画像から動画を作成することが可能です。
しかしどのようなツールにも強みや弱みがあります。
「Sora」の強み
- 世界観の理解
複数のキャラクターや複雑な描写を表したテキストでも、ChatGPTモデルによって世界観を理解します。 - 感情表現
キャラクターの感情も言葉のニュアンスの違いによって把握します。
それを動画に反映させることで、魅力的なキャラクターを生み出します。 - 内容の繋がり
カットが変わっても話の内容が変わってしまうことはありません。
映画やCMのように視点が変わるだけで、違和感のない動画が作成されます。
「Sora」の弱み
- 物理シミュレート
物理的な相互作用がまだシュミレートできていない模様です。公式サイトに挙げられている動画をみると、何も無い場所から物が出現したり、何もしていないのにガラスが割れるといったこともあります。 - 因果関係
特定の行動に対しもたらされる結果が、現実とは乖離するパターンもいくつか見受けられます。非論理的な結果に繋がっている動画もあり、因果関係の部分にも違和感が生まれます。 - 空間把握
雲の上で本を読む人の動画や、バスケットボールの動画をみると、キャラクターがどこにいるか分かりづらかったり、ボールとネットの位置に違和感を覚えます。
物体の位置関係に関しても、まだ改善が必要そうです。
OpenAI「Sora」はまだ開発初期段階のため、まだまだ改善途上です。
様々なモデルを学習し、成長することで、上記の問題も改善されていくでしょう。課題は残っていますがSoraが今後活用されていく未来は否定できません。
パート4:OpenAI Soraは無料で使えますか?
前述しましたが、まだSoraは一般公開はされていません。
まだ一部の専門家やクリエイターのみが試験運用をしている状況です。
なぜ試験運用をしているのか?
- OpenAIは制限の範囲を確認するために試験運用をしています。
- 今後一般公開した場合に、全員がスムーズに使えるためにサーバー負荷なども確認中とのことです。
もし、早く動画生成AIを使ってみたいという方は、一部無料ツールがあるので、他社の動画生成AIを使ってみるのもいいかもしれません。
パート5:OpenAI Soraの使い方
Open AI「Sora」を使用する際には、入力するテキストが重要になります。
最終的に伝わる内容は同じでも、言葉の順序などによって異なる動画が生成されるためです。既存の動画生成AIでも同様の現象が見られるため、Soraでも同様の現象が起きることは十分に考えられます。
下記に入力するテキストの内容(プロンプト)の例をいくつか紹介いたします。
- キャラクター作成
プロンプト:「CDのジャケット写真に使えるような決意した表情のキャラクターを作成してください。」
プロンプト:「子供が好きそうな個性のあるキャラクターを作成してください。」 - 風景描写
プロンプト:「気持ちが落ち着くBGMに合う、山脈から除く夕日の動画を作成してください。」
プロンプト:「様々な人が行き交う都市風景を作成してください。」 - 感情表現
プロンプト:「身振り手振りで喜びを表現するキャラクターを作成してください。」
プロンプト:「憂鬱な感情を持つ人が醸し出す、厳粛な雰囲気の動画を作成してください。」 - ダイナミックな動き
プロンプト:「優雅なダンスをする人物をアニメーション化してください。」
プロンプト:「サッカーをするために特化した身体機能を持つキャラクターアニメーションを作成してください。」 - 物語
プロンプト:「絶対絶命の危機から勝利するシーンを作成してください。」
プロンプト:「時間の経過とともに成長していく、人の一生を描いた動画を作成してください。
上記は動画生成する際の一例ですので、自分が作りたい動画によって内容を変えて動画生成をお試しください。
よくある質問
アップロードした動画から、さらに動画を作ることは可能ですか?
現時点ではテキストからビデオを生成する機能に注力されている模様です。
将来的には短編動画とその後のストーリーをテキストで入力することで、動画の時間を伸ばすことも可能になるかもしれません。
対応しているファイル形式はありますか?
一般的なテキストファイル(.txt、.docx、.pdfなど)に対応する模様です。
入力される内容が明確であるほど、生成される動画の質も高くなります。
作成されたコンテンツの著作権はどうなりますか?
現状はまだ明確になっていない模様です。
今後のリリースに向けて、利用規約等も定めている段階です。倫理的かつ著作権法を遵守し活用していくことが求められます。
まとめ
この記事ではOpenAI「Sora」についてご紹介いたしました。
動画生成AIは様々ありますが、既存のものよりもリアルな動画を作成できる模様です。まだ一般公開はされてなく、リリース時期も未定ですが、Soraに対する市場の期待は高まっています。
課題はいくつか存在しているため、学習中ですが事前に情報を集めて置き、プロンプトの練習をしておくことで活用もしやすくなるでしょう。
WPS Officeを使えば、試したいプロンプトをWPS Office Writerで作成したり、WPS Office Presentationで動画を残しておくことができます。
動画生成の活用の際にぜひご利用ください。