サイト内の現在位置
コラム
動画生成AIとは?
サービス例やビジネス活用の可能性を解説
UPDATE : 2024.03.29
動画生成AIとは、ユーザーがテキストや画像などを入力すると、AIが映像や音源を組み合わせ、新たな動画を自動的に生成する技術です。生成AIのなかでも動画生成は、最も難易度が高い分野の一つと言われていました。しかし昨今では、高品質なサービスが発表され大きな話題となっています。本記事では、動画生成AIについて、具体的なサービス例やビジネス活用の可能性も含めわかりやすく解説します。
INDEX
- 動画生成AIとは
- そもそも生成AIとは
- 生成AIができること
- 動画生成AIでできること【動画生成AIサービス例】
- 画像から動画を生成する【Pika Labs、Runway Gen2】
- テキストから動画を生成する【Pika Labs、Runway Gen2】
- 画像と音楽でミュージックビデを生成する【Kaiber】
- ニュース、SNSの投稿などから動画を生成する【GliaCloud】
- 画像からダンス動画を生成する【AIピカソのAIダンス】
- 驚異的なクオリティの動画生成AI
OpenAI社の「Sora」 - 動画生成AIのビジネス活用の可能性
- まとめ
動画生成AIとは
動画生成AIとは、テキストや画像などの入力情報から、AI(人工知能)が映像や音源を組み合わせ、新たな動画を自動生成する技術を指します。従来、動画制作には撮影や編集など、多大な手間とコストを要していました。ところが、動画生成AIによってそうしたプロセスが不要となり、自動的に動画を作成できるようになりました。
動画生成AIは、テキスト生成AIや画像生成AIなど、いわゆる「生成AI」が発展する中で生まれてきた技術です。しかし、動画生成には静止画像よりも格段に複雑なデータ処理が必要とされ、これまで最も難易度が高い分野の一つと言われていました。
そうした中、2023年に米国のランウェイ社がテキストをもとに高品質な動画を生成する「Gen-2」を発表し、大きな話題になりました。続いて2024年2月には、同じく米国のOpenAI社が「Sora」を公開し、最長1分のクオリティの高い動画生成を可能にしたことで、世界中にその驚異的な能力が知れ渡りました。
そもそも生成AIとは
生成AI(Generative AI)とは、さまざまなコンテンツをAIによって生成できる革新的な技術を指します。生成AIはデータから学習したパターンや関係性をもとに、テキスト・画像・音楽・動画など多岐にわたるコンテンツをゼロから新たに生み出せます。専門知識を持たない一般の人でも、生成AIの活用により、比較的容易に本格的なコンテンツを作り出せるようになりました。
2022年11月、OpenAI社がテキスト生成AI「ChatGPT」をリリースし、世界的な注目を集めました。ChatGPTは、自然な会話応答ができるだけでなく、論文やコードの生成も可能で、その高い性能に世界中の人が驚かされました。その後、多くの企業においてもChatGPTを導入し生産性向上に役立てるなど、ビジネスの現場でも活用され始めています。さらに生成AIは進化し続け、テキストだけでなく、画像・音声・動画コンテンツなど、さまざまな分野で実用化されつつあり、利用者も急増しています。
生成AIができること
現在、生成AIはテキスト生成・画像生成・動画生成・音声生成が実用レベルに達しています。ユーザーがテキストなどで生成AIに指示を出すことで、必要なデータが自動的に出力されます。生成AIができることを下表にまとめました。
動画生成AIでできること【動画生成AIサービス例】
ひとくちに「動画生成AI」と言っても、できることや内容については、サービスごとに大きな違いがあります。ここでは各社が提供している動画生成AIサービスについて、具体的にどのようなことができるのかを紹介します。
画像から動画を生成する【Pika Labs、Runway Gen2】
「Pika Labs(ピカラボ)」や「Runway Gen2(ランウェイ ジェンツー)」といったサービスでは、1枚の静止画の画像データから動画を生成できます。これらのサービスでは、あらかじめ用意した静止画像をアップロードするだけで、AIが自動的に数秒程度の動画を生成してくれます。たとえば、風景画像の中にある車が動き出したり、キャラクター画像の表情や手足が動いたりするなど、一つの画像から動きのある動画コンテンツが生み出されます。複数の画像をアップロードすれば、それらを組み合わせてアニメーション動画を生成することも可能です。
テキストから動画を生成する【Pika Labs、Runway Gen2】
前段の「Pika Labs」や「Runway Gen2」では、画像のほかテキストからも動画が生成できます。具体的には、画像のイメージ(たとえば「街を走る赤い車」など)や構図、サイズ比率などの指示をテキスト入力するだけで、指示に沿った動画がAIによって自動生成されます。また、ズームイン・ズームアウトなどカメラの動きを設定したり、動きの強弱を指定したりすることもできます。生成された動画はすぐに確認できるため、もし気に入らなければ指示を変えて再生成も可能。なお、サービスにより動画の品質や使用できる機能、生成できる長さなどが異なっています。
画像と音楽でミュージックビデを生成する【Kaiber】
画像と音源データから自動でミュージックビデオを生成するのは、「Kaiber(カイバー)」というサービス。「Kaiber」は、テキスト入力での動画生成や動画のテイスト変換など、多くの機能を有しますが、特にミュージックビデオ生成に優れています。静止画像と音楽ファイルをアップロードするだけで、AIが魅力的なミュージックビデオを自動生成。編集作業は不要で、あたかもプロの映像クリエイターが手がけたかのような質の高い動画コンテンツがワンクリックで完成します。クオリティが高く、実際にプロのミュージシャンのミュージックビデオ制作にも活用されているそうです。音楽家や映像クリエイターのほか、YouTubeやTikTokなどで動画投稿をする個人ユーザーにも好評です。
ニュース、SNSの投稿などから動画を生成する【GliaCloud】
Web上に公開されたニュース記事やSNSの投稿、さらにはスポーツイベントの結果や統計データなど、さまざまなテキストコンテンツから動画を自動生成できるのが「GliaCloud(グリアクラウド)」です。「GliaCloud」は、ユーザーが該当するWebページのURLを入力するだけで、AIがテキストの内容を解析し、それに応じた動画を自動生成。Webページのテキスト内容に適したナレーションや映像、効果音やBGMまでもが自動で組み合わされた完成度の高い動画コンテンツを作り出します。「GliaCloud」は企業の新商品紹介動画やサービス説明動画の制作など、ビジネスシーンでの活用が見込まれています。
画像からダンス動画を生成する【AIピカソのAIダンス】
AI画像生成アプリの「AIピカソ」は、写真やイラスト画像1枚をアップロードするだけで、そこに映る人物やキャラクターがダンスする動画を自動生成できるユニークな機能「AIダンス」を開発しました。「AIダンス」は、アップロードした画像から人物の画像と姿勢データを抽出し、さまざまなダンスのパターンを自動で組み合わせ、高品質なダンス動画を生成してくれます。ダンスの種類は複数タイプから選択でき、BGMの有無やテンポの調整も可能。ダンスが苦手な人でも自分の写真をアップロードすれば、自分が踊っている動画が簡単に作れます。こうして生成されたダンス動画は、TikTokやYouTubeショートなどの動画投稿サービスにアップロードしたり、SNSでシェアしたりするなどして楽めます。
驚異的なクオリティの動画生成AI
OpenAI社の「Sora」
さまざまな動画生成AIが独自の切り口でサービスを提供する中、本質的な部分での飛躍的なアップデートを遂げたのが、ChatGPTを提供するOpenAI社が開発した「Sora(ソラ)」です。
「Sora」はtext-to-videoというタイプで、指示をテキストで入力すると、テキストの内容に沿って動画を生成します。数秒程度の短い動画しか作れなかった従来の動画生成AIと比べ、最長で1分間の動画生成が可能。また、複数のシーンに渡る動画でも登場人物や空間の一貫性を保ち、物理法則を踏まえた自然な動きを再現できます。「Sora」の登場で、動画生成AIは次なる時代に突入したと言えるでしょう。
しかしその一方で、「Sora」を用いることでフェイク動画が簡単に作れてしまう危険性も指摘されています。偽情報の拡散など、深刻な影響が懸念されているため、2024年3月現在、「Sora」の一般公開は見送られており、特定の専門家のみが利用できる状況にあります。こうした社会的にもたらす影響がある反面、さらなる進化が期待される「Sora」は、今後も注目を集め続けるでしょう。
動画生成AIのビジネス活用の可能性
動画生成AIは、ビジネスの現場でもさまざまな活用が期待されています。これまで動画制作には高額な費用と多大な時間を要していましたが、動画生成AIを活用することで、高品質な動画を低コストかつ短時間で制作できるようになるためです。
動画生成AIを活用すれば、たとえば商品やサービスの魅力を動画で効果的にアピールできるようになります。従来のような大掛かりな制作は不要で、プロモーション動画を容易に作成可能。マーケティングや広告の領域でも、動画生成AIは大きな力を発揮します。ターゲットに合わせた動画広告を臨機応変に制作できれば、訴求力の高いプロモーション活動が可能になるでしょう。
さらに教育現場でも活躍が期待されています。動画生成AIで教材の動画を作成すれば、分かりやすい授業を効率良く行え、生徒の理解を深められます。医療やカスタマーサポートの場面でも、動画を活用した高度な説明ができるでしょう。
一方で、フェイク動画の流通や著作権侵害などリスクへの対策は欠かせません。健全な利用ルールの整備が重要な課題となります。しかし、こうしたリスク対策が整えば、動画生成AIのビジネス活用はますます広がっていくことが期待されています。
まとめ
動画生成AIは、テキストや画像、音源データなどの入力情報から、新たな動画コンテンツを自動的に生成できる革新的な技術です。この技術の発展により、従来に比べ、格段に短時間かつ低コストで動画制作できるようになりました。今後ビジネスの現場でも、動画生成AIが革新的な変革をもたらすでしょう。