Wan2.1入門|Alibabaのオープンソース動画生成AIを初心者向けに解説
「テキストを入力するだけで動画が作れたらいいな」と思ったことはありませんか?2025年2月、AlibabaがリリースしたWan2.1は、そんな夢を現実にするオープンソースの動画生成AIです。
これまで動画生成AIというと、高価なGPUが必要だったり、商用サービスの利用制限があったりと、初心者にはハードルが高いものでした。しかしWan2.1は消費者向けのGPU(RTX 4090など)で動作し、しかも完全無料で使えます。
この記事では、プログラミング未経験の方でもわかるよう、Wan2.1の基本から使い方まで丁寧に解説します。
Wan2.1とは何か?基本を理解しよう
動画生成AIの仕組み
まず、「動画生成AI」という言葉を聞きなれない方のために、基本的な仕組みを説明します。
動画生成AIは、テキスト(文字)や画像を入力すると、それに合わせた動画を自動的に作成する技術です。例えば「猫が庭で遊んでいる様子」と入力すれば、そのシーンの動画が生成されます。
従来の動画制作には、撮影機材、編集ソフト、そして多くの時間とスキルが必要でした。しかし動画生成AIを使えば、誰でも数分でオリジナルの動画を作れるようになります。
Wan2.1の特徴
Wan2.1は、中国のテクノロジー大手Alibaba(アリババ)が開発した動画生成AIです。2025年2月にオープンソースとして公開され、世界中の開発者やクリエイターから注目を集めています。
主な特徴は以下の通りです:
- オープンソース: 誰でも無料で使える
- 消費者向けGPU対応: RTX 4090などの一般的なGPUで動作
- 多機能: テキストから動画、画像から動画、動画編集など
- 日英テキスト生成: 中国語と英語のテキストを動画内に生成可能
- 高品質: 既存のオープンソースモデルを上回る性能
Wan2.1でできること:5つの主要機能
1. テキストから動画生成(Text-to-Video)
「夕焼けの海辺を歩く女性」といったテキストを入力するだけで、それに合わせた動画が生成されます。プロンプト(指示文)の書き方次第で、様々なシーンを作成可能です。
2. 画像から動画生成(Image-to-Video)
既存の写真やイラストを元に、そこから動きのある動画を生成できます。例えば、静止画のポートレート写真から、人物が微笑んだり瞬きしたりする動画を作れます。
3. 動画編集(Video Editing)
既存の動画を加工・編集することも可能です。背景の変更、色調の調整、エフェクトの追加など、クリエイティブな編集ができます。
4. テキストから画像生成(Text-to-Image)
動画だけでなく、静止画の生成も可能です。イラストや写真のような画像をテキストから作成できます。
5. 動画から音声生成(Video-to-Audio)
動画に合わせた音声や効果音を自動生成する機能もあります。これにより、音のない映像に適切なサウンドを追加できます。
必要なスペック:自分のパソコンで動く?
Wan2.1を動かすために必要なパソコンのスペックについて説明します。
推奨スペック
| 項目 | 最低要件 | 推奨要件 |
|---|---|---|
| GPU | RTX 3060 (12GB) | RTX 4090 (24GB) |
| メモリ | 16GB | 32GB以上 |
| ストレージ | 50GB空き | 100GB以上空き |
| OS | Linux/Windows | Linux |
モデルによる違い
Wan2.1には2つのモデルサイズがあります:
- 1.3Bモデル: 軽量版。8.19GBのVRAMで動作。RTX 4090で5秒の480P動画を約4分で生成
- 14Bモデル: 高品質版。より高性能だが、高いスペックが必要
初心者はまず1.3Bモデルから始めるのがおすすめです。
Wan2.1の使い方:初心者向けステップガイド
ステップ1:環境の準備
Wan2.1を使うには、Pythonというプログラミング言語の環境が必要です。以下の手順で準備します:
ステップ2:Wan2.1のダウンロード
GitHubからWan2.1のコードをダウンロードします:
git clone https://github.com/Wan-Video/Wan2.1.git
cd Wan2.1
pip install -r requirements.txt
ステップ3:モデルのダウンロード
Hugging FaceまたはModelScopeからモデルをダウンロードします。1.3Bモデルは約10GB程度です。
ステップ4:動画の生成
以下のコマンドで動画を生成できます:
python generate.py --prompt "猫が庭で遊んでいる" --output video.mp4
他の動画生成AIとの比較
Wan2.1を他の主要な動画生成AIと比較してみましょう。
Wan2.1 vs Sora vs Runway 比較表
| 項目 | Wan2.1 | Sora (OpenAI) | Runway Gen-3 |
|---|---|---|---|
| 価格 | 無料 | 有料(要契約) | 有料(月額制) |
| ローカル実行 | 可能 | 不可 | 不可 |
| 必要GPU | RTX 3060以上 | クラウドのみ | クラウドのみ |
| 動画の長さ | 最大60秒 | 最大60秒 | 最大10秒 |
| 解像度 | 480P/720P | 1080P | 1080P |
| 日本語対応 | 一部対応 | 対応 | 一部対応 |
| 商用利用 | 可能 | 要確認 | プランによる |
| オープンソース | はい | いいえ | いいえ |
独自分析:Wan2.1の強みと弱み
強み:
弱み:
Wan2.1の応用例:どんなことに使える?
クリエイティブ分野
- SNS動画の制作: YouTube、TikTok、Instagramなどで使う短尺動画
- プレゼンテーション資料: ビジネスシーンでの説明動画
- アート作品: 実験的な映像表現
教育・学習分野
- 教材動画: 歴史的なシーンや科学現象の可視化
- 言語学習: シチュエーション別の会話動画
- スキル習得: 手順の説明動画
ビジネス分野
- 商品紹介: ECサイト用の製品デモ動画
- マーケティング: 広告やプロモーション動画
- 社内研修: 業務手順の説明動画
VACE:動画作成と編集の統合モデル
Wan2.1には、2025年5月に追加されたVACE(Video Creation and Editing)という統合モデルがあります。
VACEでできること
VACEは「動画の作成」と「編集」を一つのモデルで行えるのが特徴です:
- 一貫したワークフロー: 複数のツールを行き来する必要がない
- 高品質な編集: 生成だけでなく、既存動画の編集も可能
- 効率的な処理: 統合されているため処理がスムーズ
よくある質問(FAQ)
Q1: Wan2.1は本当に無料ですか?
A: はい、完全無料です。Wan2.1はApache 2.0ライセンスで公開されており、商用利用を含めて自由に使えます。ただし、実行するためのハードウェア(GPUなど)は自己負担になります。
Q2: プログラミングの知識は必要ですか?
A: 基本的なコマンドライン操作の知識があるとスムーズです。ただし、ComfyUIなどのGUIツールを使えば、プログラミングなしで使える場合もあります。
Q3: Macでも使えますか?
A: 現在は主にNVIDIA GPU(CUDA)対応となっており、Macでの動作は公式にはサポートされていません。ただし、クラウドサービスを経由すればMacからも利用可能です。
Q4: 生成した動画の著作権はどうなりますか?
A: 生成した動画の著作権については、利用規約や各国の法律によって異なります。商用利用を検討する場合は、弁護士に相談することをおすすめします。
Q5: どのくらいの時間がかかりますか?
A: RTX 4090を使用した場合、5秒の480P動画の生成に約4分かかります。GPUの性能や設定によって大きく変わります。
Q6: 日本語でプロンプトを入力できますか?
A: 基本的には英語での入力が推奨されます。ただし、翻訳ツールを使って英語に変換してから入力することで、日本語でのアイデアも表現できます。
Q7: 生成される動画の品質は?
A: 14Bモデルを使用すれば、非常に高品質な動画が生成されます。ただし、プロンプトの書き方によって品質が大きく変わるため、試行錯誤が必要です。
Q8: 他の人が作ったモデルを使えますか?
A: はい。Wan2.1をベースにした多くの派生モデルが公開されています。例えば、特定のスタイルに特化したモデルなどがあります。
Wan2.1を使いこなすコツ
良いプロンプトを書く方法
動画生成AIでは、プロンプト(指示文)の質が結果を大きく左右します。以下のコツを参考にしてください:
エラーが出た時の対処法
よくあるエラーとその対処法:
- CUDA out of memory: GPUのメモリ不足。解像度を下げるか、軽量モデルを使う
- Model not found: モデルが正しくダウンロードされていない。パスを確認
- Slow generation: 生成が遅い。GPUのドライバを更新するか、設定を確認
まとめ:Wan2.1で動画制作の新しい世界へ
Wan2.1は、動画生成AIの世界を大きく変える可能性を秘めた技術です。これまで高額なサービスや専門知識が必要だった動画制作が、誰でも手元のパソコンでできるようになりました。
特に注目すべきポイント:
初心者の方は、まずは1.3Bモデルで小さな動画を作ってみることから始めてみてください。失敗を恐れずに色々試すことで、動画生成AIのコツが掴めてくるはずです。
動画制作のハードルが下がった今、あなたのアイデアを映像にする時が来ました。Wan2.1で、新しい表現の世界を楽しんでください!
—


コメント