DragNUWA オンライン
DragNUWAによる画期的なオープンドメインのビデオ生成。初めて直感的な編集を通じて、任意のドメインでカスタムで制御可能なビデオを生成します。DragNUWAは新しい拡散ベースのモデルで、現在のビデオ生成の研究における主要な制約を克服し、セマンティック、空間的、時間的にビデオコンテンツを微細に制御できるようにします。


よくある質問
お探しの情報が見つからない場合は、サポートチームにメールでお問い合わせいただき、幸運なことに誰かが返信します。
DragNUWAの主な革新点は、以前の制御可能なビデオ生成モデルと比較して何ですか?
DragNUWAはセマンティック、空間、時間の観点からビデオコンテンツをより微細に制御するために、同時にテキスト、画像、軌跡の制御を導入しています。また、Trajectory Sampler、Multiscale Fusion、Adaptive Trainingなどの革新を通じて、オープンドメインの軌跡制御を実現しています。
DragNUWAはビデオ内の微細な軌跡制御をどのように実現していますか?
DragNUWAのTrajectory Samplerは任意の軌跡の制御を可能にします。Multiscale Fusionは異なる粒度で軌跡を制御します。Adaptive Training戦略は、入力軌跡に従った一貫したビデオを生成します。
DragNUWAはどのデータセットでトレーニングおよび評価されましたか?
DragNUWAは複雑なオープンドメインの画像データセットでトレーニングおよび評価され、以前のより単純なデータセット(Human3.6Mなど)に依存する過去の作品の制約を克服しました。
DragNUWAは生成されたビデオのインタラクティブな編集を許可していますか?
はい、DragNUWAはテキストプロンプト、入力画像、軌跡を変更することにより、生成されたビデオの直感的なインタラクティブな編集を可能にします。これにより、ビデオコンテンツを微細に制御できます。
DragNUWAによって生成されるビデオはどれほどリアルで高品質ですか?
DragNUWAは与えられたテキスト、画像、軌跡の入力に密接に従う、非常にリアルで高品質なビデオを生成します。論文での数量的および人間の評価がDragNUWAのビデオ生成能力のリアリズムを検証しています。