ショートビデオ制作が「編集ソフトを使いこなす必要があり、台本作成能力、マルチリンクの連携調整能力」という敷居の高い段階から抜け出せないでいる時、ビジネススープ・テクノロジーは、「自然言語入力→完全自動化→プロ級フィルム出力」というクローズドループ機能を備えた、世界初の編集統合AIショートビデオ制作エージェント「Seko」を発表した。自然言語入力→全工程自動化→プロ級フィルム出力」のクローズドループ機能は、クリエイションの壁を完全に打ち破ります。ロボットが主人公で宇宙を舞台にしたSFショートフィルムを描くゼロベースのユーザーであれ、商品プロモーションビデオを一括生成する必要のある映画・テレビチームであれ、セコは大規模なインテリジェント・エージェント・モデルを使用することで、脚本作成からアートスタイルの位置づけ、吹き替えや音楽のアフレコ、スプリットシーンのマッピングまで、すべてのプロセスを完結させることができ、誰もがショートビデオ・クリエーターに、そしてプロフェッショナルになることを可能にします。”誰もがショートビデオクリエイター “が現実のものとなりました。

まず、核となる位置づけ。「マルチツールの継ぎ接ぎ」から「ワンオートメーションの制作・編集」へ、ショートビデオ制作のロジックを再構築する。

一般的な編集ツールや単一のAI生成ツールとの差別化の鍵は、「全工程のインテリジェント・エージェント」という製品ポジショニングにあり、「ユーザーは創造性だけを提供すればよく、あとはAIに任せる」という核心的な要求を中心に、3つのコア・アドバンテージを構築している:

(i)全工程自動化:1つのエージェントが「アイデアから映画まで」を担当する。

Sekoは、「脚本はWord、シーン画はPS、編集はPr、アフレコはAU」という従来のショートビデオ制作ツールのモデルを完全に取り払い、1つのAgentによって完全なリンクカバレッジを実現します:

  • 需要分析→スクリプト作成:ユーザーが「兵馬俑の歴史をCGスタイルで1分間伝える」と入力すると、Sekoはまず核となる需要(テーマ:兵馬俑の歴史、スタイル:CG、時間:1分間)を分析し、「オープニングショット(兵馬俑の配列の全景)」を含む、完全な構造のスクリプトを自動生成します。オープニングショット(兵馬俑配列の全景)→プロット展開(歴史的シーンの復元)→エンディング昇華(文化的価値のまとめ)」という3部構成で、セリフ、ショットの説明、時間配分を含む完全構造の脚本を自動生成する;
  • 美術配置→鏡像:台本のスタイルに基づいて、AIが自動的にCG美術リソース(青銅の色調、リアルなキャラクターモデリングなど)をマッチングして、対応する鏡像を生成する(例えば、”ショット1:兵馬俑坑の俯瞰ショット、カメラがゆっくり進み、ナレーションが「紀元前221年、秦の始皇帝陵の兵馬俑」”)。”)、シーケンス図にはシーン要素、キャラクターの動き、カメラアングルが含まれている;
  • ダビングとサウンドトラック→フィルム合成:適切な音色(落ち着いた男性の声で歴史的な主題など)に一致するようにスクリプトの行に従って、自動的に生成されたダビング、シーンの雰囲気と組み合わせてBGM(弦楽器の叙事詩のような感覚)を選択し、最終的にユーザーが手動でスプライシングすることなく、完全なビデオのサブシーン、ダビング、サウンドトラック合成。あるセルフ・メディア・クリエイターによると、2日かかるような短い歴史科学ビデオが、世耕を使えば30分で完成し、そのプロフェッショナリズムはチーム制作に匹敵するという。

(ii)キャラクターの一貫性管理:IPセカンド制作やシリーズコンテンツの「イメージ保証」。

キャラクターベースのショートビデオ制作において、「ショットごとのキャラクターイメージの不統一」は高頻度のペインポイント(例:前フレームでの髪型の変化、服の色のズレ)であり、瀬古が研究・開発したキャラクター一貫性アルゴリズムを用いることで、シーンやサブシーンをまたいだイメージの安定を実現している:

  • キャラクターの取り込みと作成:ユーザーはIPキャラクター画像(例:「後ろズボンをはいた子猫」、「ジモモ」)をアップロードしたり、自然言語による記述(例:「ピンクの短毛で、後ろズボンをはき、生き生きとした表情をした漫画の猫」)でキャラクターを作成したりすることができます。例えば、「ピンクの短毛で、後ろズボンを履き、生き生きとした表情をした漫画の猫」など)、システムはキャラクターの特徴(髪型、服装、顔の詳細などのパラメータを持つ)のライブラリを生成します;
  • フルプロセス画像ロック:マルチシーンのスクリプト(公園で遊ぶ子猫、教室で勉強する子猫など)を生成する場合でも、一連の動画(「子猫の一週間」など)をバッチ処理する場合でも、世耕はキャラクタの特徴ライブラリを呼び出して、キャラクタの髪型、服装、プロポーションがすべてのサブシーンで同じになるようにし、表情のディテール(笑ったときの口角など)まで同じになるようにします。キャラクターの表情のディテール(笑ったときの口角の曲がり具合など)まで統一されている;
  • スタイル適応に狂いがない:映像のスタイルが変わっても(例えば、2Dアニメから3Dモデリングへ)、キャラクターの核となる特徴(例えば、リュックサックのズボン、ピンクの短髪)はそのまま維持されるため、スタイルの変更によるキャラクターの認知度低下を防ぐことができる。ある知財運用チームは、「らぶぶぶ」のキャラクター制作に世耕を使用し、98%のキャラクター一貫性で10本の短編動画を作成し、ファンから「公式制作のようだ」というフィードバックを得た。

(C)自然言語対話:基本ユーザーゼロの「敷居の低い操作」。

世耕は、対話の敷居を「話せれば作れる」程度に下げ、全工程で自然言語コマンドをサポートしているため、複雑な操作を覚える必要がない:

  • 簡素化された創造的な入力:専門用語は必要なく、日常的な言葉で説明するだけでよい(例:「手淹れコーヒーの淹れ方を教える、温かいスタイル、1分半」)。AIが主要な情報(トピック:手淹れコーヒーの教え方、スタイル:温かい、時間:1分半)を自動的に抽出するため、ユーザーがフォームに手入力する必要はない;
  • 柔軟な編集と調整:最初の原稿を作成した後、ユーザーは自然言語で修正できる(例えば、「BGMを軽快なピアノ曲に変更する」、「宇宙空間のシーンの色を青くする」、「ロボットのセリフを増やして『人間を守る』ことを強調する。)’人間を守る’設定にする」)、AIは修正ニーズを正確に把握し、タイムラインやパラメータを手動で調整することなく、リアルタイムでフィルムを更新します;
  • 直感的な機能呼び出し:「インスピレーション広場」、「主題ライブラリ」などを呼び出す必要がある場合、「子供に適した短いビデオテーマをいくつか推薦してください」、「Chou Chouを使ってください」と言うだけでよい。「Chou Chou Mokoko “と言えば、システムが直接応答するので、複雑なメニューから機能を探す必要がない。

第二に、機能マトリックス:”全体のリンクの作成と編集 “の周りに、プログレードの作成ツールセットを作成するには

世耕の機能設計は、「クリエイティブ入力-コンテンツ生成-編集と最適化-エクスポートと共有」という短い動画作成サイクルに忠実に沿っており、各モジュールは公式説明と完全に一致するようテスト・検証されています:

(I) コア制作機能:Seko Agentのフルプロセス機能

セコ・エージェントの中核的な競争力は、制作の全プロセスをカバーする「制作・編集」機能の徹底的な統合にあります:

  • 映像企画・脚本
    • ショートビデオ(15秒~5分)、ショートドラマ(5分~30分)、商品プロモーション(セールスポイントの埋め込みを含む)、知識の普及(論理的構造化)など、複数のタイプの脚本生成をサポートし、要件を入力すると「セリフ、カメラ説明、時間、シーン設定」を含む完全な脚本を自動生成します;
    • 脚本の最適化提案:AIが業界の流行(例えば、ショートビデオの「黄金の冒頭3秒」の原則)に基づき、脚本の最適化提案(例えば、「オープニングにロボットのアップを追加して魅力を高める提案」など)を行う;
  • キャラクターと美術のコントロール
    • 主なライブラリーリソース:「キティちゃん」「シュシュもこもこ」「ジモモ」「らぶぶ」などの人気キャラクターを内蔵。らぶぶ “などの人気キャラクターは、直接呼び出しをサポートします。ユーザーは、排他的なキャラクターライブラリを生成するためにカスタムキャラクターをアップロードすることができます;
    • アートスタイルの適応:CG、2Dアニメ、手描き、リアルなど10種類以上のスタイルをサポートし、AIがテーマに応じて自動的にマッチングする(例えば、ハイテクテーマならサイバーパンク風、食べ物テーマなら暖色系の手描き風など)、あるいは自然言語で指定することもできる(例えば、「宮崎駿のスタイルで短編アニメを作る」など);
  • マルチモーダルなコンテンツ生成
    • ビジュアル生成:スコアマップ(PNG/JPGでの書き出しに対応)、ビデオ画面(1080P/4K解像度に対応)、光と影の効果、シーンのテクスチャ、キャラクターの動きなどの画面詳細;
    • オーディオ生成:ナレーション(男性、女性、子供の声など8つのトーンをサポート、スピードと感情を調整可能)、BGM(壮大、明るい、暖かいなど20以上のスタイルをサポート、シーンの雰囲気に自動的にマッチング);
  • 全プロセスのインテリジェント・エージェント
    • モデルの自動スケジューリング:ニーズに応じて、自社開発モデルとサードパーティ協力モデル(例えば、画面分割ペイント用のSensePaintモデル、ボイスオーバー用のプロフェッショナルTTSモデル)をインテリジェントに選択し、各プロセスにおけるアウトプットの品質を確保する;
    • 進行状況のリアルタイムフィードバック:生成プロセスでは、「台本作成→シーンペイント→アフレコ合成→フィルム生成」の進行状況が表示され、各工程で費やされた時間が透明化される(例えば、台本作成に約5分、フィルム合成に約10分)。

(ii)補助機能:創作効率と創作意欲の向上

  • ひらめきの広場と推奨課題
    • インスピレーション広場:他のユーザーの高品質な作品(創作アイデアやニーズの説明を含む)を表示し、ユーザーは「日本の鴨川を背景にした癒しのショートフィルム」、「温かみのあるスタイルの動画で手淹れコーヒーを教える」などの事例を参考にして、自分の創作意欲を刺激することができる;
    • おすすめ題材:ユーザーの歴史創作の好み(例えば、歴史科学普及をよく行う)に基づき、関連するキャラクターや題材をおすすめする(例えば、「あなたの歴史科学普及スタイルに適した『三星痔』の題材をおすすめします」);
  • エクスポートと共有
    • マルチフォーマットエクスポート:MP4(Shake、Shutter、B Stationなどのプラットフォームに適応)、MOV(その後のプロフェッショナル編集での使用)、選択可能な解像度(720P/1080P/4K)、フレームレート(24/30/60fps)をサポート;
    • 直接共有:フィルムを生成した後、手動でアップロードすることなく、ワンクリックでJittery、WeChatビデオ番号や他のプラットフォームに共有することができます;
  • 公式コミュニティサポート
    • 公式グループに参加すると、より多くのポイント(高解像度エクスポート、マルチモデル呼び出しなどの権利や特典をアンロックするため)を取得し、最新の機能アップデートの通知や作成スキルのチュートリアルを得ることができます。

(C) エンタープライズレベルの適応:チームコラボレーションとバッチ作成を満足させる

世耕は、ビジネス・シナリオのニーズに適応し、エンタープライズ・ユーザー専用の機能を提供します:

  • バッチ作成:Eコマースチームが10個の商品画像をアップロードし、「各商品に30秒の縦型プロモーションビデオを作成し、核となるセールスポイントを強調する」と入力すると、Sekoはブランドのビジュアルスタイルを統一するために、10個の差別化されたビデオをバッチで作成することができます;
  • 権限管理:企業ユーザーはチームスペースを作成し、「管理者(ロールライブラリの変更、フィルムのレビューが可能)」「作成者(作成の開始のみが可能)」などの権限を設定することで、コンテンツの混乱を避けることができます;
  • ブランドカスタマイズ:企業VI素材(ロゴ、ブランドカラー、専用フォントなど)のインポートをサポートし、生成されたビデオに自動的に統合される(例えば、フィルムの最後にブランドロゴを追加したり、ブランドカラーをスクリーンの色相に合わせたりする)。

第三に、プロセスの使用:クリエイティブから映画を完成させるための5つのステップ、ゼロベースも開始することができます!

世耕の操作手順は「テキスト入力→生成待ち→書き出し微調整」とシンプルで、公式手順は以下の通り(公式サイトの記述と完全に一致していることを確認):

(A)最初のステップ:登録してログインし、作成インターフェイスに入る。

  1. 公式サイトにアクセス:世耕の公式サイト(https://seko.sensetime.com)を開き、携帯電話番号の登録または企業メールボックスからのログインをサポートする(企業ユーザーはチーム登録を選択できる);
  2. 作成に入る:ログイン後、ホームページの「+新規作成」ボタンをクリックし、インターフェースの左側に需要入力エリア、右側に機能ナビゲーション(マイスペース、メインライブラリ、インスピレーション広場)があるコア作成インターフェースに入る。

(ii)ステップ2:作成内容を入力し、需要の詳細を明確にする。

  1. 要求の記述:入力ボックスでは、自然言語を使用して、ビデオのアイデアを詳細に記述し、「テーマ(例:SF短編映画、製品プロモーション)」、「キャラクター(例:ロボット、IPキャラクター)」、「シーン(例:宇宙、カフェ)」、「スタイル(例:CG、アニメ)」、「時間(例:1分)」、「目的(例:ジッターバグ)」を含めることをお勧めします。)」、「スタイル(例:CG、カートゥーン)」、「時間(例:1分)」、「目的(例:Jitterbugリリース、企業研修)」。例:「日本の鴨川を舞台にした癒し系ショートムービーを、シュシュモココを主人公に、2Dアニメスタイルで、1分30秒の長さで作成し、小本集での共有に使用する」;
  2. 補足パラメータ(オプション):「詳細設定」をクリックして、解像度(デフォルト1080P)、吹き替えのトーン(デフォルトのマッチングスタイル)、分割画像をエクスポートするかどうか(デフォルトではエクスポートされない、手動でチェックを入れる必要がある)を手動で選択し、完了後に「次へ」をクリックします。

(C)ステップ 3: 生成を待ち、プロセス全体の進捗状況を確認する

  1. 生成の開始:システムが “要件の解析とコンテンツの生成 “を促し、”1.スクリプトの作成(推定5分)→ 2.サブシーンの描画(推定8分)→ 3.ボイスオーバーのサウンドトラック(推定4分)→ 4.完成したフィルムの合成(推定3分)”を表示する進捗ページにジャンプする。”;
  2. リアルタイム表示:各セクションの完成後にプレビューが表示されます(例:脚本作成完了後に完成脚本を閲覧でき、サブシーン描画完了後にサブシーン図を閲覧できます)。 中間結果に満足できない場合は、”一時停止と修正 “をクリックして自然言語で調整できます(例:”脚本終盤は環境保護のテーマを強調する必要があります。”).

(iv) ステップ4:完成したフィルムの細部を最適化するための編集と調整

  1. フィルムのプレビュー:すべてのステップが完了した後、システムは自動的にフィルムを再生し、インターフェイスの下部に「再生速度の倍増」、「音量調整」、「全画面表示」の機能を提供する;
  2. 自然言語修正:調整が必要な場合、右側の “コマンド編集 “ボックスに要求を入力してください。例えば、”BGMを軽快なギター音楽に変更する”、”宇宙シーンの星の数を増やす”、”ロボットのセリフの星の数を増やす”、”宇宙シーンの星の数を増やす”。ロボットのセリフに “未来の世界へようこそ “を追加”、”変更を実行 “をクリックすると、システムは1-2分でアップデートを終了します;
  3. キャラクターとスタイルの微調整:キャラクターのイメージに満足できない場合は、「メインライブラリ」をクリックしてキャラクターを再選択することができます(例えば、「メインキャラクターをジモモに置き換える」)。スタイルを調整する必要がある場合は、「CGスタイルを手描きスタイルに変更」と入力すると、AIがキャラクターを再選択します。スタイルを調整したい場合は、「CGスタイルを手描きスタイルに変更」と入力すると、AIが対応するコンテンツを再生成する。

(E)ステップ5:共有やその後の使用のために、フィルムをエクスポートする。

  1. フォーマットの選択:「エクスポート」ボタンをクリックし、エクスポートフォーマット(MP4/MOV)、解像度(720P/1080P/4K)、フレームレート(24/30/60fps)を選択します。”;
  2. エクスポート開始:パラメータを確認した後、”エクスポートを確認 “をクリックすると、エクスポートの進行状況がリアルタイムで表示され、完了後、ローカルにダウンロード(Windows/Macをサポート)、または企業クラウドに同期(企業ユーザー専用)することができます;
  3. 共有と普及(オプション):エクスポート後に「共有」ボタンをクリックし、ターゲットプラットフォーム(Jittery、WeChat Video、Station B)を選択し、承認後に直接公開します。システムは自動的にビデオのメタデータを最適化します(適応したプラットフォーム用のラベルを追加するなど)。

アプリケーション・シナリオ:個人と企業をカバーし、多様な制作ニーズに対応。

世耕の機能設計は、さまざまなユーザーグループのニーズに的確にマッチしており、公式事例は実際の経験と高い互換性を持っています:

(i)個人クリエイター:基礎知識がなくても、高品質なコンテンツ制作が可能。

  • セルフメディアブロガー:小本州のブロガーが「らぶキャラを使って、かわいいスタイルで1分程度の『週末キャンプVlog』を作成」と入力したところ、セコが自動字幕・自動BGM付きでキャンプシーンやキャラクターとのやりとりを盛り込んだショート動画を生成し、「いいね!」数が手動制作に比べ直接的に60%増加、公開後も手動制作に比べ60%増加した。世耕は、キャンプシーンやキャラクターとのやりとりを盛り込んだ短編動画を生成し、字幕やBGMを自動で付け、手動制作と比較して「いいね!」数を直接的に60%増加させた;
  • 趣味愛好家:歴史愛好家が「唐代の長安の街並みをCG風に復元し、科挙の試験制度を紹介する2分程度の動画」を描写すると、AIが「長安街の全景→科挙の試験会場のアップ→受験生の質疑応答シーン」という専門的な科挙動画を生成し、ユーザーの「興味関心のアウトプット」を支援する。ユーザーが「興味のアウトプット」を実現する;
  • 職場の人々:企業の採用のための人事は、”会社の文化を紹介するショートフィルム “を生成するために、入力 “オフィスの環境、チーム活動、スタッフのインタビュー(AIが生成した仮想スタッフ)を表示し、暖かいスタイル、1分半の長さ”、世耕すぐにフィルムに生成され、採用に使用される採用広報のコストを削減するため、採用プラットフォームで利用できる映像を素早く生成します。

(ii) プロのクリエイティブ・チーム:効率化とバッチ・アウトプットの強化

  • 映画・テレビスタジオ:独立系映画・テレビチームが「異なるスタイルの短い予告編3本(サスペンス、ロマンス、コメディ)」を制作する必要があり、対応する要件を入力した後、世耕はスクリプト、サブスコープ、完成したフィルムを含む3本の予告編を一括生成;
  • MCNエージェンシー:ブロガー向けの “開封動画 “の台本とフィルムを一括生成。 商品画像をアップロードし、”「薄くて、軽くて、長寿命」というセールスポイントを強調し、技術感を持たせ、時間は30秒 “と入力すると、AIが統一された動画の台本とフィルムを生成する。”、AIは統一されたスタイルの開封ビデオを生成し、ブロガーは撮影を繰り返す必要がなく、パーソナライズされたナレーションに集中することができます。

(三)企業マーケティング:ブランドコミュニケーションと製品販売を支援する。

  • Eコマース企業:美容ブランドが5つの口紅の商品画像をアップロードし、「それぞれの口紅に15秒の縦型広告を生成し、色番号と質感を強調し、ファッショナブルなスタイルで、Jitterbugに適している」と入力すると、Sekoは5つの広告を一括生成し、自動的に「ショッピングカートをクリック」の案内を追加し、配置後のコンバージョン率を35%増加させた。セコが5つの広告を一括生成し、「ショッピングカートをクリック」の導線を自動で追加、出稿後のコンバージョン率が35%アップ;
  • 教育・研修:教育機関から「『小学生の算数チキンとウサギの問題解決スキル』人気科学ビデオを生成してください、漫画スタイル、長さ2分、問題例説明とステップバイステップの分解を含む」と入力され、AIは明確に構成された教育ビデオを生成し、オンラインコースの集客に利用でき、コンテンツ制作のコストを削減する。AIは、オンラインコース集客のための明確な構造の教育ビデオを生成し、コンテンツ制作コストを削減する;
  • 文学・観光プロモーション:地元の文化・観光部門が「CGスタイルを使って地元の古い町並みを紹介し、歴史的背景や特別な食べ物を紹介する、3分の長さ」と説明すると、世耕は公式アカウント用の短いプロモーションビデオを作成し、観光客数を25%増加させた。

(iv) 知的財産の運用:二次創作を刺激し、知的財産の影響力を拡大する。

  • 知財サイド:ある玩具ブランドが「ジモモ」キャラクターの二次創作権限を開放し、ユーザーはセコでキャラクターを呼び出し、「ジモモの雪山探検物語、癒し系、時間1分」と入力し、二次創作動画を生成してコミュニティに公開、公式が良質な作品を審査して報酬を与え、知財トピックの露出を200%増加させる原動力となった;(Ⅳ)知財運用:二次創作を刺激して知財の影響力を拡大。質の高い作品を公式が選別して報酬を与え、知財トピックの露出を200%増加させる;
  • ファンによる創作:ファンが「ズボンをはいたキティのキャラクターで、月餅や提灯の要素を含む温かみのあるスタイルで、『中秋節のお月見』をテーマにした短編映画を作る」と入力すると、AIがIPイメージに沿った二次コンテンツを生成し、ファンがそれをシェアすることで「キティ中秋節」というトピックが形成される。AIがIPイメージに沿った二次コンテンツを生成し、それがファンによってシェアされることで「キティ中秋節」というトピックが形成され、IPがその輪を突破するのに役立っている。

関連ナビゲーション

コメントはありません

none
コメントはありません...