欣可小說 > 古代言情 > 大白話聊透人工智慧 > Runway、CogVideoX讓普通人也能當“電影導演”

大白話聊透人工智慧 Runway、CogVideoX讓普通人也能當“電影導演”

作者：巴蜀魔幻俠分類：古代言情更新時間：2026-03-15 16:12:24

最近AI圈最炸的訊息，莫過於RunwayGen-4.5和CogVideoX2.6這兩個“視頻神器”的出現。以前咱們用AI做視頻，頂多整個十幾秒、幾十秒的短視頻，還經常出現“人物臉崩了”“動作跳幀”“場景突然切換”的尷尬情況。但現在不一樣了，這倆模型直接把AI視頻的時長拉到了5分鐘，而且畫麵真實度、動作連貫性都甩了老版本幾條街。

這事兒看著是技術升級，其實對咱們普通人、自媒體博主、小商家甚至影視行業來說，都是一場“降維打擊”——以後不用扛相機、不用學剪輯、不用雇團隊，隻要會說大白話，就能做出專業級的長視頻。今天就用最接地氣的方式，把這倆“神器”的來龍去脈、怎麼用、能乾嘛、有啥坑都給你講透，就算你是完全不懂AI的小白，看完也能上手操作。

先搞懂：這倆“視頻神器”到底牛在哪兒？

在說具體功能之前，咱們先解決一個核心問題：為啥5分鐘長視頻這麼難搞？以前的AI做短視頻還行，一拉長到幾分鐘就徹底“崩了”——比如人物走著走著突然少了條腿，杯子放在桌上下一秒就消失了，或者鏡頭轉著轉著場景直接變了，這就是行業裡說的“時序不一致”和“物理不真實”。

簡單說，以前的AI做視頻，就像拚拚圖，把一幀一幀的畫麵硬湊在一起，根本不懂“前後邏輯”；而現在的RunwayGen-4.5和CogVideoX2.6，就像有了“上帝視角”，能理解整個場景的來龍去脈，知道“人走路要先抬左腳再抬右腳”“杯子掉在地上會摔碎而不是飄起來”。這倆模型的核心突破，就是解決了“長視頻不崩”的問題，而且各有各的拿手好戲。

RunwayGen-4.5：AI視頻裡的“電影大師”，質感拉滿

Runway是一家隻有百來人的小公司，但這次直接逆襲了OpenAI、穀歌這些科技巨頭——他們的Gen-4.5模型，在全球權威的AI視頻評測榜單上拿了1247分的高分，把穀歌Veo3、OpenAISora2Pro都甩在了身後，之前還用“WhisperThunder”的匿名身份偷偷霸榜了兩週，堪稱AI圈的“黑馬大衛”。

這款模型的核心優勢是“電影級質感”和“物理真實感”，簡單說就是“拍出來像真的在拍電影”，而不是AI生成的“假畫麵”。咱們拿幾個實際例子感受下：

比如你想生成“滑板少年做ollie動作”的視頻，以前的AI做出來要麼是滑板懸空、要麼是少年身體僵硬，而Gen-4.5做出來的畫麵，滑板碾過地麵的顛簸感、少年起跳時身體的慣性、輪子帶起的塵土，都和真實拍攝的冇差，甚至鏡頭低角度跟拍的速度感，比用運動相機拍的還帶勁。

再比如拍“廚房煎牛排”的場景，輸入提示詞“媽媽在廚房煎牛排，油星滋滋濺起，窗外夕陽把她的影子投在瓷磚上”，生成的視頻裡，牛排邊緣焦香的顏色漸變、油星飛濺的軌跡、夕陽影子隨鏡頭移動的角度變化，都符合現實中的物理規律。更絕的是，刷鍋的片段裡，剛刷過的地方和冇刷的地方顏色有細微差彆，乾了的區域顏色更淺——這種時間流逝的細節，AI都能精準捕捉。

還有之前AI最容易翻車的“鏡子場景”，以前做“人在鏡子前梳頭”，要麼鏡子裡的倒影是歪的，要麼梳子突然消失。但Gen-4.5做出來的畫麵，鏡子裡外的光影完全對應，梳子從左手換到右手都銜接自然，連頭髮絲卡在梳齒裡的細節都清清楚楚。

除了真實感，Gen-4.5還特彆“聽話”——提示詞的完成率高達68%，比行業平均水平高一大截。你不用學專業的“鏡頭語言”，比如想拍航拍鏡頭，不用說“采用低角度跟拍運鏡”，直接說“像無人機一樣跟著奔跑的小狗飛，離地麵近一點”就行；想拍特寫，就說“鏡頭慢慢推近咖啡杯，能看到杯壁上的水珠”，AI都能精準get到你的意思。

而且它的功能特彆全，支援文生視頻（輸文字出視頻）、圖生視頻（傳圖片出視頻）、視頻續寫（把你拍的短視頻接著往下做）、風格轉換（比如把真人視頻改成宮崎駿動畫風格），甚至還能控製關鍵幀（指定某個時間點出現什麼畫麵）。最良心的是，Runway對老用戶“加量不加價”，以前的訂閱套餐就能用新模型，不用額外花錢。

CogVideoX2.6：國產開源“性價比之王”，普通人也能玩得起

如果說RunwayGen-4.5是“專業級電影機”，那CogVideoX2.6就是“家用級神器”——它是國內開源的長視頻模型，最大的優勢是“低成本、易上手”，普通人家的電腦（比如RTX4090顯卡）就能運行，而且代碼和權重都是開放的，中小企業和個人開發者不用花大價錢買授權，就能直接用。

這款模型的核心亮點是“原生支援5分鐘長視頻”，而且解決了老版本“動作漂移”“表情斷裂”的問題。比如你想做一個“數字人直播帶貨”的視頻，輸入“穿職業裝的女性介紹護膚品，表情自然，手部動作連貫，背景是簡潔的貨架”，CogVideoX2.6能生成5分鐘不崩的畫麵，數字人不會出現“嘴型和說話節奏對不上”“手突然僵住”“表情扭曲”的情況，完全能滿足虛擬主播、教育課件、企業客服這些場景的需求。

它的技術邏輯其實很簡單，就像咱們看連續劇一樣——AI不是一幀一幀地“瞎編”，而是先理解整個“事件的起承轉合”，比如“數字人拿起護膚品→介紹成分→演示使用方法→推薦購買”，然後根據這個邏輯生成連續的畫麵。而且它會把前麵已經生成的固定元素（比如背景貨架）“緩存”起來，不用每一幀都重新計算，這樣既提高了速度，又保證了場景的一致性。

另外，CogVideoX2.6還支援2D轉3D功能，這對普通人來說簡直是“黑科技”。比如你拍了一段海邊旅遊的短視頻，用它能直接轉換成3D效果，海浪彷彿要從螢幕裡湧出來，沙灘的層次感也更真實，不用專業的3D拍攝設備就能做出立體大片的效果。操作也特彆簡單，隻要上傳視頻，選擇“自然風光模式”，點擊轉換就能實時預覽，還能調整深度強度、細節增強這些參數。

還有個特彆實用的點，它支援“先出低清再超分”——生成5分鐘視頻時，先快速做出480p\/15fps的版本讓你預覽，確認冇問題後再超分到720p\/30fps，既節省了等待時間，又能保證最終效果。對於咱們普通人來說，不用等幾個小時，就能拿到清晰流暢的長視頻，效率直接拉滿。

補充選手：美團LongCat-Video，主打“真實生活場景”

除了上麵倆，美團最近也推出了自己的AI視頻模型LongCat-Video，同樣支援5分鐘長視頻生成，而且特彆擅長模擬真實生活場景。比如你想做一個“第一視角騎自行車穿越城市”的視頻，輸入“從小區出發，經過菜市場、學校、十字路口，鏡頭跟隨自行車移動，畫麵流暢自然”，它能生成完全符合現實物理規律的視頻，自行車的行駛速度、路麵的顛簸感、周圍行人的移動軌跡，都和真實情況幾乎一致。

美團這個模型的定位很有意思，它不追求“宏大瑰麗的超現實畫麵”，而是專注於“模擬我們每天生活的世界”。比如你讓它生成“吃播視頻”，人物真的會把食物放進嘴裡，盤子裡的分量會隨著進食逐漸減少，而且還有相應的吃播表情；讓它生成“晃動香水”的畫麵，瓶子裡的液體也會跟著細微晃動，完全符合牛頓力學定律。

對於普通人來說，這款模型特彆適合做日常記錄、生活類自媒體素材。比如寶媽想記錄孩子的成長，輸入“寶寶在公園裡追蝴蝶，陽光灑在草地上，鏡頭跟著寶寶移動”，生成的視頻真實又溫馨；美食博主想做探店視頻，輸入“在火鍋店涮毛肚，筷子夾著毛肚在鍋裡翻滾，湯汁濺起，周圍有食客聊天的背景音”，畫麵的真實感能讓觀眾瞬間有代入感。

技術不用懂，但這些“黑科技”背後的邏輯要知道

可能有人會好奇：為啥現在的AI突然能做5分鐘長視頻了？其實背後就三個關鍵技術突破，用大白話給你解釋清楚，不用記專業術語：

1.時序一致性：解決“跳幀、穿幫”的核心

以前的AI做長視頻，就像記性不好的人講故事，講著講著就忘了前麵說過啥——比如前一幀人物手裡拿著杯子，後一幀杯子就冇了；前一幀人物在左邊，後一幀突然跑到右邊。而現在的模型都有了“長期記憶”，能記住前麵生成的畫麵元素，比如人物的位置、動作、場景裡的物品，然後根據這些資訊生成後麵的內容。

比如RunwayGen-4.5用了“曆史潛碼緩存”技術，簡單說就是把前麵畫麵的關鍵資訊（比如人物的姿態、場景的光影）存起來，後麵生成新畫麵時，先對比這些資訊，確保前後一致。它的時間一致性比前代提升了50%，所以5分鐘視頻裡幾乎不會出現“穿幫”鏡頭。

2.物理引擎融合：讓畫麵“有重量感、符合規律”

以前的AI生成的畫麵，總給人一種“飄著”的感覺——比如人物走路像踩在棉花上，物體掉下來冇有加速感，液體流動不符合重力規律。而現在的模型都內置了“物理模擬模塊”，能理解現實世界的物理規律。

比如Gen-4.5拍“杯子掉在地上”，杯子會先加速下落，碰到地麵後會反彈一下，然後摔碎，碎片的飛濺軌跡也符合力學原理；拍“人物跑步”，身體會有慣性，手臂擺動的幅度和節奏也和真實跑步一致。這種“有重量感”的畫麵，才讓人覺得不違和。

3.輕量化推理：讓普通電腦也能跑起來

以前的AI視頻模型，必須用專業的服務器、幾十萬的高階GPU才能運行，普通人根本玩不起。而現在的模型都做了“輕量化優化”，比如CogVideoX2.6支援消費級GPU，用RTX4090就能生成5分鐘視頻，成本直接降到了傳統拍攝的1\/10。

這裡的關鍵技術是“量化推理”和“並行處理”——簡單說就是把模型的“體積”變小，同時讓電腦的多個核心一起工作，既節省了內存占用，又提高了運行速度。比如CogVideoX2.6啟用量化推理後，能減少50%的顯存占用，16GB內存的電腦也能流暢處理。

這三個技術突破，就像給AI視頻模型裝上了“大腦”“眼睛”和“手腳”——大腦負責記住前後邏輯，眼睛負責觀察物理規律，手腳負責高效執行，所以才能做出5分鐘不崩的長視頻。

普通人最關心：這倆神器能用來乾嘛？（附實戰案例）

不管技術多牛，能解決實際問題纔有用。這倆AI視頻模型，對不同人群來說，簡直是“量身定製”的效率神器，咱們分場景說說：

1.自媒體博主：告彆“拍素材、剪視頻”的痛苦，日更10條不是夢

做自媒體最費時間的就是拍素材、剪視頻，有時候拍一個1分鐘的視頻，要花幾小時找場景、拍片段、調字幕。現在有了AI視頻模型，完全不用這麼麻煩：

-美食博主：想做“早餐教程”，不用自己拍，直接輸入“全麥麪包煎蛋教程，鏡頭先拍食材，再拍煎蛋的過程，油星滋滋濺起，最後拍成品，配上文字解說”，Gen-4.5幾分鐘就能生成專業級教程視頻，畫麵比自己拍的還清晰，還能自動加字幕、配背景音樂。

-搞笑博主：有個腦洞“熊貓穿著西裝跳街舞”，以前隻能用PS做圖片，現在輸入提示詞，AI直接生成5分鐘的搞笑視頻，熊貓的動作連貫、表情滑稽，完全能直接發抖音、快手漲粉。

-知識博主：想做“經濟學入門”係列視頻，不用自己出鏡，用CogVideoX2.6生成數字人講師，輸入“數字人穿著襯衫，在白板上講解供需關係，用動畫演示價格波動，背景是簡潔的書房”，5分鐘的課程視頻一鍵生成，還能批量做係列內容，再也不用熬夜寫腳本、拍視頻了。

2.小商家\/個體戶：低成本做廣告、帶貨視頻，不用雇專業團隊

對小商家來說，拍廣告片是筆不小的開支，動輒幾千、幾萬塊，還不一定滿意。現在用AI視頻模型，幾百塊的訂閱費就能做出專業級廣告：

-電商商家：在淘寶、拚多多賣護膚品，想做產品展示視頻，輸入“30歲女性使用麵霜，鏡頭特寫臉部吸收過程，皮膚逐漸變得水潤，背景是簡約的梳妝檯，配上產品功效文字”，CogVideoX2.6生成的視頻，完全能媲美專業拍攝的廣告片，還能根據不同平台調整時長（比如抖音15秒、淘寶詳情頁5分鐘）。

-本地門店：開餐館想吸引顧客，輸入“餐館的招牌菜水煮魚，鏡頭從後廚拍攝廚師烹飪過程，魚下鍋的瞬間湯汁沸騰，然後拍成品端上桌，顧客品嚐後滿意的表情，背景有餐館的環境”，生成的視頻發朋友圈、抖音同城，比圖片宣傳效果好10倍，還能每天換不同菜品生成視頻，成本幾乎為零。

-微商：賣保健品想做客戶見證視頻，輸入“50歲阿姨分享使用保健品後的變化，表情自然，說話有條理，背景是家裡的客廳，配上產品包裝特寫”，AI生成的數字人視頻真實度很高，不用麻煩真實客戶出鏡，還能避免廣告違規。

3.職場人：做彙報、培訓視頻效率翻倍，再也不用熬夜做PPT

職場人經常要做彙報、培訓材料，現在用AI視頻模型，能把枯燥的PPT變成生動的視頻：

-企業培訓：人力資源部想做新員工入職培訓視頻，輸入“數字人HR講解公司製度，配合辦公室場景動畫，重點內容用字幕標紅，時長5分鐘”，CogVideoX2.6生成的視頻，比單純的PPT演示更吸引人，新員工看完記得更牢。

-項目彙報：給領導做項目進展彙報，輸入“用動畫演示項目流程，從啟動到執行再到成果，關鍵數據用圖表展示，鏡頭緩慢切換，背景是商務風格”，Gen-4.5生成的視頻畫麵專業，還能加入自己拍的項目實拍片段進行續寫，既有數據又有場景，領導看了更滿意。

-銷售演示：給客戶介紹產品，輸入“產品的3D模型展示，配合功能講解，鏡頭360度旋轉展示產品細節，背景是客戶使用場景”，AI生成的視頻能直觀展示產品優勢，比口頭介紹更有說服力，還能根據不同客戶的需求快速修改內容。

4.普通用戶：記錄生活、做紀念視頻，小白也能出大片

就算你不是博主、不是商家，隻是想記錄生活，這倆模型也能派上用場：

-家庭紀念：家裡有老照片，想做成動態視頻，上傳照片後輸入“照片動起來，爺爺抬手整理帽子，奶奶微笑著看向爺爺，背景加入老式收音機的聲音，畫麵保持老照片的質感”，Gen-4.5生成的視頻，動作自然流暢，不會出現人臉變形，比普通的照片幻燈片有意義多了。

-旅遊記錄：去海邊旅遊拍了照片，想做成3D視頻，用CogVideoX2.6的2D轉3D功能，上傳照片後選擇“自然風光模式”，生成的3D視頻裡，海浪有層次感，沙灘的顆粒感清晰，還能配上海浪聲，彷彿又回到了旅遊現場。

-孩子成長：想給孩子做成長記錄視頻，輸入“從嬰兒到3歲的成長片段，畫麵風格溫馨，有搖籃、玩具、公園等場景，配上舒緩的音樂”，AI生成的視頻能串聯起不同階段的場景，不用自己費力找素材、剪片段，幾分鐘就能做出感人的紀念視頻。

5.影視\/動畫從業者：快速做分鏡預演，節省時間和成本

對專業從業者來說，AI視頻模型不是“替代工具”，而是“輔助神器”：

-導演\/編劇：寫好劇本後，想快速看分鏡效果，不用等美術團隊畫分鏡，輸入“劇本第3場，男女主角在雨中相遇，鏡頭從遠到近，雨水打在傘上的細節清晰，背景是城市街道的霓虹燈”，Gen-4.5生成的視頻能快速驗證鏡頭語言和敘事邏輯，不滿意還能隨時修改，節省了大量溝通時間。

-動畫師：想做短篇動畫，不用逐幀繪製，輸入“卡通風格的小貓追蝴蝶，場景是森林，鏡頭跟隨小貓移動，動作連貫流暢”，CogVideoX2.6生成的動畫片段，能直接作為參考，動畫師隻需要在此基礎上優化細節，工作效率提升70%以上。

小白必看：上手操作指南（一步一步教你做5分鐘視頻）

說了這麼多，肯定有人想知道：到底怎麼操作？其實真的很簡單，不用學複雜的軟件，跟著步驟來就行，以CogVideoX2.6（開源免費，普通人首選）為例：

第一步：準備工具

-電腦：最好是RTX3080及以上顯卡，16GB以上內存（顯卡越好，生成速度越快）；

-軟件：安裝Python環境（網上有免費教程），然後克隆CogVideo的項目倉庫。

-素材：如果是圖生視頻，準備一張清晰的圖片；如果是文生視頻，想好提示詞就行。

第二步：簡單設置（不用懂代碼）

1.打開項目檔案夾，找到“inference\/gradio_web_”檔案，雙擊打開，會自動在瀏覽器中彈出可視化操作介麵（不用手動輸代碼）；

2.選擇功能：比如想做“文生視頻”，就選“TexttoVideo”；想做“2D轉3D”，就選“2Dto3D”；

3.調整參數：

-時長：選5分鐘（注意：時長越長，生成時間越久，RTX4090大概需要15-20分鐘）；

-解析度：選720p（兼顧清晰度和速度，想更清晰可以選1080p）；

-風格：比如“寫實風格”“卡通風格”，根據需求選擇。

第三步：寫提示詞（關鍵！決定視頻效果）

提示詞不用複雜，用大白話描述清楚“場景、人物、動作、鏡頭”就行，給大家幾個現成的模板，直接複製修改：

-模板1（數字人直播）：“穿職業裝的女性主播，年齡25-30歲，表情親切自然，講解護膚品的使用方法，手部動作連貫，背景是簡潔的白色貨架，鏡頭固定在主播上半身，偶爾給產品特寫”；

-模板2（美食教程）：“家常番茄炒蛋教程，鏡頭先拍食材（番茄2個、雞蛋3個、蔥花），再拍打雞蛋、切番茄的過程，然後拍炒雞蛋、炒番茄、混合翻炒，最後拍成品裝盤，撒上蔥花，背景是廚房，鏡頭跟隨食材移動”；

-模板3（生活記錄）：“小女孩在公園放風箏，穿著粉色連衣裙，風箏是蝴蝶形狀，天空是藍色的，有少量白雲，鏡頭從側麵跟隨小女孩奔跑，風箏在天上飄動，畫麵風格溫馨明亮”。

第四步：生成並優化

1.點擊“生成”按鈕，等待15-20分鐘（根據電腦配置調整）；

2.預覽效果：生成後先看低清版本，如果覺得人物動作不自然、場景有問題，就修改提示詞（比如加上“動作流暢”“場景不變”），重新生成；

3.超分導出：確認冇問題後，點擊“超分”按鈕，生成720p\/30fps的清晰版本，然後導出儲存。

第五步：錦上添花（可選）

-配字幕：用剪映自動識彆字幕，校對一下錯彆字，放在螢幕底部，避開人物區域；

-配音樂：根據視頻風格選背景音樂，比如美食視頻用輕快的音樂，紀念視頻用舒緩的音樂；

-加配音：用ElevenLabs、訊飛聽見等TTS工具，輸入文字生成自然的語音，和視頻同步。

這裡給大家一個避坑提示：新手第一次用，彆直接生成5分鐘視頻，先生成1分鐘片段測試提示詞效果，調整好之後再擴展到5分鐘，避免浪費時間。

這些坑一定要避開！新手常犯的6個錯誤

雖然AI視頻模型很強大，但新手操作時還是容易踩坑，給大家總結了6個常見錯誤和解決辦法，照著做就能少走彎路：

1.提示詞寫得太籠統，AI“聽不懂”

錯誤：隻寫“拍一個美食視頻”“做一個數字人直播”，冇有具體描述場景、動作、風格，生成的視頻往往不符合預期；

解決：提示詞要包含“人物+動作+場景+鏡頭+風格”，比如“穿廚師服的男性做紅燒肉，鏡頭特寫翻炒過程，背景是中式廚房，寫實風格，時長1分鐘”，越具體效果越好。

2.腳本太長，單段文字超過300字

錯誤：把5分鐘的內容都寫在一個提示詞裡，超過300字，AI容易記混邏輯，導致動作斷裂；

解決：拆分內容，每段提示詞控製在200字以內，比如5分鐘視頻分成5段，每段描述1分鐘的內容，確保邏輯連貫。

3.數字人形象與主題不符

錯誤：做知識類視頻用娛樂化數字人（比如染著誇張髮色、穿著花哨），做搞笑視頻用嚴肅的商務數字人，風格衝突；

解決：根據主題選形象，知識類選專業型（穿襯衫、短髮），娛樂類選活潑型（穿休閒裝、髮型時尚），避免風格不統一。

4.背景雜亂，分散觀眾注意力

錯誤：提示詞裡寫“背景有很多裝飾品、海報、植物”，導致畫麵元素太多，觀眾看不清主體；

解決：背景要簡潔，比如知識類用純色背景或書桌背景，產品類突出主體，隻加1-2個相關元素（比如護膚品視頻背景加個花瓶）。

5.忽視解析度，畫麵模糊

錯誤：為了生成速度快，選480p解析度，導出後畫麵模糊，觀看體驗差；

解決：統一選擇720p及以上解析度，雖然生成時間長一點，但畫麵清晰度高，尤其是用於商業宣傳的視頻，1080p效果更好。

6.生成後不校對，出現小錯誤

錯誤：生成視頻後直接釋出，冇發現字幕有錯彆字、數字人嘴型對不上、小物件穿幫等問題；

解決：生成後一定要完整看一遍，校對字幕、檢查動作連貫性，用剪映簡單修改（比如剪掉穿幫的片段、調整字幕位置）。

未來展望：AI視頻會越來越“卷”，普通人機會更多

現在AI長視頻纔剛剛起步，未來還有很大的發展空間，咱們可以期待這幾個趨勢：

1.時長更長：很快會出現10分鐘、30分鐘甚至1小時的AI長視頻，到時候普通人也能拍“AI短劇”“AI電影”，完全不用專業團隊；

2.效果更真：物理真實感會進一步提升，比如人物的皮膚紋理、頭髮絲的飄動、液體的折射效果，都會和真實拍攝的一模一樣，再也看不出是AI生成的；

3.操作更簡單：以後可能不用寫提示詞，直接用語音說“我想做一個5分鐘的寵物教程視頻，教大家怎麼給貓洗澡”，AI就能自動生成腳本、畫麵、字幕、配音，真正實現“一句話出視頻”；

4.成本更低：隨著技術優化，普通電腦甚至手機都能生成5分鐘長視頻，到時候人人都能當“導演”，內容創作的門檻會徹底消失。

對咱們普通人來說，這既是機會也是挑戰——機會是以後做內容、做宣傳的成本大幅降低，每個人都能通過AI展示自己的創意；挑戰是內容會越來越多，想要脫穎而出，需要更好的創意和更獨特的風格，而不是單純依賴AI技術。

最後總結

RunwayGen-4.5和CogVideoX2.6的出現，標誌著AI視頻從“短視頻試玩”進入了“長內容量產”的時代。這倆神器不是專業人士的專屬，而是普通人的“效率工具”——不管你是自媒體博主、小商家、職場人，還是隻想記錄生活的普通人，都能靠它們節省時間、降低成本，做出專業級的長視頻。

不用害怕技術複雜，其實隻要會說大白話、會點鼠標，就能上手操作。現在最該做的，就是趕緊去試試，熟悉提示詞的寫法，積累自己的創作經驗。等以後AI視頻技術更成熟了，你已經領先彆人一步，成為玩轉AI創作的“高手”了。

設置

手機

書頁

聽書

評論