DeepSeek+MJ 高效制作 AI 视频全流程指南(附避坑提示与实操技巧)
一、核心工具与前期准备
DeepSeek:核心作用是生成结构化视频脚本,并将模糊的画面描述转化为符合 MJ 语法的精准提示词(Prompt),其优势在于对 “视频时间轴 + 画面细节 + 风格要求” 的理解能力极强,能减少人工反复修改的成本。
MidJourney(MJ):用于生成高质感视频帧画面,需注意版本适配(本文默认使用 V6.1,若为其他版本需在提示词中调整参数),生成的图像需符合视频比例(推荐 16:9,适配主流播放场景)。
视频合成工具:可选 “可灵”“Vidu”“剪映” 等,其中 “可灵” 操作简单但生成速度较慢,适合追求画面细腻度的场景;“剪映” 则更适合后期剪辑、配音与音效搭配,新手友好。
二、Step 1:用 DeepSeek 生成视频脚本与 MJ 提示词
1. 第一轮指令:生成结构化视频脚本
“我想做一个关于葡萄酒的 AI 视频,帮我设计脚本、文案、画面,包含时间轴,以表格形式输出,视频时长约 30 秒。”
时间区间 | 文案 / 旁白 | 画面描述 | 视觉风格 | 音效 / 配乐建议 |
---|---|---|---|---|
0-5 秒 | 探索葡萄酒的优雅世界 | 航拍镜头穿越金色阳光下的葡萄园,藤蔓整齐延伸至地平线 | 电影级广角、暖色调 | 轻快的竖琴音效 |
5-10 秒 | 百年传承工艺 | 特写布满岁月痕迹的橡木桶,镜头拉远展现古老酒窖全貌 | 复古黄铜色调、慢推镜头 | 时钟滴答声渐入 |
10-15 秒 | 每一滴都是时间的馈赠 | 红酒沿高脚杯壁缓缓流淌(慢动作),酒液折射出宝石般光泽 | 4K 微距拍摄、动态粒子特效 | 液体流动音效 |
15-20 秒 | 从舌尖到心灵的沉醉之旅 | 年轻品酒师在落地窗前闭目品酒,窗外是暮色中的葡萄园 | 逆光剪影、柔焦处理 | 悠扬的小提琴独奏 |
20-25 秒 | XX 葡萄酒 —— 成就每个重要时刻 | 多场景快速切换:庆功宴碰杯、烛光晚餐、朋友聚会欢笑 | 蒙太奇剪辑、霓虹光晕效果 | 欢快的香槟开瓶声 |
25-30 秒 | 品味非凡,即刻开启 | 酒瓶特写缓缓旋转,LOGO 浮现,瓶身倒影中呈现世界名庄剪影 | 3D 金属质感、全息投影效果 | 交响乐高潮、品牌定制音效 |
2. 第二轮指令:生成精准的 MJ 提示词
“针对上述脚本中每个时间区间的画面描述,补充具体细节(包括主体特征、光影效果、拍摄方式),并生成符合 MidJourney 语法的提示词,需包含分辨率、风格参考、版本参数。”
0-5 秒(航拍葡萄园):
ultra-realistic aerial view of endless vineyard in golden hour, leaves sparkling like diamonds, cinematic lighting with sun rays piercing through clouds, morning dew on grapevines extending to misty mountains, warm color palette of burgundy and amber, hyper-detailed 8k rendering, style of movie "A Walk in the Clouds", 24fps --ar 16:9 --v 6.15-10 秒(古老橡木桶与酒窖):
macro shot of weathered oak barrel with visible wood grain and copper iron rivets, volumetric light beams from small window, patina texture on barrel surface, dim cellar background with cobweb-covered wine racks, plaque engraved "1892", Baroque-style ceiling arches, Hasselblad X2D 180C photography, slow push shot (0.5x speed) --ar 16:9 --v 6.1 --stylize 70010-15 秒(红酒流过高脚杯):
extreme close-up of red wine cascading down crystal glass in slow motion (1200fps), dynamic fluid simulation with refracting garnet hues, microscopic view showing swirling tannin particles, bokeh background of burning candles, Phantom Flex 4K high-speed capture, Octane Render liquid physics --ar 16:9 --v 6.1 --chaos 3015-20 秒(品酒师逆光剪影):
silhouette of female sommelier tasting wine against floor-to-ceiling window, condensation trails on glass surface, out-of-focus vineyard at twilight with fireflies, backlighting creating golden rim light on hair, shallow depth of field (f/1.2), Fujifilm Eterna film style, soft focus --ar 16:9 --v 6.1 --style raw20-25 秒(多场景蒙太奇):
montage of three scenes: toast at celebration banquet with neon halos, candlelit dinner for two, friends laughing at a gathering, fast cuts between scenes, vibrant color grading, motion blur effects, cinematic transitions --ar 16:9 --v 6.1 --stylize 70025-30 秒(酒瓶特写与品牌 LOGO):
close-up of wine bottle rotating slowly, 3D metallic texture on bottle surface, holographic projection of world-famous winery silhouettes in bottle reflection, brand LOGO glowing at the end, soft ambient light, high contrast --ar 16:9 --v 6.1
三、Step 2:用 MJ 生成高质感视频帧画面
参数统一化:若需视频风格一致,建议将所有提示词的 “版本(--v)”“比例(--ar)”“艺术化程度(--stylize)” 统一(如本文统一为 --v 6.1、--ar 16:9、--stylize 700),避免画面风格跳跃。
画面筛选与重绘:MJ 生成的每张图会有 4 个版本,选择最符合脚本意境的画面;若某张图细节不足(如 “酒窖光线过暗”),可在原提示词中补充 “brighten cellar light by 20%” 后重新生成。
命名与归档:生成后按 “时间区间 + 画面主题” 命名(如 “0-5s_航拍葡萄园”),避免后续导入视频工具时混淆顺序。
四、Step 3:视频合成与后期优化
1. 图生视频:选择合适工具生成动态片段
可灵(推荐细腻度):打开可灵 1.6 版本,点击 “图片创作 - 图生视频”,导入单张 MJ 画面,在 “图片描述” 中补充该画面的核心场景(如 “航拍镜头穿越金色阳光下的葡萄园,过渡到橡木桶特写”),选择 “高品质” 模式,等待约 10 分钟生成 5 秒动态片段(需注意:可灵生成速度较慢,适合单片段精细化制作)。
Vidu(推荐效率):无需额外输入描述词,直接导入 MJ 画面,选择 “标准模式”,3-5 分钟即可生成动态片段,适合快速出片;但画面细节丰富度略低于可灵,可根据需求选择。
2. 后期剪辑:用剪映整合片段并添加音效
片段拼接:打开剪映,将 6 个动态片段按时间顺序导入轨道,调整每个片段时长为 5 秒,确保总时长 30 秒,检查片段间过渡是否自然(可添加 “溶解”“淡入淡出” 等转场效果)。
配音与音效:根据脚本中的 “音效 / 配乐建议”,在剪映 “音频” 模块添加对应音效(如竖琴音、香槟开瓶声),并录制或生成旁白(剪映 “文本朗读” 功能可直接将文案转化为自然语音,选择 “温柔女声” 适配葡萄酒主题)。
字幕与品牌信息:在 25-30 秒片段中添加品牌 LOGO 与 slogan(如 “XX 葡萄酒 —— 品味非凡”),选择 “发光”“渐变” 等字幕样式,提升品牌辨识度。
调色优化:统一全片色调为 “暖金色 + 勃艮第红”,在剪映 “滤镜” 中选择 “复古胶片” 或 “电影感” 滤镜,增强画面质感。
五、关键避坑点与效率提升技巧
DeepSeek 本地部署避坑:普通用户无需尝试 “本地部署 DeepSeek-R1”,一方面部署需极高的硬件配置(如高端 GPU 与大内存),另一方面官方未开放普通用户的本地部署权限,网页版(https://chat.deepseek.com/)已能满足脚本与提示词生成需求,且操作零门槛。
MJ 提示词优化技巧:若生成的画面与预期不符,可在提示词中添加 “negative prompt”(负面提示词),如 “避免模糊、避免过曝、无多余杂物”,减少无效画面生成。
视频工具选择逻辑:若制作 “短平快” 视频(如 15 秒内),优先用 Vidu + 剪映;若追求 “电影级细腻画面”(如 30 秒品牌宣传片),建议用可灵生成片段,再用剪映精细化剪辑。
时间成本控制:MJ 生成 1 张图约 1-2 分钟,6 张图共需 10-15 分钟;可灵生成 1 个 5 秒片段约 10 分钟,6 个片段共需 1 小时;后期剪辑约 30 分钟,总耗时约 2 小时,适合个人或小团队高效产出。