Prompt Engineering

写出更稳定的 Gemini Omni 视频提示词

高质量 AI 视频并不依赖“玄学咒语”,而依赖结构化表达。把场景、主体、动作、镜头、风格、音频和限制条件写清楚,通常比堆砌形容词更有效。

适合新手、运营、广告创作者与需要稳定出片的团队

先写目标

明确平台、时长、场景和受众,让模型知道这段视频服务什么任务。

再写镜头

把景别、运镜、节奏和镜头情绪单独表达,而不是夹在一段大白话里。

加限制条件

明确不要出现什么、角色需保持什么、音频要不要对白,这会极大减少偏差。

保留版本

把有效 prompt 记录成模板,形成团队自己的镜头语言库。

Formula

一个实用的视频提示词公式

对中文用户而言,最稳妥的方式是把提示词拆成七段:场景、主体、动作、镜头、风格、音频、限制。这样写出来的 prompt 不仅更清晰,也更便于反复修改。

例如,不要只写“做一个很高级的产品视频”,而应写清楚产品是什么、画面在哪、镜头如何移动、材质与光线如何呈现、是否需要环境音、哪些元素不能出现。

核心要点

  • 场景
  • 主体
  • 动作
  • 镜头
  • 风格
  • 音频
  • 限制条件
"对模型来说,“信息完整”比“词藻华丽”更重要。"
Camera Language

镜头语言决定成片气质

同一主体,使用 close-up、wide shot、slow push in、handheld、aerial shot 这些镜头语言时,输出的成片气质会完全不同。因此镜头部分最好独立成一句,而不是揉进主体描述里。

对于营销短片和品牌内容,这一层尤其重要,因为用户看到的不只是对象本身,而是你如何引导他观看对象。

核心要点

  • 景别决定信息密度
  • 运镜决定节奏与情绪
  • 镜头越清楚,模型越容易稳定复现
Common Mistakes

最常见的提示词问题不是太短,而是太混乱

很多失败案例来自信息冲突:既要电影感又要像素风、既要纪录片镜头又要极端特效、既要克制又要激进。模型并不是听不懂中文,而是用户没有先做取舍。

因此,每次写 prompt 前都应先确定优先级:到底是人物一致性优先,还是风格化优先,还是音频对白优先。取舍越清楚,结果越稳定。

核心要点

  • 避免冲突风格
  • 避免缺失镜头信息
  • 避免没有明确限制条件

把单条 prompt 升级为团队方法

如果您已经掌握了基础写法,建议结合实际项目尝试多段式提示词与复杂镜头控制。