Prompt Engineering

写出更稳定的 Gemini Omni 视频提示词

高质量 AI 视频并不依赖“玄学咒语”，而依赖结构化表达。把场景、主体、动作、镜头、风格、音频和限制条件写清楚，通常比堆砌形容词更有效。

适合新手、运营、广告创作者与需要稳定出片的团队

先写目标

明确平台、时长、场景和受众，让模型知道这段视频服务什么任务。

把景别、运镜、节奏和镜头情绪单独表达，而不是夹在一段大白话里。

明确不要出现什么、角色需保持什么、音频要不要对白，这会极大减少偏差。

把有效 prompt 记录成模板，形成团队自己的镜头语言库。

Formula

对中文用户而言，最稳妥的方式是把提示词拆成七段：场景、主体、动作、镜头、风格、音频、限制。这样写出来的 prompt 不仅更清晰，也更便于反复修改。

例如，不要只写“做一个很高级的产品视频”，而应写清楚产品是什么、画面在哪、镜头如何移动、材质与光线如何呈现、是否需要环境音、哪些元素不能出现。

"对模型来说，“信息完整”比“词藻华丽”更重要。"

Camera Language

同一主体，使用 close-up、wide shot、slow push in、handheld、aerial shot 这些镜头语言时，输出的成片气质会完全不同。因此镜头部分最好独立成一句，而不是揉进主体描述里。

对于营销短片和品牌内容，这一层尤其重要，因为用户看到的不只是对象本身，而是你如何引导他观看对象。

Common Mistakes

很多失败案例来自信息冲突：既要电影感又要像素风、既要纪录片镜头又要极端特效、既要克制又要激进。模型并不是听不懂中文，而是用户没有先做取舍。

因此，每次写 prompt 前都应先确定优先级：到底是人物一致性优先，还是风格化优先，还是音频对白优先。取舍越清楚，结果越稳定。

了解 Gemini Omni 提示词如何进入实际工作流。

继续按新手、镜头、音频等主题阅读 Gemini Omni 教程。

查看 Gemini Omni 关于画质、音频和可用性的高频问题。

如果您已经掌握了基础写法，建议结合实际项目尝试多段式提示词与复杂镜头控制。