- 博客
- Sora 2 提示词完全指南:时间码技巧 + 爆款视频实例

Sora 2 提示词完全指南:时间码技巧 + 爆款视频实例
学习如何写出真正有效的 Sora 2 提示词。掌握时间码分镜技巧,复制即用的模板,以及来自爆款 AI 视频的真实案例。
我第一次用 Sora 2 生成的视频简直是灾难。
我输入了"一只猫在客厅里玩玩具"然后点击生成。结果完全不是我想象的样子——光线不对、镜头角度奇怪、猫咪在视频中途还变形了。
在研究了 X(Twitter)上数百个爆款 Sora 2 视频后,我发现了一个秘密:最厉害的创作者不只是写提示词,他们写的是带时间码的分镜脚本。
这篇文章分享我学到的所有技巧,帮你写出真正能渲染出预期效果的提示词。
Sora 2 提示词公式
把写提示词想象成给一个从没看过你分镜的摄影师做简报。如果你省略细节,他们就会即兴发挥——而结果可能完全不是你想要的。
OpenAI 官方指南建议分层构建你的提示词:
| 层级 | 需要包含的内容 | 示例 |
|---|---|---|
| 画幅 | 宽高比、时长 | 16:9, 10 秒 |
| 场景 | 地点、时间、天气 | 温馨的客厅,黄金时段光线 |
| 主体 | 角色、服装、特征 | 毛茸茸的小白猫 |
| 动作 | 运动、手势、节拍 | 用爪子拨弄玩具,然后抬头看 |
| 镜头 | 焦段、运动、角度 | 平视角度,缓慢推进 |
| 风格 | 氛围、参考、画质 | 电影感,暖色调,4K |
时间码:秘密武器
这就是业余提示词和爆款提示词的区别:时间码标注。
不要一次性描述所有内容,而是把视频分解成镜头:
(0–3s): [镜头1描述]
(3–6s): [镜头2描述]
(6–10s): [镜头3描述]这告诉 Sora 具体在什么时候切换场景、镜头角度或动作。
真实案例:爆款猫咪视频
这个来自 @BartzWow 的提示词生成了超过 10 万播放量的视频:
A small fluffy cat in a cozy, golden-hour living room paws a toy while
on-screen text reads 'What is this little guy doing?' (0–1.5s).
Camera at eye-level slowly pushes in as the cat behaves normally (1.5–3s).
Suddenly, the cat performs a surprising backflip (3–5s).为什么有效:
- 清晰的时间码分段:
(0–1.5s)、(1.5–3s)、(3–5s) - 具体的镜头指示:"平视角度缓慢推进"
- 意外的转折:"突然后空翻"制造爆点
真实案例:产品开箱
来自 OpenAI Cookbook:
A cinematic unboxing of a premium mirrorless camera on a wooden table.
(0–3s): Slow dolly in from the right, shallow depth of field,
warm morning light through a window, dust motes visible.
(3–8s): Top-down 45° reveal as hands open the box,
soft foley of cardboard and magnetic clicks.
(8–12s): Cut to 3/4 profile of the camera on velvet cloth,
subtle lens flare, soft ambient synth pad.两种写法:极简 vs 精细
极简派
有时候一句话 + 参考图片就够了:
Make a professional ad for [your product]这种方式适合:
- 你有一张强有力的参考图片
- 你想让 Sora 发挥创意
- 你在快速探索想法
@CharaspowerAI 证明了这招有效——他的简单提示词 + 产品图片生成了专业级的广告,直接爆火。
导演派
想要完全掌控,就写完整的分镜:
16:9, 12 seconds, cinematic product commercial.
(0–3s): Close-up of running shoes on wet pavement,
golden sunrise light, shallow DOF, brand logo visible.
(3–7s): Low-angle slow-motion of runner's feet hitting ground,
dust particles flying, dynamic motion blur.
(7–12s): Wide aerial shot following runner through city streets,
energetic mood, cinematic color grade.5 个复制即用的模板
1. 产品广告
A cinematic commercial for [产品名称], 16:9, 10 seconds.
(0–3s): Close-up product shot on minimal background,
soft spotlight, premium textures visible.
(3–7s): Product in use, lifestyle context,
natural lighting, aspirational mood.
(7–10s): Hero shot with brand logo,
slow zoom in, modern and impactful.
Style: Ultra-realistic, 4K, professional advertising quality.2. 宠物/萌宠视频
[动物描述] in [场景], golden hour lighting.
(0–2s): Wide establishing shot, cozy atmosphere,
[动物] enters frame naturally.
(2–5s): Eye-level medium shot, camera slowly pushes in,
[动物] does [普通动作].
(5–8s): Sudden [意外动作],
slight slow-motion for comedic effect.
Style: Warm, nostalgic, documentary feel.3. 旅行/风景
Breathtaking [地点] at [时间段], 16:9, 8 seconds.
(0–4s): Sweeping drone shot revealing landscape,
golden light, mist in valleys, epic scale.
(4–8s): Ground-level tracking shot through [地形],
foreground elements passing by, immersive POV.
Style: Cinematic, National Geographic quality, vibrant colors.4. 时尚/生活方式
[人物描述] in [场景], editorial fashion style.
(0–3s): Full body shot, model walking toward camera,
confident stride, clothes flowing naturally.
(3–6s): Close-up on outfit details,
shallow depth of field, texture visible.
(6–9s): Portrait shot, model looks at camera,
soft smile, backlit with golden rim light.
Style: High fashion editorial, Vogue aesthetic, 4K.5. 美食/烹饪
[菜品名称] preparation and presentation, overhead angle.
(0–3s): Ingredients arranged on wooden surface,
hands enter frame, begin preparation.
(3–7s): Cooking action with steam/sizzle,
dynamic close-ups, appetizing colors.
(7–10s): Final plated dish, slow camera orbit,
garnish falls in slow-motion, restaurant quality.
Style: Food photography, warm tones, mouth-watering detail.常见错误 vs 正确写法
| 错误写法 | 正确写法 |
|---|---|
| "一个猫视频" | "一只毛茸茸的橘猫在阳光明媚的厨房里..." |
| 没有时间码 | 添加 (0–3s):、(3–6s): 结构 |
| 主体太多 | 每个镜头聚焦一个主要对象 |
| 动作矛盾 | "慢动作冲刺" → 选择一个速度 |
| 缺少镜头信息 | 始终指定角度、运动、焦段 |
| 光线模糊 | "光线好" → "黄金时段,柔和阴影" |
常见问题
Sora 2 提示词应该多长?
简单视频 1-2 句话就够了。复杂的、需要精确控制的视频,100-200 词加时间码最理想。模型在短片段(5-10 秒)中执行指令更可靠。
时间码真的有效吗?
有效。Sora 2 会读取时间码并相应调整生成内容。这是掌控创意输出最强大的功能之一。
可以用中文或日语写提示词吗?
Sora 2 用英文提示词效果最好。其他语言可能会得到不太稳定的结果。建议把想法翻译成英文以获得最佳输出。
应该指定什么分辨率?
更高分辨率 = 更好画质但更高成本。测试时用 720p,最终渲染用 1080p 或 4K。始终指定宽高比(16:9、9:16、1:1)。
主体在视频中途变形怎么办?
在每个时间码段落重复关键的外貌特征。"同一只毛茸茸的白猫"或"穿红色外套的女人"有助于保持一致性。
总结
写出优秀的 Sora 2 提示词不是靠文字创意——而是像电影导演一样精确具体。
记住三件事:
- 使用时间码控制镜头切换
- 分层描述:场景 → 主体 → 动作 → 镜头 → 风格
- 从简单开始,在模型表现不好的地方再添加细节
最好的提示词读起来像分镜脚本,而不是诗歌。
准备好开始创作了吗?
Pro 会员可立即获得 Sora 2 访问权限、30+ 经过验证的模板和优先渲染。立即开始,把你的想法变成电影级视频。
更多文章

我用 60 秒做出了第一支 AI 视频 — 你也可以
了解 SoraVideo.art 如何将 Sora 2 的全部能力带入你的浏览器。无需复杂配置,无需每月 200 美元订阅 — 只需输入创意,AI 即刻生成电影级画质视频。


Kling 3.0 定价全解析:免费额度、积分费用与最省钱使用方式(2026)
Kling 3.0 能免费使用吗?可以,但有限制。完整解析 Kling 3.0 各平台定价、每秒费用、积分消耗、免费方案对比,帮你找到最划算的 Kling AI 使用方式。

Sora 2 商业实操手册:五个上线案例的交付脚本
把 Sora 2 渲染快速化为品牌短片,从需求、提示词到后期的完整蓝本。

邮件列表
加入我们的社区
订阅邮件列表,及时获取最新消息和更新













