使用 LTX 2.3 生成电影级 AI 视频

告别繁杂的视频工作流。获取精准的镜头控制、配套音频以及专为现代社交叙事打造的竖屏输出。

LTX23 是围绕 LTX 2.3 工作流构建的独立站点,并非 Lightricks、LTX 或相关模型权利方的官方网站、授权代表、赞助方或背书合作方。第三方名称与商标归各自权利人所有。

围绕 LTX 2.3 的 prompt-first 工作流原生音频与原生竖屏支持Fast / Pro 双模式选择支持文本、图片与音频工作流

提示词工作台

模型模式

任务类型

Fast

分辨率

时长

画幅

帧率

镜头运动

生成音频

仅用于文生和图生流程。

Cost

6 积分

预览

LTX 2.3 showcase:常见视频风格案例

四个常见创作方向:快速运动、近景纹理、竖屏叙事和声音场景。

快速电影感运动

适合广告开头、内容钩子和短镜头测试的快速运动案例

适合广告钩子、预告开头和产品切入镜头。

快速试方向社媒开头短视频节奏

微距纹理保留

需要表面细节可信的近景镜头

重点看运动中的纹理保留,适合产品近景和美妆质感。

近景细节产品纹理可控运动

竖屏优先内容

不是后期硬裁,而是从一开始就按手机内容去构图

更适合 Reels、Shorts 和 TikTok 的竖向叙事。

原生 9:16创作者分发移动端构图

原生音画同步

声音时间点会直接改变观感的场景

适合需要声音参与叙事的场景。

声音事件对齐事件驱动镜头更像单次成片

LTX 2.3 对 AI 视频更有价值的地方

这些能力会直接影响视频是否更好控、更好发。

DiT 架构更适合处理时间一致性

动作和时序更容易保持整体性。

更适合自然语言长提示词

它更愿意理解一整段有语义连接的提示词,而不是一串风格标签,因此你可以把镜头、主体和声音写在一起。

原生音频意识

声音不再只是后期补上的附件。对于需要事件音效、环境声和动作节奏对应的场景,这一点会直接影响成片质感。

原生竖屏支持

如果最终是发 Shorts 或 Reels,从一开始就按竖屏去构图,通常比横屏生成完再硬裁更合理。

Fast 与 Pro 分工清晰

Fast 更适合快速迭代方向,Pro 更适合你已经找到方向之后去追求更细的纹理和更稳的镜头表达。

适合反复迭代的创作工作流

更适合反复测试、微调和正式出片。

如何使用 LTX 2.3,而不是把提示词写坏

四步就够,大多数场景都能用。

步骤 1

先确定这个镜头到底要完成什么任务

你是在卖氛围、展示产品、讲一个很短的故事,还是做一个竖屏停留点?目标越清晰,提示词越容易写对。

步骤 2

用主动语言写出看得见的动作

尽量写 walks、drifts、turns、pans、pushes in 这类能形成清晰动势的词,而不是只写抽象风格。

步骤 3

只有在需要时再补充图像和构图约束

如果是图生视频或竖屏场景,再去补主体位置、镜头方向和过渡逻辑,不要只是重复画面里已经存在的静态信息。

步骤 4

先用 Fast 找方向,再用 Pro 做成片

把 Fast 当成探索层,把 Pro 当成精修层。这样速度和质量都能兼顾。

适合 LTX 2.3 的高阶提示词模式

先复制,再按你的主体和镜头需求改。

LTX 2.3

适合表面、水珠、布料和皮肤细节的微距摄影

当你需要画面有“触感”时,这类结构更稳。镜头节制、主体动作很少,提示词把更多篇幅留给材质和细节表现。

镜头

极近景加轻微 push-in,让注意力一直留在纹理上。

光线

柔和棚拍光,保证水珠和标签压纹都能被看清。

运动

只有慢速旋转和水珠滑动,更利于保住细节。

声音

低存在感环境声加轻微触碰声,增加真实感。

成片目标

适合产品营销、美妆视频和强调材质触感的品牌内容。

Prompt 模板

A macro lens extreme close-up of condensation gathering on the curved surface of a chilled glass bottle as a hand rotates it slowly under soft studio light. The camera pushes in very slightly while tiny droplets merge, slide, and catch highlights. The label texture remains sharp, the background stays creamy and out of focus, and the ambient sound is a quiet studio hum with the soft friction of fingertips against cold glass.

复制完整 prompt,自动回到首屏,再换成你自己的主体和场景去测试。

LTX 2.3 的典型使用场景

常见于产品展示、短片叙事、室内改造和声音驱动内容。

无人脸内容

带声音节奏的 ASMR 和解压短片

适合做 ASMR、解压和节奏点明显的 faceless 内容。

产品和美妆

靠质感卖镜头的近景产品视频

如果产品价值来自光泽、纹理、水珠、压纹包装或皮肤细节,那么一动就糊的模型就不适合。这里正是 LTX 2.3 能体现差异的地方。

室内和建筑

有明确空间锚点的改造和过渡视频

对室内设计博主、地产营销和装修内容来说,重点不是 surreal,而是空间结构能不能稳住,前后变化看起来是否可信。

短视频品牌表达

适合创始人品牌和社媒叙事的竖向短片

适合创始人品牌、教育内容和移动端短叙事。

按 Fast 1080p 6 秒基准量选择 credits 包

Starter 约 20 段,Creator 约 53 段,Studio 约 120 段。

入门包

$19.9

包大小

120 credits

  • 购买的 credits 永不过期
  • 支持商业用途
  • 支付成功后立即到账
约可生成 20 段 Fast 1080p 6 秒视频

创作包

$49.9
$53.07
最多人选save 6%

包大小

320 credits

  • 购买的 credits 永不过期
  • 支持商业用途
  • 支付成功后立即到账
约可生成 53 段 Fast 1080p 6 秒视频

工作室包

$99
$119.4
save 17%

包大小

720 credits

  • 购买的 credits 永不过期
  • 支持商业用途
  • 支付成功后立即到账
约可生成 120 段 Fast 1080p 6 秒视频
安全支付支持
Pay
link

LTX 2.3 常见问题

这里回答最常见的几个问题。

LTX 2.3 是 Lightricks 推出的开源权重视频生成模型。对大多数用户来说,真正重要的是它把文生视频控制、时间一致性、原生音频意识和竖屏友好输出放进了一个更实用的工作流里。

尽量写成一整段自然语言,而不是一串风格标签。把主体、动作、镜头运动、光线和你想要的声音事件写在一起。相比抽象风格词,具体动作语言通常更稳。

对大多数创作者来说,短时长更容易保持干净和可用。原生竖屏让 9:16 特别适合移动端分发,而 16:9 依然适合做电影感主版本和横屏故事板。

它更适合短视频创作者、产品营销团队、设计师、教育内容作者,以及任何需要把 AI 视频从测试推进到真实发布的人。只要你在意提示词控制和输出构图,它就更有价值。

支持。很多人会认真比较 LTX 2.3 的原因之一,就是你可以把声音意图直接写进 prompt,让成片更连贯,而不是完全依赖后期再拼声音。

适合。如果你的主要分发目标是 Shorts、Reels 或 TikTok,原生竖屏支持的价值很直接:场景从一开始就按手机去构图,而不是渲染完再勉强裁切。

这个系列一直在迭代,但对大多数用户来说,更重要的是“现在拿来做内容到底好不好用”。如果你更看重更成熟的提示词体验、整体输出表现,以及音频和竖屏这类创作者功能,LTX 2.3 会是更值得优先关注的方向。

不要按品牌站队,要按工作流选。Wan 2.2 经常因为图生视频质量和模型矩阵被讨论,而 LTX 2.3 在速度、自然语言提示词、原生音频意图和竖屏创作者场景上更有吸引力。你更看重最终质感、试错速度还是分发形态,决定了哪个更适合你。

用你自己的 prompt 试试 LTX 2.3

回到首屏工作台,输入一个场景,切换 Fast 和 Pro,然后开始打磨真正适合你项目的片段。