저는 Runway Gen-2 홍보 영상을 보고 “이게 진짜 가능해?” 싶어서 바로 써봤어요. 글 한 줄로 영상이, 그것도 시네마틱한 광고 느낌으로 튀어나오는 게 너무 충격이었거든요. 회사에서도 잠깐씩 테스트할 정도로 매력적이었습니다.
하지만 현실적인 벽은 빠르게 왔어요. 무료 사용량이 금방 소진됐고, 결제를 고민했지만 체감상 가격이 만만치 않았습니다. 게다가 영상 길이가 “내가 원하는 만큼” 길게 나오지 않고, 더 길게 만들려면 더 많은 비용이 들어가니 선뜻 손이 안 가더라고요. 캐릭터 일관성까지 욕심내면, 레퍼런스 이미지를 계속 만들어 넣어야 해서(예: 미드저니로 키 이미지 생성 → 영상화) 돈과 공정이 2배처럼 느껴지기도 했고요.
그래서 이 글은 “결제 유도”가 아니라, 제가 겪은 그 지점(무료 소진, 길이/비용, 일관성)을 기준으로 텍스트 1줄 + 이미지 1장만으로도 고화질 결과를 뽑는 실전 프롬프트 공식을 정리해 드립니다.

Runway Gen-2와 Luma Dream Machine은 무엇을 잘하나요?
먼저 한 문장으로 정리하면 이해가 빨라요.
- Runway Gen-2는 텍스트·이미지·비디오 클립을 입력으로 받아 새로운 영상을 생성하는 멀티모달 모델입니다. (Runway Gen-2 공식 소개)
- Luma Dream Machine은 텍스트/이미지 기반으로 짧은 고품질 클립을 만들고, 카메라 모션·키프레임·확장(Extend) 같은 기능으로 샷을 ‘연출’하는 흐름이 강점입니다. (Luma Web Quick Start)
Runway Gen-2는 영상을 생성합니다. Luma는 샷을 연출합니다. 사용자는 프롬프트로 움직임을 지시합니다. (주어-동사-목적어로 딱 떨어지죠.)
왜 “무료 사용량이 금방 끝나는 느낌”이 드는 걸까요?
대부분의 AI 영상 툴은 크레딧(credits) 기반이에요. 즉, “한 번 생성”이 아니라 “초 단위/기능 단위”로 비용이 계산되는 구조라서 체감이 빠르게 닳습니다.
Runway는 무료 플랜이 어느 정도일까요?
Runway 공식 가격 페이지에서는 Free 플랜에 125 크레딧(1회 제공)이 포함된다고 안내합니다. (Runway Pricing)
Runway 크레딧은 어떻게 계산될까요?
Runway 도움말에서는 모델에 따라 “초당 크레딧”처럼 계산되고, 예시로 Gen-4가 초당 12 크레딧이며 5초/10초 옵션에 따라 총 비용이 달라진다고 설명합니다. (Runway: How do credits work?)
Luma는 요금제가 어떻게 구성될까요?
Luma는 공식 안내에서 Web 기준으로 Lite($9.99), Plus($29.99), Unlimited($94.99) 플랜과, Plus/Unlimited에서 상업적 사용 허용 및 워터마크 제거 등을 명시합니다. (Luma Dream Machine Pricing (공식))
텍스트 한 줄로 “시네마틱”이 나오게 하려면 무엇을 넣어야 할까요?
왕초보가 가장 많이 하는 실수는 “장면 설명만 길게 쓰는 것”이에요. 영상은 ‘문장 길이’보다 움직임(모션) + 카메라(워크) + 시간 흐름이 핵심입니다. 특히 이미지→비디오에서는 “프롬프트는 무엇이 일어나는지(모션/카메라/시간)”를 명확히 쓰라고 Runway도 안내해요. (Runway Academy: Prompting Guide)
어떤 프롬프트 공식으로 쓰면 실패가 줄까요?
[장면/피사체] + [행동(무엇이 움직이는지)] + [카메라 무브] + [조명/분위기] + [품질 키워드] + [금지사항]
무엇을 “금지사항”으로 고정하면 좋을까요?
영상 생성에서 자주 튀는 건 텍스트/로고/워터마크/왜곡이에요. 그래서 아래는 거의 고정으로 붙이는 걸 추천합니다.
- no text, no letters, no watermark, no logo
- no distortion, no flicker, no jitter
바로 복붙할 수 있는 시네마틱 텍스트 프롬프트 예시는 무엇일까요?
- 여행 B-roll(풍경): Cinematic wide shot of a quiet coastal cliff at sunrise, gentle ocean shimmer, slow moving clouds, slow push-in, natural light, clean color grading, ultra realistic, no text, no watermark, no logo
- 여행 B-roll(도시): Cinematic street scene in a clean seaside town, subtle ambient motion, slow pan right, natural light, realistic textures, shallow depth of field, no text, no watermark, no logo
- 광고 느낌(제품 연출): Minimal cinematic product shot on a clean desk, soft studio lighting, slow orbit around the product, crisp reflections, premium commercial look, no text, no watermark, no logo
이미지 한 장으로 “캐릭터/스타일 일관성”을 잡으려면 어떻게 해야 할까요?
제가 Runway를 쓰면서 욕심났던 포인트가 바로 이거였어요. “이 캐릭터로 계속 가고 싶은데?” 같은 생각이 들죠. 하지만 텍스트만으로 일관성을 잡으려 하면 샷마다 사람이 달라질 수 있습니다.
따라서 일관성이 필요하면 답은 거의 정해져 있어요. 이미지→비디오(Image to Video)를 쓰고, 이미지를 “기준 프레임(키 이미지)”으로 삼는 겁니다.
Runway에서 이미지→비디오 프롬프트는 무엇을 써야 하나요?
Runway는 Image to Video에서 “업로드한 이미지가 구도/조명/스타일을 잡고, 프롬프트는 모션/카메라/시간 진행을 설명하라”고 안내합니다. (Runway Academy: Image to Video 원리)
Luma에서 이미지 한 장으로 영상 만드는 흐름은 어떻게 되나요?
Luma Web Quick Start에서는 이미지를 선택한 뒤 “Make Video”를 누르면 2개의 영상 버전이 자동 생성된다고 안내합니다. (Luma Web Quick Start)
Luma는 영상 길이를 어떻게 늘릴 수 있나요?
Luma의 키프레임 가이드에서는 기본적으로 4초 영상이 생성되고, Extend로 길이를 늘리면서 이미지 키프레임을 목적지처럼 추가해 확장 애니메이션을 유도할 수 있다고 설명합니다. (Luma: How to Use Keyframes)
카메라 무브를 말로 지시하려면 어떤 단어를 쓰면 좋을까요?
Luma는 카메라 모션 옵션을 문서로 안내하고 있어요. Pan/Orbit/Crane 같은 개념을 활용하면 “영상이 살아나는 느낌”이 빨리 붙습니다. (Luma: How to use Camera Motion)
| 목표 | 추천 카메라 무브 표현 | 초보 팁 |
|---|---|---|
| 고급스러운 광고 느낌 | slow orbit, slow push-in | 움직임을 “subtle”로 제한하면 깨짐이 줄어요. |
| 여행 풍경 B-roll | slow pan left/right, gentle drift | 구도는 이미지가 잡고, 프롬프트는 모션만 지시하세요. |
| 긴장감 있는 연출 | crash zoom, handheld | 초보는 과한 무브에서 왜곡이 늘 수 있어요. |

길이가 짧게 나오는 문제는 어떻게 해결할 수 있을까요?
제가 결제 고민을 하다 멈춘 이유 중 하나가 “원하는 길이가 안 나온다”였어요. 이건 개인의 문제가 아니라, AI 영상 툴이 짧은 클립에 최적화되어 설계된 경우가 많아서 생깁니다.
하지만 해결책은 있습니다. 길이를 “한 번에” 만들려 하지 말고, 샷 단위로 쪼개서 연결하는 방식이요.
어떻게 비용을 아끼면서 길이를 늘릴까요?
- 5~8초짜리 샷만 여러 개 만든다(오프닝/전환/클로징).
- 각 샷은 카메라 무브 1개만 쓴다(예: slow push-in만).
- 텍스트는 영상 안에 넣지 말고, 편집툴에서 자막으로 처리한다.
- 좋은 샷이 나오면 비슷한 샷을 2~3개 변형해서 시리즈로 만든다.
- 최종은 컷 편집으로 연결하고, BGM/효과음으로 “완성도”를 올린다.
Runway Gen-2 vs Luma, 결국 어떤 기준으로 고르면 될까요?
두 툴 모두 강력하지만, “내가 무엇을 제어하고 싶은지”가 핵심입니다. 아래는 왕초보 기준으로 가장 현실적인 비교예요.
| 비교 항목 | A: Runway Gen-2 (Runway) | B: Luma Dream Machine |
|---|---|---|
| 핵심 인상 | “영상을 만들어주는 영화 공장” 느낌 | “샷을 연출하고 늘리는 제작 도구” 느낌 |
| 입문 추천 | 홍보/광고 느낌의 시네마틱 클립을 빠르게 보고 싶을 때 | 이미지 한 장으로 움직임을 만들고, 키프레임/연출로 다듬고 싶을 때 |
| 일관성 전략 | 이미지→비디오로 기준 프레임을 고정하고 모션만 지시 | 기본 4초 생성 후 Extend + 이미지 키프레임으로 목표 장면을 유도 |
| 비용 체감 | 무료 크레딧은 빠르게 소진될 수 있음(공식 가격/크레딧 안내 참고) | 플랜별 크레딧/상업 사용/워터마크 조건이 명확하게 안내됨 |
| 공식 정보 | Gen-2 소개 / Runway Pricing | Web Quick Start / Pricing |
2026년에는 왜 “굳이 Runway만”이 아니게 됐을까요?
제가 당시 결제를 망설였던 걸 지금은 크게 후회하지 않는 이유가 이거예요. 2026년에는 영상 생성 AI 선택지가 훨씬 많아졌고, “더 쉽게” 만드는 앱/도구들이 계속 나오고 있거든요.
- OpenAI Sora는 텍스트나 이미지를 기반으로 영상 제작을 지원하며, 앱 형태로 롤아웃이 진행 중이라고 안내합니다. (Sora(공식))
- Google Flow는 AI 필름메이킹 도구로 소개되며, 생성/수정/구성 중심의 워크플로우를 강조합니다. (Google Flow(공식))
따라서 지금은 “Runway 결제를 해야만 영상이 된다”가 아니라, 내 목적(광고 컷 vs 유튜브 B-roll vs 캐릭터 일관성)에 맞는 툴을 고르는 시대에 가깝습니다.
실전에서 결과를 가장 빨리 끌어올리는 체크리스트는 무엇일까요?
- 텍스트는 짧게, 모션은 명확하게: “무엇이 어떻게 움직이는지”를 1~2문장으로 고정
- 카메라 무브는 1개만: push-in만, pan만, orbit만 (초보일수록 안정)
- 일관성은 이미지로 잡기: 텍스트로 사람을 고정하려 하지 말고, 기준 프레임을 넣기
- 길이는 샷 단위로 쪼개기: 5~8초 컷 여러 개 + 편집으로 연결
- 텍스트/로고는 영상 밖에서: 영상 안 글자 생성은 실패 확률을 올릴 수 있음
자주 묻는 질문 (FAQ)
누가 Runway Gen-2를 결제까지 고려하면 좋을까요?
광고 느낌의 시네마틱 컷이 필요하고, 짧은 클립을 여러 개 만들어 편집으로 완성할 수 있는 분에게 잘 맞아요. 특히 “아이디어를 영상으로 바로 확인”해야 하는 기획/마케팅 성격의 작업에서 체감이 큽니다. 단, 크레딧 소진 속도는 미리 계산해보는 게 좋아요. (Runway Pricing)
무엇이 Luma Dream Machine의 강점인가요?
이미지 한 장을 기반으로 영상화를 빠르게 하고, 기본 4초 클립을 Extend로 늘리면서 이미지 키프레임을 목적지처럼 붙여 “장면 이동”을 연출할 수 있다는 점이 강점입니다. (Luma Keyframes)
언제 텍스트→비디오보다 이미지→비디오를 선택하는 게 유리할까요?
캐릭터 일관성, 특정 구도 유지, 특정 스타일 유지가 중요할 때입니다. 이미지는 구도/조명/스타일을 고정해주고, 프롬프트는 모션과 카메라를 지시하는 역할로 분리하는 게 안정적이에요. (Runway Prompting Guide)
어디서 Runway 크레딧 계산 방식을 확인할 수 있나요?
Runway 도움말의 “How do credits work?” 문서에서 모델별 예시와 초당 비용 구조를 확인할 수 있습니다. (Runway Credits 안내)
왜 캐릭터 일관성이 유지되지 않나요?
텍스트만으로는 인물의 세부 특징이 샷마다 흔들릴 수 있어요. 따라서 기준 프레임(이미지)을 넣고, 손/눈처럼 깨지기 쉬운 요소는 모션을 “subtle”로 제한하는 방식이 현실적으로 더 안정적입니다.
어떻게 비용을 덜 쓰면서도 ‘길고 자연스러운’ 영상을 만들 수 있나요?
한 번에 길게 뽑기보다, 짧은 컷(5~8초)을 여러 개 만들고 편집으로 연결하는 방식이 비용 대비 결과가 좋아요. 그리고 텍스트/로고는 영상 안에서 생성하지 말고, 편집툴 자막으로 처리하면 실패 확률이 줄어듭니다.