HƯỚNG DẪN VIẾT PROMPT TẠO VIDEO
(dành cho người mới bắt đầu)
GIỚI THIỆU
Trong quá trình nghiên cứu và làm việc để làm video từ AI, mình nhận thấy rất nhiều bạn đang gặp vấn đề với việc tạo video bằng AI. Ở thời điểm hiện tại, chi phí để tạo 1 video AI là không phải quá đắt, tuy nhiên có một vấn đề là đa số các bạn chưa làm chủ được ngay từ điều cơ bản là viết prompt, do đó sẽ phải thử lại rất nhiều lần để đạt được video mong muốn, từ đó chi phí tốn kém. Để giúp các bạn hạn chế điều này, mình viết hướng dẫn dành cho các bạn mới bắt đầu có thể hiểu và dần dần hình thành được tư duy để thuần thục kĩ năng tạo video bằng AI.
1. Cách AI Tạo Video Hoạt động
Mặc dù có rất nhiều nền tảng tạo video AI khác nhau trên mạng, nhưng hầu như chúng đều hoạt động theo một quy trình chung, đó là giống với quy trình của sản xuất phim. Và đa số các nền tảng hiện tại thì đều có 2 tính năng cơ bản để thể hiện rõ điều này:
- Text-to-video (chữ thành video): AI đóng vai như một nhà biên kịch và đạo diễn đồng thời
- Image-to-video (ảnh thành video): AI đóng vai trò là đạo diễn
1.1. QUÁ TRÌNH BIÊN KỊCH
Trong giai đoạn này, AI sử dụng các mô hình ngôn ngữ lớn (LLM) để phân tích prompt và tạo ra keyframe - hình ảnh tĩnh quan trọng của video, tương tự như storyboard trong sản xuất phim. Quá trình này bao gồm:
a. Phân tích ngữ nghĩa.
AI phân tích chi tiết từng thành phần trong prompt:
- Nhận diện chủ thể chính và thuộc tính (ví dụ: "cô gái tóc vàng mặc váy đỏ")
- Xác định bối cảnh và môi trường (ví dụ: "trong vườn hoa vào buổi chiều")
- Hiểu các yêu cầu về phong cách và kỹ thuật (ví dụ: "phong cách anime, góc quay từ trên cao")
b. Tạo keyframe
Sinh ra các hình ảnh tĩnh chất lượng cao cho các thời điểm quan trọng
- Đảm bảo tính nhất quán về màu sắc, ánh sáng và bố cục
- Tích hợp các mô tả chuyển động dự kiến vào thiết kế
1.2. QUÁ TRÌNH ĐẠO DIỄN
Sau khi có các keyframe, AI bắt đầu quá trình "đạo diễn" - chuyển đổi từ ảnh tĩnh sang video động. Quá trình này bao gồm:
a. Phân tích chuyển động
- AI tạo ra ma trận chuyển động (motion matrix) cho từng đối tượng
- Tính toán vector chuyển động dựa trên mô tả trong prompt
- Xử lý các ràng buộc vật lý để đảm bảo chuyển động tự nhiên
b. Sinh khung hình trung gian:
- Sử dụng kỹ thuật frame interpolation (nội suy khung hình) để tạo các khung hình giữa các keyframe
- Áp dụng các thuật toán làm mịn chuyển động
- Đồng bộ hóa chuyển động của nhiều đối tượng
c. Hậu kỳ tự động:
- Điều chỉnh màu sắc và ánh sáng để đảm bảo tính liên tục
- Xử lý các hiệu ứng đặc biệt nếu có yêu cầu
- Tối ưu hóa chất lượng video cuối cùng
2. Phương pháp Viết Prompt Hiệu quả
2.1. Text-to-Video
Đối với Text-to-video thì sẽ có cấu trúc cơ bản như sau.
Cấu trúc Prompt cơ bản:
Prompt = Subject (Mô tả chủ thể) + Subject Movement (Chuyển động) + Scene (Khung cảnh) + Camera Language (Góc máy và ánh sáng)
Các thành phần chính:
- Subject: Chủ thể chính trong video, có thể là người, vật, hoặc bất kỳ đối tượng nào
- Subject Description: Mô tả chi tiết về ngoại hình, trang phục, phụ kiện
- Subject Movement: Mô tả chuyển động, trạng thái của chủ thể
- Scene: Môi trường xung quanh, bối cảnh, hậu cảnh
- Camera Language: Kỹ thuật quay phim, góc máy, ánh sáng
Ví dụ prompt hiệu quả:
[Subject & Description] "A young artist with long brown hair, wearing a paint-stained denim apron and white cotton shirt" [Subject Movement] "painting gracefully on a canvas, occasionally stepping back to observe the work, gentle brush strokes" [Scene] "in a spacious sunlit studio, large industrial windows, wooden floors, scattered art supplies and finished paintings" [Camera Language] "smooth tracking shot from left to right, natural lighting with soft shadows, cinematic 4K quality, shallow depth of field" Prompt đầy đủ: "A young artist with long brown hair, wearing a paint-stained denim apron and white cotton shirt, painting gracefully on a canvas, occasionally stepping back to observe the work, gentle brush strokes, in a spacious sunlit studio, large industrial windows, wooden floors, scattered art supplies and finished paintings, smooth tracking shot from left to right, natural lighting with soft shadows, cinematic 4K quality, shallow depth of field"
2.2. Image-to-Video
Đối với Image-to-video thì sẽ có cấu trúc cơ bản như sau.
Cấu trúc Prompt:
CopyPrompt = Subject + Movement + Background + Movement
- Subject: Chủ thể chính trong bức ảnh cần chuyển động, chỉ cần viết đơn giản như mặt, dáng người, tay, chân
- Movement: Mô tả chuyển động, trạng thái của phần chủ thể chính cần chuyển động như xoay sang phải, đổi sáng, vuốt lên tóc
- Background: Môi trường cần có sự thay đổi về chuyển động, ví dụ dòng nước, cây cỏ
- Movement: Mô tả chuyển động của background khi có chuyển động, ví dụ như dòng nước trôi, gió thổi
Ví dụ prompt hiệu quả:
[Subject] "Portrait of a woman, focusing on face and hair" [Subject Movement] "gentle head turn from left to right, subtle smile emerging, hair flowing naturally" [Background] "soft bokeh lights, autumn leaves in background" [Background Movement] "bokeh lights gently twinkling, leaves falling slowly and gracefully" Prompt đầy đủ: "Portrait of a woman, focusing on face and hair, gentle head turn from left to right, subtle smile emerging, hair flowing naturally, soft bokeh lights and autumn leaves in background, bokeh lights gently twinkling, leaves falling slowly and gracefully"
Ví dụ khác cho cảnh thiên nhiên:
[Subject] "Close-up of a red rose in full bloom" [Subject Movement] "slight swaying motion, petals gently moving" [Background] "garden setting with green foliage and morning dew" [Background Movement] "subtle breeze effect on surrounding leaves, dewdrops sparkling" Prompt đầy đủ: "Close-up of a red rose in full bloom, slight swaying motion, petals gently moving, garden setting with green foliage and morning dew, subtle breeze effect on surrounding leaves, dewdrops sparkling"
3. Các Điểm Lưu ý Khi Viết Prompt Mô tả
a. Chuyển động phù hợp
- Chọn chuyển động phù hợp với quy luật vật lý
"leaves falling gently in the wind" (lá rơi nhẹ nhàng trong gió)
- Mô tả chuyển động rõ ràng và đơn giản
"camera panning slowly from left to right" (máy quay pan chậm từ trái sang phải)
- Tránh các chuyển động phức tạp khó thực hiện
"person walking naturally along the beach" (người đi bộ tự nhiên dọc bãi biển)
b. Sử dụng ngôn ngữ đơn giản
- Tránh câu phức tạp
"dog wagging tail happily" (chó vẫy đuôi vui vẻ)
- Dùng từ ngữ rõ ràng, cụ thể
"butterfly landing on red flower" (bướm đậu trên hoa đỏ)
- Tập trung vào một hành động chính
"girl twirling in a white dress" (cô gái xoay trong chiếc váy trắng)"
c. Chuyển động của camera
Đây là một phần rất nhiều người không thường sử dụng trong khi viết prompt tạo video. Dưới đây là các từ khóa về chuyển động camera để viết cho hiệu quả.
Các chuyển động cơ bản:
- Horizontal: Di chuyển ngang
- Vertical: Di chuyển dọc
- Zoom in/zoom out: Phóng to/thu nhỏ
- Pan: Xoay ngang
- Tilt: Xoay dọc
- Roll: Xoay theo trục
Các chuyển động kết hợp (Master Shot):
- Move Left and Zoom In
- Move Right and Zoom In
- Move Forward and Zoom Up
- Move Down and Zoom Out
Chúc các bạn thành công trong hành trình khám phá nghệ thuật viết prompt tạo video AI!