SwayGen

Multimodal

text-to-videoimage-to-videovideo-to-video

Combina entradas de imagen, vídeo y audio en una sola generación.

Multimodal

Combina entradas de imagen, vídeo y audio en una sola generación.

0/2 fotogramas seleccionadosSube hasta 9 imágenes en total, incluyendo el fotograma inicial y finalMax 10MB per image
Fotograma inicial*
Fotograma final(Opcional)

Upload up to 3 extra videos as multi-modal inputs

0 / 2000

Consejo: Sé detallado y específico para obtener mejores resultados. Describe el sujeto, el estilo, la iluminación, el ambiente y la composición.

Créditos disponibles
--

"Blend uploaded frames, reference clips, and audio into one cinematic short video"

Galería de Ejemplos

Mira lo que puedes crear con multi modal