A fecha del 17 de mayo de 2026, Wan 2.7 tiene una ruta oficial para convertir una imagen en vídeo. La primera decisión no es el prompt, sino dónde se ejecuta el trabajo. Usa Alibaba Cloud Model Studio cuando necesites el contrato oficial de wan2.7-i2v, usa un proveedor con API wrapper cuando quieras probar rápido y puedas aceptar sus reglas, y usa una herramienta no-code solo cuando su política de subida, créditos y exportación encaje con el activo.
| Ruta | Mejor primer uso | Qué comprobar antes de subir |
|---|---|---|
| API oficial de Model Studio | integración reproducible, backend, contrato oficial del modelo | región, API key, model ID, roles de media, duración, resolución y facturación |
| Proveedor con API wrapper | prueba rápida, gateway unificado, menos fricción de integración | precio, créditos, jobs fallidos, cola, almacenamiento, soporte y retención del output URL |
| Herramienta no-code | previsualización manual, creatividad, revisión visual | derechos de subida, créditos, marca de agua, exportación, uso comercial y límites de cuenta |
No conviertas el precio, los créditos gratis, la promesa de 4K, la cola rápida, la política de fallos o las reglas de subida de un proveedor en una regla oficial de Wan 2.7. El ancla oficial de API es wan2.7-i2v. Todo lo demás pertenece a la ruta que lo ofrece.
Después de elegir la ruta, elige el modo de entrada. Usa first-frame si solo tienes una imagen, first-and-last-frame si el final debe estar controlado, first_clip si quieres continuar un vídeo existente y driving_audio cuando el ritmo o la voz realmente guían el movimiento. El prompt llega después de esa decisión.
Primero elige la ruta, luego ajusta parámetros
La ruta decide quién responde cuando algo falla. En Model Studio revisas model ID, región, estado asíncrono, media, duración, resolución y facturación de la cuenta. En un proveedor, las primeras preguntas cambian: saldo, cola, política de jobs fallidos, almacenamiento de archivos, retención del vídeo, límites de concurrencia y soporte.
En un equipo real, esas rutas suelen mezclarse. Un desarrollador lee la documentación oficial, otro prueba un gateway porque es más rápido, y un diseñador sube la misma imagen a una herramienta visual. Eso no está mal, pero cada ruta debe conservar su responsabilidad. La documentación de Alibaba Cloud define hechos oficiales del modelo. El proveedor define su precio, cola, almacenamiento y soporte. La herramienta de creación define su experiencia de subida y exportación.
Usa la API oficial cuando el resultado entra en un producto, un flujo de cliente, una cola automática o una comparación que deba repetirse. Así puedes guardar task id, región, modelo, source URL, parámetros y resultado final. Usa un proveedor cuando el equipo necesita saber rápido si una imagen tiene potencial de movimiento. Usa no-code cuando el trabajo es exploratorio y manual, no cuando una imagen privada o con licencia se sube sin revisar términos.
La regla práctica es ruta antes que prompt. Un prompt excelente no arregla una API key de la región incorrecta, un archivo que el endpoint no puede leer, una URL temporal que caduca o una política de proveedor que cobra de forma distinta a la ruta oficial.
Qué cubre oficialmente wan2.7-i2v
Si necesitas el contrato oficial, empieza por wan2.7-i2v. La documentación actual de Alibaba Cloud Model Studio lista ese model ID como la ruta Wan 2.7 de imagen a vídeo. No copies ejemplos antiguos de Wan I2V sin comprobarlos: en 2.7 cambian el model ID, la forma de entrada y las capacidades que conviene citar.

La ruta 2.7 I2V cubre varias tareas. First-frame generation anima desde una imagen inicial. First-and-last-frame generation usa una imagen inicial y una final, útil cuando la pose, el objeto o la composición final importan. Video continuation usa un clip existente como contexto para continuar el movimiento y el estilo.
La API no se entiende como un único campo genérico de imagen. En wan2.7-i2v, los activos entran en un array media con roles. Los más importantes son:
Rol de media | Cuándo usarlo | Precaución práctica |
|---|---|---|
first_frame | una imagen debe iniciar el vídeo | el sujeto debe ser claro y no depender de texto pequeño |
last_frame | el final debe quedar controlado | la imagen final debe compartir escena, luz e identidad visual |
driving_audio | voz, música o ritmo importan | el audio debe ser corto, limpio y coherente con la acción visible |
first_clip | necesitas continuar un clip existente | mantén proporción, estilo y dirección de cámara |
Las imágenes fuente deben estar disponibles por URL y cumplir los límites actuales de formato, tamaño, dimensiones y proporción de la referencia oficial. Para la ruta 2.7 I2V comprobada, la documentación admite salidas tipo 720P/1080P y duraciones de 2 a 15 segundos. Esos son hechos de la ruta oficial, no promesas universales de cualquier proveedor.
La región también forma parte del contrato. Las rutas internacionales y de China continental pueden usar endpoints y claves distintos. Si la API key, la región de la cuenta y el endpoint no coinciden, el fallo no se arregla reescribiendo el prompt. Lo mismo ocurre cuando la URL de imagen no es accesible desde el servicio.
La facturación necesita una frontera clara. La guía oficial actual describe cobro por segundos de vídeo generados con éxito y no cobra las llamadas o procesos que fallan. Aun así, no publiques un precio fijo por segundo si no lo has vuelto a confirmar en la página oficial de precios. Los créditos, descuentos, pruebas gratis o cargos de un proveedor pertenecen al proveedor.
El modo de entrada viene antes del prompt
Muchos malos resultados no vienen de un prompt pobre, sino de un modo de entrada equivocado. Una sola imagen no controla con precisión el final. Un prompt no sincroniza labios si no hay audio útil. Un clip que quieres continuar no se debe tratar como una imagen estática normal.

Empieza con first_frame si tienes una sola imagen y quieres una prueba simple. Es adecuado para un movimiento de cámara suave, agua, nubes, luz, un giro de producto o un gesto pequeño. La desventaja es que el modelo tiene más libertad para decidir el final, así que no lo uses para una llegada exacta.
Usa last_frame cuando el estado final importa. Un producto que debe abrirse, un personaje que debe terminar en una pose concreta o un objeto que debe llegar a una posición determinada necesita una imagen final. La primera y la última imagen deben pertenecer al mismo mundo visual: luz, escala, composición e identidad.
Usa first_clip para continuar movimiento. No es un modo mágico para cualquier tarea. Si el clip de partida está comprimido, se mueve de forma inestable o no coincide con el aspect ratio objetivo, la continuación hereda esos problemas.
Añade driving_audio cuando el audio realmente controla timing, voz, música o ritmo. El audio no rescata una imagen ambigua. Primero debe quedar claro qué sujeto se mueve y cómo; luego el audio puede ayudar a ordenar el ritmo.
Un primer prompt útil suena más a instrucción que a frase decorativa:
textAnimate the source image into a 5-second realistic video. Subject: the product stays sharp and centered. Motion: soft studio light moves across the surface; no new object appears. Camera: slow push-in, stable, no shake. Avoid: warped logo, extra text, fast transformation.
Ese prompt no es una garantía. Su función es reducir los fallos de primera ronda: movimiento excesivo, objetos nuevos, cámara temblorosa, identidad perdida o deformación de logos. Cuando el resultado base es estable, ajusta estilo y ritmo en pasos pequeños.
Implementa la API como trabajo asíncrono
La generación de vídeo no debería ser una función que devuelve un archivo de inmediato. Un backend fiable envía el job, guarda el task id, consulta estado, toma el result URL, copia el vídeo a su propio almacenamiento y conserva metadatos suficientes para explicar el resultado.
En la ruta oficial, respeta la invocación asíncrona y vincula endpoint, región y autenticación a la documentación actual de Model Studio. No mezcles ejemplos de región internacional y China continental sin explicar el límite, porque los errores de región son difíciles de diagnosticar después.
Un payload mínimo puede verse así:
jsconst payload = { model: "wan2.7-i2v", input: { prompt: "Slow camera push, soft cloud movement, stable subject.", media: [ { type: "first_frame", url: "https://example.com/source-image.png" } ] }, parameters: { resolution: "1080P", duration: 5 } };
En producción, registra más que el prompt. Guarda route owner, model ID, roles de media, source asset key, región, endpoint, duración, resolución, task id, estado final, result URL y decisión de almacenamiento. Si usas proveedor, añade provider job id, unidad de crédito, estado de cola, regla de fallo y retención del output URL.
| Campo a registrar | Por qué importa |
|---|---|
| route owner | separa API oficial, wrapper y app no-code |
| model ID | confirma wan2.7-i2v y evita rutas Wan antiguas |
| media roles | explica first_frame, last_frame, driving_audio y first_clip |
| region and endpoint | detecta claves o endpoints incorrectos |
| duration and resolution | conecta calidad, coste y forma de salida |
| task id and status | sirve para reintentos, soporte y auditoría |
| output storage | evita depender de una URL temporal |
Cuando un job falla, no reescribas el prompt primero. Clasifica el fallo: autenticación, región, URL inaccesible, archivo no soportado, role name incorrecto, duration, resolution, cola, procesamiento del modelo o política del proveedor. El prompt se toca cuando la solicitud ya es válida.
Audita proveedores y herramientas no-code como rutas separadas
Un proveedor puede ser la forma más rápida de probar Wan 2.7. Puede ofrecer una interfaz en el navegador, un gateway de varias APIs, ejemplos listos, pago más cómodo o SDKs. Esas ventajas son reales, pero no definen el contrato oficial de Alibaba.
Antes de pagar o subir material privado, responde estas preguntas:
| Pregunta | Por qué importa |
|---|---|
| ¿Qué modelo y versión dice usar? | evita que una ruta antigua se venda con el mismo nombre |
| ¿Quién define el precio y la unidad? | los créditos del proveedor no son el precio oficial |
| ¿Qué pasa con jobs fallidos? | reembolso, recargo y repetición cambian por ruta |
| ¿Dónde quedan las subidas? | imágenes de clientes y personas necesitan reglas claras |
| ¿Cuánto dura el output URL? | una URL temporal puede romper CMS o previews |
| ¿Hay watermark o compresión? | puede servir para borrador pero no para entrega final |
Las herramientas no-code pasan por el mismo filtro. Son buenas para que un diseñador, editor o marketer vea movimiento antes de pedir una integración. Son débiles para automatización si la cuenta, la cola, los derechos, el export y la retención no son controlables.
Trata al proveedor como una ruta, no como la fuente de todos los hechos. Puede ayudarte a empezar más rápido, pero las preguntas oficiales sobre wan2.7-i2v, roles de entrada, duración, resolución y errores siguen perteneciendo a la documentación oficial.
Prepara la imagen y el prompt antes de gastar créditos
La imagen fuente es el primer fotograma del contrato. Si está borrosa, muy comprimida, demasiado recortada, llena de texto pequeño o con un sujeto ambiguo, el modelo debe inventar estabilidad antes de inventar movimiento.

Para el primer test, usa una imagen con sujeto claro, espacio para moverse, luz estable y pocos detalles que deban permanecer perfectos. Personas, productos, logos y texto pequeño son más difíciles que agua, nubes, luz o fondos amplios. En trabajos comerciales, prioriza identidad estable antes que movimiento dramático.
Escribe el prompt como una lista de decisiones: sujeto, movimiento, cámara, ritmo, estilo y restricciones. Un vídeo de 5 segundos suele necesitar una acción principal y un movimiento de cámara. Pedir transformación de producto, cambio de fondo, varias acciones y giro de cámara a la vez suele producir resultados frágiles.
En cada repetición guarda ruta, modo, tamaño de imagen, prompt version, duración, resolución, task id, provider job id y evaluación del resultado. Sin ese registro no sabrás si la mejora viene de una imagen más limpia, otro modo, otro proveedor, otro prompt o simple variabilidad del modelo.
Diagnostica por rama, no por intuición
Si la solicitud falla antes de procesarse, revisa API key, endpoint, región, model ID, URL de imagen, formato, tamaño, proporción, roles de media, duration y resolution. En proveedor, añade saldo, límite de subida, queue timeout, proxy error y traducción de errores del proveedor.
Si el job termina pero el movimiento es débil, simplifica la escena. Usa un sujeto, una cámara y una duración corta. Si el final debe estar controlado, cambia a first-and-last-frame en lugar de intentar describir el final con más texto.
Si el sujeto pierde identidad, reduce movimiento y usa una imagen más limpia. Caras, manos, logos y texto pequeño son más sensibles que agua, nubes, iluminación o movimiento de fondo. Para uso comercial, elige la salida que conserva el activo, no la más espectacular.
Si el resultado de un proveedor difiere de la ruta oficial, no concluyas todavía que el modelo cambió. El proveedor puede aplicar presets, compresión de subida, defaults de duración, retries o post-processing. Compara solo cuando route, model ID, mode, duration, resolution, source image y prompt estén alineados.
Si el vídeo deja de abrir, revisa retención y almacenamiento. Muchas rutas devuelven una URL que debe descargarse o copiarse. La generación no está completa hasta que el producto controla el archivo que mostrará al usuario.
Cuándo mirar Gemini, Kling u otra ruta
Wan 2.7 es una buena primera ruta cuando necesitas Alibaba Cloud, wan2.7-i2v o un proveedor construido sobre Wan. Si el equipo evalúa flujos de Google, el Gemini image-to-video tutorial es una rama más cercana. Si necesitas el ecosistema Kling/Kuaishou, consulta la guía en inglés Kling AI image-to-video API guide, porque no hay una versión local equivalente en este sitio.
La comparación debe ser práctica. Mantén Wan 2.7 si la ruta, cuenta, región, coste, estilo de salida y trazabilidad encajan con el trabajo. Cambia cuando otra familia ofrezca un contrato más claro, mejor acceso regional, facturación más simple o resultados superiores con la misma source image.
No compares por demos aisladas. Usa la misma imagen, duración, aspect ratio, prompt, criterios de evaluación y registro de fallos. Solo así puedes separar calidad real de presets, proveedor, post-processing o suerte de una ejecución.
Checklist mínimo antes de publicar o integrar
Antes de recomendar Wan 2.7 I2V en una página, documento o producto, ejecuta una prueba reproducible. Elige una source image limpia y registra route, mode, prompt, duration, resolution, task id, output URL, coste y almacenamiento final. Para proveedor, guarda provider job id, unidad de saldo, failed-job rule y retención de URL.
En el equipo, separa tres SOP. La API oficial se usa para trabajo reproducible y registros claros. El proveedor se usa para velocidad, pago o gateway conveniente, con condiciones propias. La herramienta no-code se usa para preview manual y no debe recibir material sensible sin revisión de política.
Revisa los hechos volátiles antes de publicar: model ID, roles de entrada, duración, resolución, límites de archivo, región, endpoint, precio, créditos gratis, 4K, fallos cobrados y retención de resultados. Si el dato afecta dinero, subida de material o producción, no se escribe desde memoria.
Preguntas frecuentes
¿wan2.7-i2v es la ruta oficial de imagen a vídeo?
Sí. La documentación actual de Alibaba Cloud Model Studio lista wan2.7-i2v como el model ID oficial de Wan 2.7 para imagen a vídeo. Un proveedor puede ofrecer una entrada más cómoda, pero no cambia el ancla oficial.
¿Wan 2.7 imagen a vídeo es gratis?
No lo afirmes sin revisar la ruta concreta. La guía oficial describe facturación por segundos de vídeo generados con éxito. Un proveedor puede tener créditos de prueba, suscripción o saldo propio. Una herramienta no-code puede cobrar por exportación.
¿La ruta oficial soporta 4K?
La documentación oficial comprobada para 2.7 I2V habla de salidas tipo 720P/1080P y duraciones de 2 a 15 segundos. Trata cualquier promesa de 4K como específica de una ruta hasta que la referencia oficial actual la confirme.
¿Con qué modo de entrada empiezo?
Si tienes una sola imagen, empieza con first_frame. Usa last_frame cuando el final importa, first_clip cuando quieres continuar un vídeo, y driving_audio cuando voz o música determinan el ritmo.
¿Es seguro usar un proveedor con API wrapper?
Puede ser útil para pruebas de bajo riesgo. Para imágenes de clientes, personas, productos no publicados o uso comercial, revisa almacenamiento de subida, uso de datos, derechos de salida, fallos cobrados, soporte y retención de URL.
¿Por qué mi resultado se ve peor que una demo?
Las causas comunes son imagen fuente débil, demasiado movimiento, modo de entrada incorrecto, cámara poco clara, archivo comprimido o preset del proveedor. Simplifica a una escena corta con una sola acción y compara parámetros antes de culpar al modelo.
¿Wan 2.7 o Kling para I2V?
Elige Wan 2.7 cuando necesitas Alibaba Cloud, wan2.7-i2v o una ruta basada en Wan. Elige Kling si tu equipo necesita el ecosistema Kling o ya tiene integración. Una comparación justa requiere la misma imagen, duración, aspect ratio, prompt y criterios de revisión.
