precisamente 2024
Crear videos de personajes editables con texto y pose controlable es extremadamente necesario para crear diferentes personajes digitales. Sin embargo, esta tarea se vio limitada por la falta de un conjunto de datos completo que contenga subtítulos emparejados para poses de video y modelos generativos previos para los videos. En este trabajo diseñamos un nuevo escenario en dos fases. Presentamos FoundationPose, un modelo unificado de base D para estimación y seguimiento de la pose de objetos que admite configuraciones basadas y sin modelos. Nuestro enfoque se puede aplicar inmediatamente a un nuevo objeto tras la prueba sin modificaciones, siempre que se proporcione su modelo CAD o se adquiera un número limitado de imágenes de referencia. Cerremos la brecha,