A unified model for continuous conditional video prediction

Ye, Xi; Bilodeau, Guillaume-Alexandre

Computer Science > Computer Vision and Pattern Recognition

arXiv:2210.05810 (cs)

[Submitted on 11 Oct 2022 (v1), last revised 6 Apr 2023 (this version, v2)]

Title:A unified model for continuous conditional video prediction

Authors:Xi Ye, Guillaume-Alexandre Bilodeau

View PDF

Abstract:Different conditional video prediction tasks, like video future frame prediction and video frame interpolation, are normally solved by task-related models even though they share many common underlying characteristics. Furthermore, almost all conditional video prediction models can only achieve discrete prediction. In this paper, we propose a unified model that addresses these two issues at the same time. We show that conditional video prediction can be formulated as a neural process, which maps input spatio-temporal coordinates to target pixel values given context spatio-temporal coordinates and context pixel values. Specifically, we feed the implicit neural representation of coordinates and context pixel features into a Transformer-based non-autoregressive conditional video prediction model. Our task-specific models outperform previous work for video future frame prediction and video interpolation on multiple datasets. Importantly, the model is able to interpolate or predict with an arbitrary high frame rate, i.e., continuous prediction. Our source code is available at \url{this https URL}.

Comments:	Accepted by CVPR2023 Workshop
Subjects:	Computer Vision and Pattern Recognition (cs.CV)
Cite as:	arXiv:2210.05810 [cs.CV]
	(or arXiv:2210.05810v2 [cs.CV] for this version)
	https://doi.org/10.48550/arXiv.2210.05810

Submission history

From: Xi Ye [view email]
[v1] Tue, 11 Oct 2022 22:26:59 UTC (4,924 KB)
[v2] Thu, 6 Apr 2023 17:00:54 UTC (14,282 KB)

Computer Science > Computer Vision and Pattern Recognition

Title:A unified model for continuous conditional video prediction

Submission history

Access Paper:

References & Citations

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators

Computer Science > Computer Vision and Pattern Recognition

Title:A unified model for continuous conditional video prediction

Submission history

Access Paper:

References & Citations

BibTeX formatted citation

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators