ViLT: Vision-and-Language Transformer Without Convolution or Region Supervision | 神经影像计算与分析课题组(NICA)

Topic: ViLT: Vision-and-Language Transformer Without Convolution or Region Supervision

Speaker: Cheng Xinyu
Date: 9:00 A.M., Friday, Sep 17, 2021
Place: The Fourth Meeting Room in Intelligent Building

Abstract

ViLT: Vision-and-Language Transformer Without Convolution or Region Supervision

PreviewTips

Download

To download attachments, please log in.

最后修改: 2021/11/30 11:06 | 作者: Cheng Xinyu