”patch“ 的搜索结果

     咋眼看说去像是用大卷积核操作, 实际上只是借用它的方式, 最后在图像长宽维展平为一位再和第768个patch维对调实现了图像embedding , 秒啊~~3的图像达成196个patch,每个patch的size为768 ,即768维一维张量....

10  
9  
8  
7  
6  
5  
4  
3  
2  
1