Swin Transformer(Swin这个名字代表移位窗口)最初是在arxiv中描述的,它能够作为计算机视觉的通用骨干。它基本上是一个分层的Transformer,其表示是用移位窗口计算的。移位窗口方案将自关注计算限制在不重叠的局部窗口,同时允许跨窗口连接,从而提高了效率。
论文:[《Swin Transformer: Hierarchical Vision Transformer using Shifted Windows》](http://arxiv.org/abs/2103.14030)
开源模型链接:https://github.com/microsoft/Swin-Transformer.git
数据集(ImageNet):http://www.image-net.org/