2025年05月21日 11 阅读 大语言模型 Vision Transformer(ViT)阅读笔记 1. 什么是ViTTransformer模型最初是为了处理序列数据(如文本)而设计的,它本身无法处理二维的图像,因此,为了使其能处理图像任务,便提出了Vision Transformer这个结构...