谷歌发布最新看图说话模型:可实现零样本学习,多类型任务也能直接上手

谷歌新推出了弱监督看图说话模型 SimVLM,能够轻松实现零样本学习(zero-shot)任务迁移。 从文字描述图像到回答图片相关问题,模型无需微调也能样样精通。 对于一般的视觉语言预训练(VLP)模 … Continue reading 谷歌发布最新看图说话模型:可实现零样本学习,多类型任务也能直接上手