谷歌研究相关文章列表 - 编程部落

谷歌发布最新看图说话模型：可实现零样本学习，多类型任务也能直接上手

谷歌新推出了弱监督看图说话模型 SimVLM，能够轻松实现零样本学习（zero-shot）任务迁移。从文字描述图像到回答图片相关问题，模型无需微调也能样样精通。对于一般的视觉语言预训练（VLP）模 … Continue reading 谷歌发布最新看图说话模型：可实现零样本学习，多类型任务也能直接上手