Meta 发布首个非参数化掩码语言模型 NPM:那年双手插兜,不知道什么叫做 out of vocabulary 虽然大型语言模型在 NLP 领域展现出的强大性能十分惊人,但其带来的负面代 … Continue reading Meta 发布首个「非参数化」掩码语言模型 NPM :吊打 500 倍参数量的 GPT-3
标签: 语料库
Facebook开源最大规模并行语料,45亿规模
雷锋网AI科技评论按:当前自然语言处理中的大多数方法都是数据驱动的,大多数多语言模型(特别是神经机器翻译系统)都需要并行语料库进行训练。大多数的并行文本都只是适用于几个主要语言(例如英语、汉语),且限 … Continue reading Facebook开源最大规模并行语料,45亿规模