5 月 12 日消息,艾伦人工智能研究所(AI2)、AMD 和 Large Unified Modern Infrastructure 合作,计划在 2024 年大规模研究型开放语言模型(OLMo)。
注:包括 PaLM 2、GPT-4 在内,当前生成式 AI 所用模型大部分都隐藏在 API 后面,研究人员无法确切查看内部信息。因此越来越多的社区正尝试创建开源 AI 模型。
AI2 的 NLP 研究高级主管 Hanna Hajishirzi 表示:“研究和技术社区需要通过访问开放的语言模型,进一步推动 AI 发展。通过 OLMo,我们正在努力通过建立有竞争力的语言模型来缩小公共和私人研究能力和知识之间的差距”。
AI2 不仅仅将 OLMo 视为一个模型,而是一个开放平台,允许研究社区使用 AI2 创建的所有组件,并通过开源的方式进行改进。
Hajishirzi 说,AI2 为 OLMo 制作的演示、训练数据集和 API 等所有内容将公开提供。