原标题:昨夜,微软甩出 10 项硬核新品!28.5 万个核心的 AI 超算机,最大语言模型开源
文/韦世玮、董温淑
来源:智东西
看点:微软砸 10 亿美元扶持的超算来了,一文看尽昨夜 Build 大会十大看点!
智东西 5 月 20 日消息,昨晚,一年一度的微软 Build 开发者大会拉开序幕。与往常不一样的是,大会的舞台从往年的美国西雅图搬到了线上,同时发布的新产品和新升级也几乎面向开发者,成为开发者们的“独家盛宴”。
毫不意外,今晚大会仍以微软现任 CEO 萨蒂亚·纳德拉(Satya Nadella)的主题演讲作为开场。在短短的 20 多分钟演讲中,“开发者”、“Azure”、“Microsoft 365”和“Windows”等关键词贯穿全场,尤其是“开发者”。
他谈到,目前 GitHub 上的开发者已超过 5000 万人,Power Platform 上的开发者也超过了 350 万人。而微软也将为开发者提供一系列提高工作效率的开发工具和解决方案,进一步提升生产力。
围绕开发者,本次微软 Build 大会的核心亮点如下:
1、宣布与 OpenAI 合作开发的 AI 超级计算机,专门用于训练大规模分布式 AI 模型。
2、推出面向医疗行业的 Microsoft Cloud for Healthcare,提升医疗护理团队的协作、决策和操作效率。
3、推出针对工业系统的 AI 开发平台 Project Bonsai,以及 Project Moab 实验平台。
4、推出 Windows 开发者平台 Project Reunion,统一 UWP 和 Win32 的现有 API。
5、升级 DeepSpeed 库,主要面向深度学习领域,并开源史上最大语言模型——微软图灵模型。
6、发布 Azure Synapse Link,可对实时运营数据进行分析。
7、WSL 2 新增特性,包括对 GPU、Linux GUI 应用程序的支持,以及简化安装体验。
8、推出 Microsoft Teams 平台功能更新,包括为开发人员提供流线型体验。
9、开源并升级 Fluid Framework,提供 Fluid 组件和 Fluid 工作区。
10、提供负责任的机器学习工具,以减少不公平性。
除此之外,微软推出命令行界面 Windows Package Manager,帮助开发者快速搜索、查看和安装各类管理工具。同时,微软 Chromic 内核的浏览器 Edge 也新增了侧边栏搜索、同步等新功能。
值得一提的是,微软还宣布收购机器人流程自动化(RPA)创企 Softomotive,以将 RPA 技术引入 Power Automate。
AI 超级计算机亮相,针对大规模分布式 AI 模型训练
2019 年 7 月,微软宣布向人工智能研究实验室 OpenAI 投资 10 亿美元,以共同构建一个新的 Azure AI 超算平台,将主要用于训练和运行更加先进的 AI 模型,其中包括基于微软 Azure AI 超算技术。同时,这笔投资也将进一步帮助 OpenAI 开发 AGI(通用人工智能)技术。
历时一年,这台超级计算机终于在今晚亮相,主要用于大规模分布式 AI 模型训练。
微软声称,这台超级计算机的性能位列全球前五,共包含 28.5 万个 CPU 核心和 1 万个 GPU,每个 GPU 网络带宽为 400Gb/s。
由于在 Azure 中托管,这台超级计算机已经能够实现一系列现代云基础架构的功能,包括快速部署、可持续的数据中心,以及对所有 Azure 服务进行访问。
经研究人员实验,该超级计算机已经能够实现大规模 AI 模型训练,可深入了解语言语法、知识概念和上下文内容的细微差别。同时,它还可以总结冗长的对话、在实时游戏中进行适度对话、解析复杂的法律文件,甚至通过搜索 GitHub 生成代码。
目前,微软已使用图灵模型来改善 Bing、Office、Dynamics 和其他生产力产品的语言理解功能。例如,在 Bing 中,该模型生成文字和回答问题的速度提高了 125%。
微软表示,其将通过 Azure AI 服务和 GitHub,进一步将大规模 AI 模型、训练优化工具和超级计算机资源释放出来,让开发者、数据科学家和商业客户都能轻松利用 AI 的力量。
Microsoft Cloud for Healthcare:提升医疗护理效率
在微软看来,今年新型冠状病毒疫情的大流行几乎影响了人们生活的方方面面,同时也阻碍了医疗保健业务的正常运行,大大降低了患者治疗和护理的效率。
针对这一问题,推出了其首个针对特定行业的云产品——Microsoft Cloud for Healthcare,支持微软 Teams 中的新 Bookings 应用程序,护理人员能够在 Teams 中安排、管理和进行患者的虚拟就诊,并提供相应服务,进一步增强患者沟通、护理团队的协作和管理效率。
与此同时,用户还可以使用 Microsoft Cloud for Healthcare 来扩展 Microsoft Dynamics 365 Marketing、Dynamics 365 客户服务和 Azure IoT 价值,以进行患者体验、医生转诊管理、患者检测等部署。
其中,基于 Microsoft Cloud for Healthcare 扩展的 Microsoft Healthcare Bot 服务,自今年 3 月以来已有超 1600 个 COVID-19 机器人实例投入使用,服务了 23 个国家的 3100 万人,进一步减轻相关疾病预防控制中心的紧急热线压力。
工业系统 AI 开发平台 Project Bonsai
简单地说,Project Bonsai 是一个用于构建自主工业控制系统的 AI 平台,也是一项“机器教学”服务,它结合机器学习、校准和优化功能,能够为制造、化工、建筑、能源和采矿等行业机械的核心控制系统提自主化,以更好地管理各类工业设备。
Project Bonsai 通用强化学习平台能够协调 AI 模型的开发,为 AI 模型的部署和训练提供了针对算法和基础设施的访问,允许模型在本地、设备或云上部署,并支持 MATLAB Simulink、Transys、Gazebo 和 AnyLogic 等模拟器。
此外,用户能够在 Project Bonsai 的仪表盘上查看所有工作和训练状态,对模型进行调试、检查和改进。同时,Project Bonsai 还支持多用户协作构建和部署新模型。
与此同时,针对想要尝试 Project Bonsai 的工程师和开发者,微软还开发了一款名为 Project Moab 的硬件设备。
它是一个具有三个手臂、一个操纵杆控制器的机器人,能够让一颗小球在顶部的透明板上保持平衡。该工具为用户提供了一个模拟环境,让用户借助模拟器进行实验。
Project Reunion:统一 Windows 应用生态平台
微软此次推出 Windows 开发者平台 Project Reunion,主要目的就是在于统一 Windows 的应用生态平台,通过融合 Universal Windows Platform(UWP)和 Win32 的现有 API,让开发者能够摆脱不同操作系统之间的限制,轻松实现跨平台开发。
微软将在两者间添加更多通用的 API 和可互操作代码。这将为应用程序提供一个通用平台,帮助用户使用最新功能更新,以及现代化现有应用程序,无论是C++、.NET(包括 WPF、Windows Forms、UWP),还是 React Native。
此外,微软还面向企业用户推出了 Windows Terminal 1.0,能够让用户在多个选项卡和窗格中运行任何命令行可执行文件,包括 WSL 发行版和 Azure Cloud Shell。
DeepSpeed 库升级,微软图灵模型开源
早在今年 2 月,微软发布了 DeepSpeed 的开源版本,并同步推出了 ZeRO(零冗余优化器)。
DeepSpeed 主要为跨多台服务器进行分布式模型训练而设计,ZeRO 是一种将大型模型拟合到内存中的技术,通过减少数据并行中的内存冗余以实现结果。
ZeRO-1 包含模型状态内存优化,ZeRO-2 则提供了激活内存和碎片内存的优化。同时,ZeRO-2 还针对单个 GPU 上的训练模型进行了改进。据悉,ZeRO-2 训练模型的速度比谷歌 BERT 提升 30%。
微软表示,ZeRO 的内存优化技术能够训练具有 170 亿个参数的机器学习模型,如拥有 170 个参数的微软图灵模型,它是目前世界上最大的语言 AI 模型,主要用于自然语言生成(NLG)。
值得一提的是,微软宣布将在短期内开源微软图灵模型,以及在 Azure 机器学习中训练它们的方法。DeepSpeed 库的升级,也将让开发者能够使用 ZeRO-2 来训练大型神经网络。
Azure Synapse Link:可对实时运营数据进行分析
Azure Synapse Link 能够让用户通过 Azure Synapse Analytics 中的实时操作数据,直接获得分析结果,无需进行提取、转换或加载步骤。同时,它还能将实时数据与现有的分析存储库结合,以获得相关业务的整体视图。
此外,Azure Synapse Link 可以在 SQL 行的指导下以“PB 级”速度查询数据,具有智能工作负载管理和并发功能,可以实时优化查询性能。
在安全性方面,Azure Synapse Link 具有自动威胁检测和始终在线数据加密功能,具备动态数据屏蔽、细粒度访问控制和列级/行级安全性。
据悉,Azure Synapse Link 最初将在 Azure Cosmos DB 中发布,但很快就会应用到所有的操作系统中,进一步帮助开发者降低成本并减少时间。
WSL 2 新增对 GPU、Linux GUI 应用程序的支持
WSL 2 新增几项特性,包括对 GPU、Linux GUI 应用程序的支持,以及简化安装体验。
一方面,WSL 2 支持 GPU 计算工作流,使 Linux 工具能够利用 GPU 为一系列开发场景进行硬件加速,例如并行计算、训练 AI 和机器学习模型。该功能将在今年下半年正式更新。
另一方面,WSL 2 将支持 Linux GUI 应用程序,允许用户在打开一个 WSL 实例时直接运行 Linux GUI 应用程序,无需第三方服务器。
今年晚些时候,WSL 2 将支持简化安装体验。届时,开发者能够简单地运行“wsl.exe -install”命令并重新启动。
Microsoft Teams 平台功能
在疫情期间,Microsoft 365 核心组件 Microsoft Team 智能会议平台的使用量出现了大幅度的增长。
今年 4 月,Satya Nadella 谈到,Microsoft Team 的单日参会量已超过 2 亿,产生了超过 41 亿分钟的会议记录。此外,目前 Teams 每天有超过 7500 万活跃用户,其中有三分之二的用户在 Teams 上进行文件共享、协作或交互。
因此,微软针对线上会议的庞大需求,对 Microsoft Teams 进行一系列功能更新,其中包括扩展 Visual Studio 和 Visual Studio Code,让开发者能使用自己熟悉的工具对 Teams 应用进行开发;提供 Power Virtual Agents bot,消除在 Teams 中使用 Power Virtual Agents bot 时,用户重复登录的需要等。
开源并升级 Fluid Framework
2019 年,微软推出了协作平台 Fluid Framework,它能帮助用户更好地进行协作,并增强共享互动体验。
在今晚的大会上,微软宣布将开源 Fluid Framework,同时还针对其协作形式进行一系列升级,主要体现在 Outlook 和 Office.com 中。
一方面,用户可以在网页版 Outlook 中插入图表、任务列表等,使用户的销售数据、项目任务和研究报道等资料保持实时更新;
另一方面,用户可创建和管理 Fluid 工作区,如文档活动源和推荐列表,或在 office.com 中进行搜索。由于 Fluid Framework 组建是轻量级的,因此用户可即时编辑。
提供负责任的机器学习工具
微软人工智能平台副总裁埃里克·博伊德(Eric Boyd)曾指出,如今越来越多的开发人员都被要求构建一个易于解释,且符合非歧视和隐私法规的 AI 系统。
基于此,微软决定在 Azure 机器学习和 OSS 工具包中发布负责任的机器学习工具,通过改善模型的可解释性来减少不公平性,并确保数据隐私和机密性,进一步帮助开发者更负责任地部署 AI 模型。
一方面,它通过将 Fairlearn 与 Azure 机器学习结合使用,让开发者和数据科学家可利用专门的算法来确保每个人都拥有更公平的结果。
另一方面,它通过将新的 WhiteNoise 差异隐私工具包与 Azure 机器学习结合,让数据科学团队能够构建机器学习解决方案,在保护隐私的同时防止个人数据的重新标识。
此外,为了实现安全的模型训练和部署,Azure 机器学习还提供数据和网络保护功能。其中,包括对 Azure 虚拟网络的支持、用于连接机器学习工作区的专用链接,以及客户管理密钥等。
结语:一场面向开发者的技术盛宴
从今晚微软 Build 大会的发布看,微软越来越重视开发者的体验,在为开发者提供越来越便捷和丰富的开发工具时,也更强调他们身上所担起的责任和义务。
其中,微软与 OpenAI 合作开发的 AI 超级计算机面世、首次面向专业领域推出的 Azure 服务、针对工业系统的 AI 开发平台 Project Bonsai、UWP 和 Win32 的统一,以及微软图灵模型等重磅产品推出和升级,无疑展现了微软与开发者之间的彼此依赖、彼此赋能。
随着全球各行各业的数字化转型热潮铺开,微软又将如何在这个过程中进一步探索自己与开发者、与 AI 技术、与产业之间的合作与未来?时间会告诉我们答案。