Meta公布全新开源AI语音压缩技术：号称比MP3压缩率高10倍

11月6日消息，近日，Meta公布了一项名为“EnCodec”的AI语音压缩技术，该技术号称可以64kbps的速度压缩比MP3格式小10倍的音频，同时还能保证不会损失质量。

Meta指出，压缩技术对目前互联网十分重要，借助于此用户可以十分容易的发送高画质图片、语音信息等。不过，发送这些多媒体信息需要充足的带宽和存储空间，尤其是在未来的宇宙时代，因此需要效果更好的压缩技术。

据介绍，“EnCodec”AI训练模型涵盖三个部分，分别为编码器、量化器和解码器。

编码器可将原始数据转换为较低影帧速率的格式，再由量化器将数据压缩到目标大小，最后，解码器通过神经网络对这些数据进行解码。

值得一提的是，虽然此前也有人尝试用神经网络压缩音频，但Meta是首个将此技术用于48kHz立体声的团队。

京东红包(每日三次，最高11111元)：领取>> | 打开京东APP搜索“领红包985”

天猫红包(每日一次，最高22888元)：领取>> | 打开天猫APP搜索“天降红包5656”

Published by