FFmpeg 之父发布音频压缩工具 TSAC,3.5 分钟立体声歌曲压缩至 192 KiB

感谢网友 地板轰鸣 的线索投递!

4 月 12 日消息,FFmpeg 之父法布里斯・贝拉(Fabrice Bellard)发布音频压缩工具 TSAC 。

TSAC 可以把音频比特率压缩达到非常低,对于 44.1 kHz 的音频,TSAC 可压缩至单声道 5.5 kb / s 或立体声 7.5 kb / s,同时保持良好的听感。TSAC 号称可以将 3.5 分钟的立体声歌曲压缩为 192 KiB 的文件

TSAC 官网提供了一系列原声与压缩片段,供用户对比试听:https://bellard.org/tsac/

TSCA 基于为立体声扩展的 Descript 音频编解码器的修改版本和 Transformer 模型,以进一步提高压缩比,两种模型都量化为每个参数 8 位。

因为压缩过程需要调用 CUDA,所以须使用英伟达 GPU。如果只使用 CPU,压缩速度会非常慢,且 CPU 必须支持 AVX2 指令集。

TSCA 的作者法布里斯・贝拉,是一位业内非常著名的计算机程序员,附法布里斯・贝拉介绍:

法布里斯・贝拉,1972 年生于法国格勒诺布尔(Grenoble)。在高中就读期间开发了著名的可执行压缩程序 LZEXE,这是当年 DOS 上第一个广泛使用的文件压缩程序。大学就读于巴黎综合理工学院,后在巴黎高等电信学校攻读。

1997 年他提出了最快速的计算圆周率的算法。2000 年他创建了 FFmpeg 项目,这是一个领先的开源多媒体框架,大部分媒体播放器均使用该框架。他的另一个重要贡献是编写了 QEMU,这是一个高速度及跨平台的开源模拟器。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平