Meta 发布会读唇语的 AI,可提高嘈杂场景的语音识别准确率(已开源)

借助读唇语,人类能够更容易听懂他人的讲话内容,那么 AI 也能如此吗? 最近,Meta 提出了一种视听版 BERT,不仅能读唇语,还能将识别错误率降低 75%。 效果大概就像如下这样,给一段视频,该模 … Continue reading Meta 发布会读唇语的 AI,可提高嘈杂场景的语音识别准确率(已开源)