5357CC拉斯维加斯官网主页

MIT新的科技突破:用AI过滤声音,让音乐听起来更洪亮或更柔和

发布时间:2026-01-26 00:10:17

据报道,

麻省理工学院

又出科技新打破,其核算机科学和人工智能实验室的研究人员所研制的新体系 PixelPlayer,可以使用人工智能来区别和过滤声响,让音乐听起来更洪亮或更柔软。

据悉,将指定视频录入经过充沛练习的 PixelPlayer,体系随机可以过滤配乐,一起辨认音源,接着核算图画中每个像素的音量,然后经过“空间定位”确认发生类似音波的片段。

PixelPlayer 的中心是一种依据乐器组合多模态练习的神经网络,数据集采用了 Youtube 上 714 条未经修剪且未经符号的视频。其间,总时长为 60 小时的 500 条视频用于练习,剩下的则用于验证和测验。在练习过程中,研究人员别离依据原声吉他、大提琴、单簧管、长笛和其他乐器向体系馈入了算法。

这仅仅 PixelPlayer 多重机器学习结构的一个部分。经过练习后的视频剖析算法将从编排帧中提取出视觉特征,这便是体系的第二个神经网络,即音频剖析网络。音频剖析网络将声响拆分为片段,并从中提取特征。最终,音频组成网络将把上述两个网络输出的特定像素和声波相关起来。

PixelPlayer 进行彻底自监督的学习,人们无需对数据注释,并且体系现在现已能辨认 20 种乐器。

 

图片来历:123RF
← 返回