研究者重建上视频对象的声音振动



声音是一定的频率,其分布在源的周围空间的振动。这些波已经接近达成目标,使他们感受到震动。一个研究小组在麻省理工学院的视频这些振动可视的基础上已经成功,部分地恢复了一些失真的原始声音。

在安倍戴维斯,迈克尔·鲁宾斯坦,尼尔·瓦德华,高塔姆迈索尔,弗雷Durand和威廉·弗里曼用相机录制视频以每秒数千帧的频率,是常见的,并受到震动的项目,如薯片,树叶,植物,面贴膜包箱子组织或水玻璃。发现在家庭类似相机难以足够的,但另一种技术发现,声音可能的恢复用常规的记录以每秒60帧。

回收的音频的质量允许你单独词和具有相对较高的信噪比。回收的记录甚至允许依稀分辨人类语言或使用音乐识别服务。

在约0时45上面的视频,或 的项目页面显示了原始声音(研究人员使用了一个众所周知的任何人,有兴趣录制一首歌曲«玛丽有只小羊羔»史),并恢复声音,高频振动的视频是不可见肉眼 - 的振动达到小于像素的百分之一

然后,在大约1:50视频演示了原始声音,所记录的蜂窝电话的麦克风,并恢复人类语音的声音。相机位于从声波振动对一包薯条一段距离,并和所述对象之间的是玻璃,这增加了工作的难度。研究人员再次使用的第一个记录在留声机托马斯·爱迪生的歌曲。

在周围2:35它表明,音乐识别服务可以“学习”重建的记录,特别是已经认识到这首歌在压力下组女王。

上面的结果是从每秒数千帧的摄像频率获得的。然而,也有人表明普通家用工件拍摄摄像机(尤其是,滚动快门的)有时可以用来产生具有的频率比原始视频的帧速率高得多的声音。

改性技术的结果可以看出,在3点35周围,研究人员能够恢复速率多于视频的五倍的帧速率。我们使用的所有相同的MIDI文件用儿歌的旋律。

更多信息和音频可在项目网页。 。一组研究人员有望发布代码在不久的将来该项目。

资料来源: habrahabr.ru/post/232245/