从你的“声音”里听出“长相”,AI是怎么做到的?

mg娱乐登录地址 1

mg娱乐登录地址 1

mg娱乐登录地址 ,随着人工智能技术的不断发展,AI似乎变得越来越“无所不能”,只需要一滴唾液或者汗液,就能诊断你的压力有多大;甚至还能够能够通过你的声音,推测出你长啥样!?

最近,麻省理工学院人工智能实验室(MIT
CSAIL)发布了一项令人惊讶的研究——只需要听6秒的声音片段,AI就能推断出说话者的容貌。

其实,从声音推断一个人的长相并不是玄学,平时我们在打电话时会根据对方的声音脑补出相貌特征,这是因为年龄、性别、嘴巴形状、面部骨骼结构等,都会影响人发出的声音。此外,语言、口音、速度通常会体现出一个的民族、地域、文化特征。

AI 正是根据语音和相貌的关联性做出推测。为此,研究人员提取了几百万个
YouTube
视频,通过训练,让深度神经网络学习声音和面部的相关性,找到说话的人一些基本特征,并还原出相貌。在这个过程中,不需要人类标记视频,由模型自我监督学习。

当然,该研究也有翻车的时候。例如让一个亚洲人分别说英语和中文,结果分别得到了一张西方人面孔和一张中国人面孔。还例如变声期之前的儿童,也会导致模型误判性别发生错误。

发表评论

电子邮件地址不会被公开。 必填项已用*标注