声学领域的机器学习研究可以开启多模态元宇宙_平台_产业

平台

声学领域的机器学习研究可以开启多模态元宇宙

来源：澎湃新闻
2022-11-04 14:50

MIT-IBM Watson AI Lab的首席研究员Chuang Gan 也参与了该项目，他表示：“这项新技术可能会为在元宇宙应用程序创建多模态沉浸式体验带来新的机会。”

麻省理工学院和IBM Watson AI Lab的研究人员创建了一个机器学习模型，用于预测听众在3D空间内的不同位置上会听到什么。

研究人员首先使用这个机器学习模型来了解房间中的任何声音是如何在空间中传播的，按照人们通过声音理解自身所处环境的方式构建3D房间的图景。

在麻省理工学院电气工程与计算机科学系（EECS）研究生Yilun Du共同撰写的一篇论文中，研究人员们展示了如何将类似于视觉3D建模的技术应用于声学领域。

但是他们要面对声音和光线传播的不同之处。例如，由于障碍物、房间的形状和声音的特性，听众处在房间中不同的位置可能会对声音产生非常不同的印象，从而让结果变得难以预测。

为了解决这个问题，研究人员们在他们的模型中建立了声学特征。首先，在所有其他条件都相同的情况下，交换声音源和听众的位置不会改变听众听到的内容。声音还特别受本地条件影响，例如位于听众和声音源之间的障碍物。

Du表示：“到目前为止，大多数研究人员只专注于视觉建模。但是作为人类，我们有多种感知模式。不仅视觉很重要，声音也很重要。我认为这项工作开辟了一个令人兴奋的研究方向，可以更好地利用声音来模拟世界。”

使用这种方法，生成的神经声场（NAF）模型能够对网格上的点进行随机采样，以了解特定位置的特征。例如，靠近门口会极大地影响听众听见房间另一侧声响的内容。

该模型能够根据听众在房间中的相对位置预测听众可能从特定声学刺激中听到的内容。

这篇论文表示：“通过将场景中的声学传播建模为线性时不变系统，NAF学会不断地将发射器和听众的位置映射到神经脉冲响应函数，后者可以应用于任意声音。”“我们证明了NAF的连续性让我们能够在任意位置为听众渲染空间声音，并且可以预测声音在新位置的传播。”

MIT-IBM Watson AI Lab的首席研究员Chuang Gan 也参与了该项目，他表示：“这项新技术可能会为在元宇宙应用程序创建多模态沉浸式体验带来新的机会。”

我们知道不是所有 Reg 读者都会对这个用例感到兴奋。

声学领域的机器学习研究可以开启多模态元宇宙

关键词

相关阅读

我们距离真正的元宇宙还有多少年？

元宇宙产业委员会：不得以虚拟货币作为数字藏品发行交易的计价和结算工具

软通动力虚拟数字人升级2.0 元宇宙数字人创作平台亮相

供销社方兴未艾，元宇宙风起云涌，半导体却离奇跳水

百度联合凯度发布行业首份《Web3.0营销白皮书》：数字人、元宇宙助力品牌构筑用户引力场

拥抱未来、引创元宇宙潮流，米博元宇宙营销研讨会如期举行！

武汉正式发布促进元宇宙创新发展方案删去NFT相关内容

共生空间：元宇宙在农业农村领域大有可为

牵手大张伟、吴克群，元宇宙数字娱乐平台「Zebra Labs」获500万美金融资

融合赋能深化行动会畅通讯入选工业元宇宙协同发展组织理事单位

24快报

伟时电子新增“元宇宙”概念

飞天云动凭借卓越元宇宙解决方案，在国际各大展会频频亮相

加速国产算力商用！国内首个国产算力PoC平台正式开放

电力元宇宙低碳空间落地应用！促进绿色能源转型

马斯克旗下xAI公司融资50亿美元，估值飞涨至500亿

潍坊市奎文区强化元宇宙企业培育，年收入接近40亿元

新疆文旅投集团开发元宇宙体验项目“丝路奇遇记” 总投资660万元

挑战谷歌霸主地位？OpenAI拟推出自研浏览器

元宇宙产业魅力无限，多地竞相布局，预计市场规模将超8500亿元

浙江科创母基金落地杭州，重点投入‘‘人工智能+‘’产业，总规

中国算力位居世界第二，数据交易突破1600亿元，数字经济核心产业

百度：跌逾3%，营收下滑！AI转型初见成效

媲美ChatGPT！苹果全新对话LLM Siri，2026年正式上线

从鼓浪屿到敦煌，看咪咕如何用元宇宙重塑文旅赛道？

元宇宙产业“诱人” 全国各地争相布局

国网浙江电力公司：自主研发的电力元宇宙低碳空间落地应用

潍坊市奎文区：“链”上发力激发元宇宙产业发展活力

160余家歌尔核心合作伙伴齐聚潍坊坊子，携手共推元宇宙产业

墨宇宙携手南中轴国际文化产业园共绘元宇宙园区数字生态新蓝图

“5G数智新时代元宇宙发展论坛暨2024咪咕生态大会元宇宙产业发展