华盛顿大学研发“空间语音翻译”技术:多人同时发言也能精准识别
美国华盛顿大学的一项研究提出了一种可穿戴式“空间语音翻译”技术,能够通过双耳耳机在多人交谈环境中实时翻译,并可以保留每位发言者的声音特征与方位感。
据 ITMedia News 昨日报道,借助这项技术,耳机能将每个人的话实时翻译成你的母语,同时保留每个人的声音个性和方向信息,让你清楚分辨谁在说什么。
与现有翻译工具相比,这项技术解决了两大难题:一是支持多人同时发言场景,二是翻译结果不再千篇一律,而是保持每个说话者独特的声音风格与方向。研究结合了音源分离、空间定位、实时翻译与双耳渲染等技术,构建出完整系统。