苹果发布论文,揭示 Siri 的秘密

【 图片来源:Patently Apple  所有者:Patently Apple 】扬声器验证和语音触发检测在第一篇论文中,一组苹果研究人员提出了一个训练过的人工智能模型,这个模型既能执行自动语音识别任务,也能执行说话人识别任务...对此,研究人员设计了三套能够学习语音和说话人信息的模型,并对一组数据进行训练,这些数据包含超过 16000 小时的带注释的样本,其中 5000 小时的音频有语音标签(其余的为说话人标签)...研究人员认为,这样的实验结果是十分有趣的,因为这些模型是使用不相关的数据集训练的,也就是说,每个音频样本要么有语音标签,要么有说话人标签,从来没有两者都有。

扫描二维码分享话题