声扬科技首席科学家张伟彬:声纹识别技术将是下一个风口

谈到生物识别技术,指纹识别和人脸识别可能是最熟悉的。相比之下,声纹识别技术并不太受重视。

然而,实际上声纹识别技术已经存在了很长时间。近年来,随着深度学习推动的语音人工智能技术的爆炸式发展,语音识别技术已经广泛应用于智能手机和智能扬声器市场,也开始推动声纹识别技术的应用。

9月20日,在SMIC主办的“2019生物识别技术与应用峰会论坛”上,沈阳科技首席科学家张卫斌博士分享了生物识别技术的进步,并相信声纹识别技术将是生物识别领域的下一个出路。

沈阳科技首席科学家张卫斌博士

沈阳科技首席科学家张卫斌博士认为,声纹识别技术的发展可以分为三个阶段:

在第一阶段,模板匹配方法需要在验证前注册,就像人脸一样。您在注册时所说的应该与验证时所说的相同。在登记时,应该说“中华人民共和国”,在核实时,也应该说“中华人民共和国”。这相当于在验证过程中受到限制,只是比较两种声音是否相似。

第二阶段始于2000年基于概率模型的研究。我们知道声音有时间长度,长度可以长也可以短。有些人说得快,有些人说得慢。首先,我想把变长的向量变成物理量,这是基于高斯模型的概率统计。识别率仅达到95%的概率,这在许多应用场景中无法实现,因为需要考虑噪声和干扰的影响。

在第三阶段,深度学习将在2012年左右的许多方面带来爆炸性的影响。在声纹领域,最近的重大事件是2017年引入x矢量系统,这将大大提高声纹识别。

“特别是在过去的两年里,市场对声纹识别也有很强的需求,这得益于声纹识别技术的进一步成熟。另一方面,在国家政策方面,央行在去年10月左右发布了手机金融声波纹识别技术的应用标准。这是在国家和政策层面上对声纹识别技术已经达到大规模商业应用的门槛,能够满足金融和其他场景中高安全性语音技术需求的认识。第三个方面是近年来非接触性犯罪在中国十分猖獗,声纹识别技术可以通过语音远程识别身份,对这类犯罪有很大帮助。所以我们认为声纹识别将是一个新的出路。”张卫斌博士说。

那么声纹识别技术和声纹技术有什么优势呢?

张卫斌博士说,声纹与文本内容和语言无关,因此在技术上独立于语言和文本内容是一个巨大的挑战。就像人脸一样,也有认证攻击。除了模仿,声纹识别也有相对简单的录音和播放。如何防止被攻击也是一个很大的挑战。此外,在注册早期声纹识别时,用户需要讲几分钟,用户体验非常差。声纹识别的应用受到严重限制,声纹技术克服了这些技术难题,实现了大型项目在多场景中的落地。

此外,跨通道也是声纹识别中的一个主要问题,因为进入电子系统的声音需要通过麦克风收集,但是不同麦克风之间的差异非常大。因此,有必要克服不同麦克风通道造成的差异,这也是一个巨大的挑战。此外,检索大量十亿级数据库也是一大挑战。然而,目前的声纹比较仍然是在资源非常少的情况下进行的。目前,最大的声纹库可能只有百万级。

尽管声纹识别面临诸多挑战,但声纹技术在声纹识别、语音识别、语音信号处理等许多领域都依赖于自身的技术积累。它在人工智能语音领域拥有数十项独立发明专利,并创新性地克服了许多技术难题。其中,核心声纹识别技术能够在1000多万级的复杂噪声环境和声纹数据库中快速准确地识别说话人的身份,准确率居行业领先地位。特别是在声纹注册过程中,目前语音推广技术的声纹识别注册只能由用户通过命名八个中文数字来完成,声纹验证准确率也很高。

“我们的优势在于,我们不仅在技术上能够识别声纹,而且还能进行语音信号处理,如语音降噪,使声纹识别系统的输入语音更加清晰。此外,我们有自己的语音识别技术,通过多种技术的结合可以制作出满足客户需求的完整解决方案。这是我们公司的竞争优势之一。”张卫斌博士总结道。

数据还显示,在2018年10月nist(世界上最权威的声纹识别竞赛)中,语音推广技术是唯一进入前10名的独立企业团队。这显示了声纹识别技术在声纹技术中的优势。

语音技术结合自身的技术优势,还推出了行业解决方案,如面向行业的“语音网络语音打印大数据战网络”、“finvoice金融行业智能语音认证系统”、“voit互联网和智能硬件解决方案”、“召集智能语音会议系统”和“televoice智能电话远程身份认证系统”。

根据张卫斌博士的说法,世界上第一个使用声纹识别技术的国家社会保障项目(印度尼西亚)使用了画外音技术,覆盖了250万人。此外,在金融领域,语音转换技术的声纹识别技术在银行poc测试中名列前茅。实际着陆项目的准确率超过99.7%,为全球5000万人服务。在国内公安系统中,声纹技术中的声纹识别技术也已经得到应用,以满足公安部对该技术的需求。目前,声纹技术产品已经在全国十多个省市公安部门得到应用。

作者:辛志勋-浪客健

美军研发新型数字伪装系统 让坦克"变"奶牛(图)
在东害洛阳,在西害长安,强盗合体,敢杀京官
等《魔兽》上映的时候,看什么?| 推介
上市即成功,25天卖出近9千台,力压宋MAX,标配倒车影像仅8万