机器学习 | 声纹识别技术简介

in 机器学习 with 0 comment

声纹识别简介

技术简介

​ 声纹识别,也称为说话人识别,是一种通过声音判断说话人身份的技术,是基于语音中所蕴涵的、能表征和标识说话人的特征,来探索说话人身份的技术。声纹识别可以分为说话人辨识SI(Speaker Identification)和说话人确认SV(Speaker Verification)

SI和SV的区别

SI指将待测语音与已知集合内若干说话人比对,选取最为匹配的说话人,SI是一个一对多的问题

SV指对于一个目标身份,判断一段未知语音是否来自于这个目标身份即可,SV是一个1对1的二分类问题。

声纹识别的基本分类

​ 由于用于注册和验证语音的限制,声纹识别经常被分为两类

基本流程

​ 声纹识别的基本技术流程

img

评价参数

声纹辨识

​ 辨识准确率=辨识正确样例数/辨识总样例数x100%

​ TopN辨识准确率=TopN命中样例数/辨识测试总样例数x100%

声纹确认

​ 错误拒绝率=被接受的非目标说话人样本数/目标说话人测试样本数x100%

​ 错误接受率=被接受的非目标说话人样本数/非目标说话人测试样本数x100%

声纹识别造假攻击技术

评论区