admin 管理员组

文章数量: 1086019


2024年3月10日发(作者:女生学java开发)

第38卷 

第4期 

、,01.38 

计算机工程 

2012年2月 

February 2012 

NO.4 

Computer Engineering 

开发研究与设计技术・ 文章编号:100 .3428(2012)04— 236__03 文献标识码:A 中图分类号:TN918 

基于Chaff Matrix的可撤销声纹模板设计 

徐文华,易法令,熊伟 

(广东药学院医药信息工程学院,广州5 l(1006) 

摘要:基于模糊穹的特征保护方法存在敌手冒充和空间自由度减少的问题。为此,提出一种基于伪矩阵(ChafMatrix)的可撤销声纹模板 

设计方法。通过原始特征矢量的构成元素产生伪点,根据定位矩阵将伪点插入原始特征,且在欧氏距离准则下,插入前后特征矢量与模板 

之间距离的变化量相同,从而保证系统识别率,实现特征保护。实验结果验证了该方法的正确性。 

关健诃:声纹认证;可撤销模板;模糊穹;生物加密;超球体;梅尔倒谱系数 

Design 0f Cancelable Voiceprint Template Based 0n Chaff Matrix 

XU Wen-hua,YI Fa—ling,XIONG Wei 

(College of Medical Information Engineering,Guangdong Pharmaceutical University,Guangzhou 5 1 0006,China) 

[Abstraetl Aiming at the problems of fake and decrease of interspaces in Fuzzy Vault(FV)method,this paper proposes a voiceprint template 

protection method based on Chaff Matrix(CM).The CM is generated from raw feature and interweaved with raw template according to Orientation 

Matrix(OM),such that a cancelable template is designed to protect the voiceprint.Problems of fake and decrease of interspaces for Chaff 

Points(CPs)in FV are solved by the mixture on a thinner layer.Mathematical analysis explained the proposal doesn’t deteriorate the performance, 

for the invariability of the distance change between features.Experimental results show the validity of this method. 

[Key wordsl voiceprint authentication;cancelable template;Fuzzy Vault(FV);biometric encryption;hypersphere;Mel Frequency Cepstral 

Coefficient(MFCC) 

D0I:10.3969/j issn.1000—3428.2012.04.077 

1概述 

生物特征传输和存储安全问题的解决对生物认证系统的 

广泛应用具有重要意义…。目前的解决方法主要有结合成熟 

的密码方案 】、特征转换 和生物加密14-513类。特征转换是 

指通过类似传统密码学的哈希转换,把原始特征转换到变换 

域,认证也在变换域进行。特征转换方法主要有Multispace 

Random Projection(MRP)[31方法等。生物加密方法主要有密钥 

(Orientation Matrix,OM)为D,0∈R 。加入C后的特征分 

别为: 

X【n,X c|,XcJ∈R 

其中,x 即是本文提出的可撤销模板(对于VQ算法,X 由 

码本插入C矩阵构成),加入C矩阵后的特征统称为X 。 

分析特征保护方法是否有效的出发点是认证的判决尺 

度,如果保护方法不会改变判决尺度或改变具有一致性,则 

识别结果不会改变和恶化。常用的判决尺度是最小距离和最 

小量化失真,这2个判决尺度都采用欧氏距离准则(欧氏距离 

生成l4 和密钥捆绑1512种。密钥捆绑的典型方法是基于模糊穹 

(Fuzzy Vault,FV)的特征保护。特征转换方法和生物加密方法 

的一个共性是原始特征泄漏后,可以重新设计新的模板,因 

此,通过这些模板保护技术设计的模板被称为可撤销模板。 

目前有不少文献采用FV的方法设计可撤销模板 j,但文 

的平方)。在此准则下,如果【Ix 。一Xc.1r:lIx 一Xcol广,即认 

证特征与模板的距离增量一致,则对于采用欧氏距离准则的 

认证识别系统,本文方法不会改变系统最终的识别效果,这 

也是该方法的一个假没(假设实为显然成立,具体分析见实验 

部分)。下面讨论假设成立的条件,推导如下: 

献[6—7】分别指出FV方法存在冒充和伪点(Chaff Points,CPs) 

插入过程中空间自由度减少的问题。 

本文基于在FV中加入CPs的思想,提出通过原始特征 

矢量构成元素产生CPs,并把CPs插入原始特征的方法实现 

特征保护。该方法在CPs的加入方式和认证原理上与FV有 

本质的区别,并且比FV具有更强的安全性,因为在FV中, 

}Ix 一 。! J= 圭f 一xg ) +兰主( w— u ) = 

i=1 J:J i=1 J=l 

芝芝( ’一 ) + :}Ix,一Xo + (】) 

CPs为矢量,而在本文中,CPs为构成矢量的元素,由这些 

元素组成伪矩阵(Chaff Matrix,CM)。考虑到声纹认证的独特 

优势,本文以声纹认证系统为架构,以此类系统中的典型特 

征梅尔倒谱系数(Mel Frequency Cepstral Coefficient,MFCC) 

为保护对象阐述所提出的方法。 

= ,

xc,,l =量 (x 

i i=l=l

m p 

)。+ 刍 。 ~ 。=

m r(

(x 一x ) + 

i=1j=l 

llx,一X0Ij + (2) 

式(1)和式(2)说明假设成立的条件为 : ,即:如果 

则不同认证特征与模板的距离增量一致,在此假设 

2基于Chaff Matrix的可撤销模板 

设注册过程提取的特征为X 2个不同的认证特征分别 

为X,,X,∈R ,其中,m为特征长度;P为MFCC的阶数; 

CM为C,C∈R~;r为加入CPs的数目;定位矩阵 

基金项目:广东药学院人才引进基金资助项目(2007YGY0 1) 

作者简介:徐文华(】978一),男,讲师、博士,主研方向:生物认证 

系统,语音信号处理;易法令,教授、博士;熊

收稿日期:2011-09—20 

伟,讲师、硕上 

E—mail:gzwhxu@163.conr 

第38卷第4期 徐文华,易法令,熊伟:基于ChafMatrix的可撤销声纹模板设计 237 

成立的条件下也就不会影响识别率。 

对于该方法,存在3个问题:(1)如何产生CPs及满足 

= 

,;(2)如何确定矩阵0的元素,即在哪些位置加入CPs; 

(3)该方法的安全性分析。 

(1)为确定 和 ,的值,需要首先产生注册和第一个认 

证特征的CPs。对于注册和第一个认证过程中产生的CPs, 

如果所有的CPs在数值上与原始特征存在明显差异,则敌手 

可以通过这种差异轻易地获得原始特征。为防止敌手在获得 

单个特征的情况下轻易找出原始特征,CPs与原始特征 

MFCC系数之问应尽量具有相似性。在求解过程中,有部分 

解可能满足不了相似性,并且MFCC部分系数自身存在的突 

变性 】,这种突变性允许部分解可以不满足相似性要求,这 

也是“尽量具有相似性”的含义。本文通过原始特征产生注 

册和第一次认证过程中的矩阵c,具体公式如下: 

c f=l∑X

r0

iH1 

, q, 

0+(一1) 

 .

(o“+】一OiJ)et l/o +】

]/ 

J/ 

一o 

i=1,2,---,m;I=1,2,…,r (3) 

式(3)中分子为原始特征中的若干相邻元素累加后再加 

上一个调整参数£,分母为相加元素的个数,这样的目的是 

保证CPs与原始特征元素的相似性。其中,E是防止CPs与 

原始特征元素相等。设: 

o【i}I f 

j--

∑X

oi

i 

ij

 

(ql,+1—0i,) 

则£的取值范围为: 

£∈(0,min(max(xi:)一 ,,/tj,—min(x,1f.)], =0if,0i. +1,・一,0i』+l 

由式(3)可以产生C 和C ,即注册和第一次认证过程产 

生的C矩阵,然后再由艺 (c 一 ) = = 确定 。 

l,=l 

对于第2个及其后认证特征中的CPs除了满足相似性要 

求外,还必须满足 = = ,如式(1)、式(2)所述,这个约 

束条件是系统有效性的要求。同时满足对应位置CPs不等, 

这是为了保证敌手在获得多个特征时也不能轻易发现原始 

特征。以第,个特征为例,此问题等价于式(4)。 

兰圭(c 一 ,) = 

≠0 

i=1 J=】 

cl ∈【min(x ),max(X ̄ci ̄ )】 

,= ,0if+1,…,0i3+|;Z≠r(4) 

C ≠C ≠C 

i=1,2,…, ;J=1,2,・一,r 

式(4)是带多个约束条件的rXm元二次方程,对于式(4) 

是否存在数学解析求解方法,目前还未知。本文采用几何方 

法求解:式(4)从几何角度讲是一个超球面,从球面上任意 

取一点都满足该方程式,因此,对该式的求解问题归约为在 

球面上任取一点,并求该点坐标。由于式(4)对解的范围存 

在约束,因此在求解上等价于在某一特定区域取点再求坐 

标值,问题的关键也就是如何确定取点区域。从式(4)方程 

看,未知数个数为rXm,对应到超空间也就是rxm维,球面 

上每一维所在区域假设为 【一√ ,√ ],每一维解约束空 

问为: 

叫 ∈[min(x ),max(X(c ̄ )] 

i=1,2,… ; =oi,,oi

+1,…,Oi

(5) 

¨ 

根据Q与 包含与否的关系可以确定取点的区域,Q 

与叫 存在3种情况,根据这3种情况可确定 的取值区域: 

1) n =叫 ;2) n i = 、 , 、 ‘=叫 ;3) n叫 = 。 

在第1)种情况中,对于c ~c ’,可以在相似性要 

求下根据式(3)随机选择;对于c【mI, ,则在前(mxr)一1个元 

素和 确定的条件下计算。这样求出的解也必定在 的范围 

内,所有的解都满足相似性要求。 

第2)种情况求解过程与第1)种情况类似,只是取值区域 

在 空问。 

第3)种情况的含义是所求解不能同时满足既在球面上, 

又满足相似性的要求。对于这种情况,本文采用取 空间一 

个领域的方法,此处领域定义为 空间中与 最接近的一 

段区域,本文中假设这段区域为空间 ,根据MFCC部分系 

数自身的突变性,Ci,可在 空间取值。 

(2)式(1)和式(2)说明特征与模板的距离只与特征元素和 

c矩阵元素的大小有关,而与插入的位置无关。因此,矩阵 

D可任意给定。必须说明的是方案的有效性与D无关,但其 

安全性却与O矩阵的规模大小相关,0矩阵规模越大,插入 

的CPs则越多,安全性也越高。 

(3)安全性分析。安全性以敌手获得原始特征的概率表 

示,可由下式表示: 

尸= = ,例 ㈣ 

其中,c 是在一个加入CPs的特征矢量中原始特征的总组 

合数;c 是在总组合数中真实点的组合方式,对于本文所提 

方法,因为采用模板匹配的方式,所以只有一种方式是符合 

原始特征的组合方式,分子为1;获得整个特征序列需要获 

得每一帧真实点的概率相乘,共有m帧的特征长度,则最终 

获得原始特征的概率为获得一帧真实特征向量的m次方。 

由于该方法与FV在特征点层面插入CPs的方法不同, 

CPs是在特征矢量的构成元素中插入,插入位置与特征点所 

构成的空间无关,从而避免了点的插入受空间限制的影响。 

同时,如果要敌手替换真实点,则首先需要找出真实点的位 

置,式(6)已经说明其概率非常小;如果替换的是CPs,则其 

不能满足增量一致的要求,因为式(4)已经说明C矩阵是满足 

增量一致要求的,替换之后必然不满足增量一致要求,所以 

敌手也无法通过替换的方法达到冒充的目的。从认证原理上 

分析,本文方法的认证采用的是模式匹配的方法,如果要达 

到冒充的目的,则需要替换所有的原始点以及C矩阵,而不 

是FV的方法只需要替换部分点通过多项式重构就可以达到 

冒充的目的。所以,该方法的安全性比FV的方法更高。 

3实验结果与分析 

3.1识剐算法 

本文方法适应于采用欧氏距离测度的识别算法,如DTW 

和VQ算法。对于统计模型,目前还没有理论分析说明该方 

法是否有效。本文选用DTW和VQ算法验证上述方法。 

3.2结果分析 

实验1语料库为自制的语音库:录音设备为三星Yv-120 

录音笔;在安静环境录音;文本格式为“籍贯+姓名”;录制 

人员共40人;年龄为18岁 ̄30岁;文件格式为16 kHz采样, 

16 bit量化,单声道WaY格式;样本的最小时长为3.57 S,最 

大时长为7.68 S。特征采用典型MFCC语音特征,阶数为24 

阶,每帧256点,重叠156点,即帧移100点。实验中D矩 

阵采用预先给定初始值的方式。实验结果为加入前后的识别 

率都为92.5%,与上文分析是一致。 

238 计算机工程 2012年2月20 Et 

对于式(4),理论分析 与 存在如第2节所述的3种 

实验表明本文设计的可撤销模板是有效的。该方法的安全性 

随矩阵0规模的增大呈阶乘增强。该方法是否适应于统计模 

关系,实验结果表明,式(4)中所有解的范围都属于 n叫 : 

叫 ,这说明式(4)求解方法的可行性,并且所有解都满足相 

似性要求。本文用鳓表示第,个特征的数值范围,则显然有 

] ,所以只需要分析 与 的关系,如果 与 存 

型的模板设计有待于进一步研究。 

参考文献 

【1]Jain A K,Nandakumar K,Nagar A.Biometric Template Sec— 

在包含关系,则 与 也存在包含关系。在这种包含关系 

下的解都满足相似性要求。实验结果表明dait=73.42,并且 

Minmfcc<dait<Maxmfcc,这也就说明 与叫 都存在包含关 

系,同时也说明上述式(4)的求解过程是可行的。 

urity[J].EURASIP Jounmal on Advances in Signal Processing: 

Special Issucial on Biometrics,2008,(1):1—20. 

[2]Xu Wenhua,He Qianhua,Li Yanxiong,et a1.Cancelable Voice— 

print Templates Based on Knowledge Signatures【C],/Pr0c.of 

ISECS’08.Washington D.C..USA:IEEE Press.2008:4l2—415. 

实验2实验2的实验条件同实验1。采用LBG(Linde 

Buzo Gray)算法训练VQ码本,码本大小为64。实验结果与 

上文分析一致:加入CPs前后的识别率都为95%。之所以不 

改变是加入CPs前后的码本产生的条件和过程是一样的,而 

加入CPs后认证特征与码本的距离增量又是一致的,这样加 

入CPs前后的最小量化误差也就一样。因此,识别率没有改 

[3]徐文华,贺前华,李韬.一种基于MRP的可撤销模板设计及 

其分析lJ1.电子学报,2009,37(12):2792.2795. 

【4] 冯全,苏菲,蔡安妮.生物加密综述f J1l计算机工程,2008, 

34(10):141—143. 

[5】Uludag U,Pankanti S,Jain A K.Fingerprint Template Protection 

Using Fuzzy Vault[C]//Proc.of ICCAS’07.Portsmouth,UK: 

Springer,2007:1 141—1151. 

变,自然没有恶化识别率,符合可撤销模板的要求。而VQ 

算法的识别率高于DTW算法的现象,则由算法本身的识别 

效果决定。 

对于VQ的识别算法,式(4)的求解过程与实验1类似, 

[6]Nandakumar K,Nagar A,Jain A.Hardening Fingerprint Fuzzy 

Vault Using Password[C]//Proc.of ICB’07.Seoul,Korea:Springer 

2007:927—937 

但需要把CPs插入在码本中。实验结果表明dait=82.98,并 

且Minmfcc<dait<Maxmfcc, 

足相似性要求。 

与 仍然存在包含关系,这 

[7]Chang E C,Shen R,Teo F W 

Finding the Original Points Set 

Hidden Among Chaff[C]//Proc. 

of ASIACCS’06.Taipei,China: 

[S.n.],2006:182—188. 

也进一步说明式(4)计算方法的可行性,并且所求解也同样满 

【8】Shaughnessy D O.Invited Paper:Automatic Speech Recognition: 

History,Methods and Challenges[J]Pattern Recognition,2008, 

41f1O1:2965—2979. 

4结束语 

本文提出根据OM在原始特征点的元素中加入CPs,达 

到了安全传输、存储的目的,满足可撤销模板的安全性要求。 

编辑金胡考 

所选择地引入,进一步提升技术对科研的服务能力。基于云 【 】w 。“1],L。rd Gib 。“F,。 ・c 。 c。mputing for E i。“。。 

服务的会议服务平台是云计算在e—science的创新应用,解决 wi “cARMEN[c] ro。。。 g。。 。 ” b “G i 

簧需 要 竺 曼 军季 墨 : 1研协同平台研 ):阳14

竺:  ̄uIu,Do 1 9.

…h… 台将对中科院国际学术会议的组织管理产生积极深 【8 ’】 … ’:  ’一 … , ’ , ’ …’、三  i。 。 同工作环…0 ’0’… p 

,, 

譬 件 妻篓 耋辇 璧 

参考文献 

豢 南Infr s凯tru, 董tur科e C军on

fe

re

nce

IEEEPr

ess

2008.

建军面向

务的科

。 

【9] Duckling[EB/OL].[201 l-02—15].http://duckling.escience.cn. 

[10]Spring[EB/OL].[2011—02—151.http://www.springsource.org. 

【1]Jankowski N W.Exploring E—science:An Introduction[J].Journal 

of Computer mediated Communication,2007,1 2(2):549—562. 

[11】中科院国际会议服务平台[EB/OL].[2011—02—151.http://csp.esc 

ience.cn. 

[2】Hey E—science and Cyber Infrastructure:A Middleware Per— 

spective[C]//Proceedings of the 15th International Conference on 

编辑陆燕菲 


本文标签: 特征 方法 原始 模板 认证