本文件規(guī)定了一種數(shù)據(jù)交換格式,可用于存儲(chǔ)、記錄和傳輸人類(lèi)的數(shù)字化聲學(xué)數(shù)據(jù)(語(yǔ)音),該數(shù)據(jù)來(lái)自單次會(huì)話中的單個(gè)說(shuō)話人。該數(shù)據(jù)格式用于各種說(shuō)話人辨認(rèn)和確認(rèn)(SIV)應(yīng)用,包括文本相關(guān)的和文本無(wú)關(guān)的,并且對(duì)數(shù)據(jù)采集條件或收集環(huán)境只作最少假設(shè)。將這種格式封裝的數(shù)據(jù)用于其他用途是有可能的,例如自動(dòng)語(yǔ)音識(shí)別(ASR),但這超出了本文件涉及的范圍。本文件也不涉及聲紋特征或聲紋模型級(jí)別的數(shù)據(jù)處理,不涉及特定應(yīng)用的需求、設(shè)備或特性。本文件支持非標(biāo)準(zhǔn)的擴(kuò)展數(shù)據(jù),支持采集得到的原始數(shù)據(jù)和經(jīng)過(guò)數(shù)字處理(增強(qiáng))的聲音數(shù)據(jù)。對(duì)原始輸入的任何處理都需有說(shuō)明,并包含在與語(yǔ)音表示相關(guān)聯(lián)的元數(shù)據(jù)中。本文件不涉及數(shù)據(jù)流技術(shù)。
本文件不涉及對(duì)存儲(chǔ)和傳輸?shù)纳锾卣鲾?shù)據(jù)加時(shí)間戳,也不涉及使用加密技術(shù)來(lái)保護(hù)生物特征數(shù)據(jù)的真實(shí)性、完整性和保密性。
符合本文件規(guī)定格式的信息能記錄在機(jī)器可讀介質(zhì)上,也能在系統(tǒng)之間通過(guò)數(shù)據(jù)通信相互傳輸。
本文件在描述通用的聲音數(shù)據(jù)交換格式的條款后面,給出了XML模式定義的條款。
本文件包含了語(yǔ)音識(shí)別和說(shuō)話人識(shí)別領(lǐng)域常用的術(shù)語(yǔ),以及其他ISO標(biāo)準(zhǔn)中的術(shù)語(yǔ)。