下面我谈谈如何建立基础语音库。
在计算机中文操作系统中,每个汉字都有自己的编码,称为“ASCII码”,又称“汉字机内码”,简称“内码”,是汉字最基本的编码。对于每个数字、英文字母及希腊字符都有相应的全角。在计算机存储时,半角占一个字符,全角与汉字相同,也是占两个字符。
例如,“国”字的ASCII码是FAB9H,转换为十进制是64185。
因此,我可以制作“国”字的音频文件,文件名为64185.wav,“中”字音频文件为53462.wav,“中国”的音频文件为5346264185.wav。在文章中如果出现的字或词,我就可以读取相应音频文件进行发音处理。
每个全角字符也都有自己的内码,例如“A”的全角为“A”,内码为49571。
这样,我就能对所有的汉字、数字、字符及词组等需要读出的内容皆可单独以音频文件的形式进行保存。
下一节介绍如何制作每个汉字的音频文件。
《邓小平时代》片断
| 留言与评论(共有 0 条评论) “” |