非显而易见性评估仅供参考,不构成法律建议。
| 编号 | 名称 |
|---|
一种从输入声音检测目标关键字来激活移动装置中的功能的方法,所述方法包括:通过所述移动装置,在缓冲器中接收提取自输入声音流的子段的第一多个声音特征; 一旦已在所述缓冲器中接收到所述第一多个声音特征,就生成所述第一多个声音特征的特征统计; 一旦已在所述缓冲器中接收到所述第一多个声音特征,就通过所述移动装置,在所述缓冲器中接收第二多个声音特征; 对于在所述缓冲器中接收到的所述第二多个声音特征中的每一声音特征,更新所述特征统计; 当在所述缓冲器中接收到所述第二多个声音特征中的一声音特征时,通过所述移动装置,处理来自所述缓冲器的第一数目个声音特征,所述第一数目个声音特征包含两个或多个声音特征,其中所述处理是基于所述第一多个声音特征的所述特征统计或经更新的特征统计的; 通过所述移动装置,为所述经处理的声音特征中的至少一个声音特征确定关键字得分;以及当所述关键字得分大于阈值得分时,通过所述移动装置,将所述输入声音检测为所述目标关键字。
根据权利要求1所述的方法,其中处理所述第一数目个声音特征包括:从所述缓冲器检索所述第一数目个声音特征;以及 基于特征统计来处理所述检索到的声音特征。
根据权利要求2所述的方法,其中所述特征统计包含均值和方差,且其中处理所述检索到的声音特征包括基于所述特征统计来使所述检索到的声音特征标准化。
根据权利要求2所述的方法,其中处理所述检索到的声音特征包括基于所述第一多个声音特征的所述特征统计,来处理所述第一多个声音特征中的声音特征。
根据权利要求2所述的方法,其中处理所述检索到的声音特征包括:基于所述第二多个声音特征的第一声音特征来更新所述特征统计;以及基于所述经更新的特征统计来处理所述第二多个声音特征的所述第一声音特征。
根据权利要求2所述的方法,其中处理所述检索到的声音特征包括基于所述特征统计来处理选定数目个所述检索到的声音特征。
根据权利要求6所述的方法,其中基于所述移动装置的资源信息来调整所述选定数目。
根据权利要求2所述的方法,其中处理所述检索到的声音特征包括:将所述检索到的声音特征之中的一声音特征识别为当前声音特征; 确定所述当前声音特征与先前声音特征之间的差异;以及 当所述差异小于阈值时,使用对应于所述先前声音特征的经处理的声音特征作为对应于所述当前声音特征的经处理的声音特征。
根据权利要求1所述的方法,其中基于所述移动装置的资源信息来调整所述第一数目。
根据权利要求1所述的方法,其中为所述经处理的声音特征中的所述至少一个声音特征确定所述关键字得分包括使用马尔可夫链模型来计算所述关键字得分。
根据权利要求1所述的方法,其中处理所述第一数目个声音特征包括:当所述缓冲器中的所述声音特征的特定数目小于所述第一数目时,处理位于所述缓冲器中的所述特定数目个声音特征。
根据权利要求1所述的方法, 其中在所述缓冲器中接收所述第一多个声音特征包括: 将所述输入声音的第一部分分割为第一多个帧;以及 从所述第一多个帧中的至少一个帧提取第一声音特征, 其中在所述缓冲器中接收所述第二多个声音特征包括: 将所述输入声音的第二部分分割为第二多个帧;以及 从所述第二多个帧中的至少一个帧提取第二声音特征。
根据权利要求1所述的方法,其进一步包括响应于将所述输入声音检测为所述目标关键字,激活与所述目标关键字相关联的所述功能。
一种移动装置,其包括: 缓冲器,其经配置以接收并存储提取自输入声音流的子段的声音特征,其中所述声音特征包括第一多个声音特征和第二多个声音特征,在所述缓冲器中接收到所述第一多个声音特征之后,所述第二多个声音特征被接收到所述缓冲器中; 特征处理单元,其经配置以: 一旦已在所述缓冲器中接收到所述第一多个声音特征,就生成所述第一多个声音特征的特征统计; 对于在所述缓冲器中接收到的所述第二多个声音特征中的每一声音特征,更新所述特征统计;以及在所述缓冲器接收到所述第二多个声音特征中的一声音特征时,处理来自所述缓冲器的第一数目个声音特征,所述第一数目个所述声音特征包含两个或多个声音特征,其中所述处理是基于所述第一多个声音特征的所述特征统计或经更新的特征统计的; 关键字得分计算单元,其经配置以为所述经处理的声音特征中的每一者确定关键字得分;以及关键字检测单元,其经配置以在所述关键字得分中的至少一者大于阈值得分时,将输入声音检测为目标关键字。
根据权利要求14所述的移动装置,其中所述特征处理单元进一步经配置以:从所述缓冲器检索所述第一数目个所述声音特征;以及 基于特征统计来处理所述检索到的声音特征。
根据权利要求15所述的移动装置,其中所述特征统计包含均值和方差,且其中所述特征处理单元进一步经配置以基于所述特征统计来使所述检索到的声音特征标准化。
根据权利要求15所述的移动装置,其中所述特征处理单元进一步经配置以基于所述特征统计来处理所述第一多个声音特征的第一声音特征。
根据权利要求15所述的移动装置,其中基于所述第二多个声音特征的声音特征的统计来更新所述特征统计,且其中所述特征处理单元进一步经配置以基于所述经更新的特征统计来处理所述第二多个声音特征的第二声音特征。
根据权利要求15所述的移动装置,其中所述特征处理单元进一步经配置以基于所述特征统计来处理选定数目的所述检索到的声音特征,且其中所述选定数目不同于所述第一数目。
根据权利要求19所述的移动装置,其中基于所述移动装置的资源信息来调整选定数目。
根据权利要求15所述的移动装置,其中所述特征处理单元进一步经配置以:将所述检索到的声音特征之中的一声音特征识别为当前声音特征; 确定所述当前声音特征与先前声音特征之间的差异;以及 当所述差异小于阈值时,那么使用对应于所述先前声音特征的经处理的声音特征作为对应于所述当前声音特征的经处理的声音特征。
根据权利要求14所述的移动装置,其中基于所述移动装置的资源信息来调整所述第一数目。
根据权利要求14所述的移动装置,其中所述特征处理单元进一步经配置以在位于所述缓冲器中的声音特征的数目小于所述第一数目时,处理所述缓冲器中的每一声音特征。
根据权利要求14所述的移动装置,其中所述关键字检测单元进一步经配置以基于所述输入声音被检测为所述目标关键字而激活与所述目标关键字相关联的功能。
一种移动装置,其包括: 用于在缓冲器中接收并存储提取自输入声音流的子段的声音特征的装置,其中所述声音特征包含第一多个声音特征和第二多个声音特征,在所述缓冲器中接收到所述第一多个声音特征之后,所述第二多个声音特征被接收到所述缓冲器中; 用于一旦已在所述缓冲器中接收到所述第一多个声音特征,就生成所述第一多个声音特征的特征统计的装置; 用于对于在所述缓冲器中接收到的所述第二多个声音特征中的每一声音特征,更新所述特征统计的装置; 用于在所述用于存储所述声音特征的装置接收到所述第二多个声音特征中的一声音特征时,处理来自所述用于存储所述声音特征的装置的第一数目个声音特征的装置,所述第一数目个所述声音特征包含两个或多个声音特征,其中所述处理是基于所述第一多个声音特征的所述特征统计或经更新的特征统计的; 用于为所述经处理的声音特征中的每一者确定关键字得分的装置;以及用于在所述关键字得分中的至少一者大于阈值得分时,将输入声音检测为目标关键字的装置。
根据权利要求25所述的移动装置,其中所述用于处理所述第一数目个所述声音特征的装置经配置以:从所述用于存储所述声音特征的装置检索所述第一数目个所述声音特征;以及基于特征统计来处理所述检索到的声音特征。
根据权利要求26所述的移动装置,其中所述特征统计包含均值和方差,且其中所述用于处理所述第一数目个所述声音特征的装置进一步经配置以基于所述特征统计来使所述检索到的声音特征标准化。
一种存储用于从输入声音检测目标关键字来激活移动装置中的功能的指令的非暂时性计算机可读存储媒体,所述指令致使处理器执行操作,所述操作包括:在缓冲器中接收提取自输入声音流的子段的第一多个声音特征; 一旦已在所述缓冲器中接收到所述第一多个声音特征,就生成所述第一多个声音特征的特征统计; 一旦已在所述缓冲器中接收到所述第一多个声音特征,就在所述缓冲器中接收第二多个声音特征; 对于在所述缓冲器中接收到的所述第二多个声音特征中的每一声音特征,更新所述特征统计; 当在所述缓冲器中接收到所述第二多个声音特征中的一声音特征时,处理来自所述缓冲器的第一数目个所述声音特征,所述第一数目个所述声音特征包含两个或多个声音特征,其中所述处理是基于所述第一多个声音特征的所述特征统计或经更新的特征统计的; 为所述经处理的声音特征中的每一者确定关键字得分;以及当所述关键字得分中的至少一者大于阈值得分时,将所述输入声音检测为所述目标关键字。
根据权利要求28所述的非暂时性计算机可读存储媒体,其中基于所述移动装置的资源信息来调整所述第一数目。
根据权利要求28所述的非暂时性计算机可读存储媒体,其中处理所述第一数目个声音特征包括:当所述缓冲器中的声音特征的特定数目小于所述第一数目时,处理位于所述缓冲器中的所述特定数目个声音特征。