对比文件名称:WO2009131539A1_Description_20260320_0222
目标专利名称:375基于手持式装置中的眼睛俘获的增强现实处理CN103262097B
模型名称:本次调用未提供具体模型名称,任务由代理师完成。
### 特征比对表格
| 技术特征描述及公开性判断结果 | 对比文件原文引用 | 公开性论述 |
| **A**:使用装置的第一相机俘获第一图像,所述第一相机相对于所述装置的用户指向外<br>**未公开** | 对比文件未明确描述相机相对于用户“指向外”。文件描述了包含立体相机的系统,用于捕获用户的图像(例如,第[0038]段:“Embodiments of the present invention include a stereo camera...”)。 | 对比文件公开了使用相机捕获图像,但未明确限定第一相机的定向是相对于用户“指向外”。目标专利中“第一相机相对于用户指向外”旨在捕获用户视野的场景(说明书[0004],[0023]段),而对比文件中的相机是用于捕获用户本人(脸和手)的图像,两者作用不同。因此,本领域技术人员不能毫无疑义地得出该技术特征。 |
| **B**:使用所述装置的第二相机俘获第二图像,其中所述第二图像包含所述用户的眼睛<br>**未公开** | 对比文件描述了使用相机捕获包含用户脸和手的图像(例如,第[0038]段:“...the stereo camera is used to capture the user's face and hand...”)。 | 对比文件公开了捕获包含用户面部(可能包含眼睛)的图像,但其目的是用于皮肤颜色建模和脸部检测(第[0030]段),而非专门获取“用户的眼睛”图像以用于分析眼睛方向或注视点。目标专利中“第二图像包含用户的眼睛”是专门用于产生指示用户注视方向的概率图的核心前提(说明书[0004],[0023]段)。两者作用本质不同。因此,未被直接或隐含公开。 |
| **C**:基于所述第一图像中的一个或一个以上对象而产生第一概率图<br>**直接公开** | 第[0047]段:“a first probability map calculating unit for calculating a first probability map comprising of probabilities that respective pixels in the image corresponds to skin based on colour information associated with the respective pixels”。第[0030]段描述了从检测到的脸部区域提取颜色信息构建直方图并转换为概率分布,然后反向投影到图像上得到第一概率图(例如,第[0030]段:“...back projected onto the image in HS space yielding a probability map...”)。 | 对比文件明确公开了基于图像中的信息(皮肤颜色,可视为一种对象特征)计算第一概率图(M)。该概率图表示了图像中各像素对应于皮肤的概率。虽然“对象”具体指代不同(目标专利为场景中的对象,对比文件为皮肤区域),但“基于图像内容产生概率图”这一技术手段被直接公开。本领域技术人员能毫无疑义地得出基于图像(第一图像)中的特征(如颜色、形状等)来产生概率图的技术方案。 |
| **D**:基于所述第二图像中的所述用户的所述眼睛而产生第二概率图<br>**未公开** | 对比文件未提及基于用户眼睛图像产生概率图。对比文件公开了基于深度信息产生第二概率图(N)(第[0032]段,第[0047]段)。 | 目标专利的第二概率图基于“第二图像中的用户眼睛”产生,用于反映用户的注视兴趣(说明书[0004],[0023]段)。对比文件的第二概率图基于“深度信息”产生,用于反映物体到相机的距离以估计手部概率(第[0032]段)。两者基于的信息源完全不同,所起的作用也不同。因此,对比文件没有公开也未隐含公开该技术特征。 |
| **E**:基于所述第一和第二概率图而产生组合概率图<br>**直接公开** | 第[0033]段:“the joint probability map P indicates the probability of a pixel being a hand given its depth and colour. P is given by Equation (18) whereby P is the Hadamard product of M and N.” 第[0047]段:“a third probability map calculating unit for calculating a joint probability map by combining the first probability map and the second probability map”。 | 对比文件明确公开了将第一概率图(M,基于颜色)和第二概率图(N,基于深度)组合(例如通过哈达玛积/点乘)成联合概率图(P)的技术特征。这与目标专利中基于两个概率图产生组合概率图的技术手段一致。本领域技术人员能毫无疑义地得出。 |
| **F**:至少部分基于所述组合概率图而产生与所述第一图像中的所述一个或一个以上对象相关联的增强现实AR信息<br>**隐含公开** | 第[0033]段:“In step 324, the hands of the user are detected based on a joint probability map...”。第[0036]段提到系统可用于控制视频游戏、交互式信息亭等应用,这些应用需要基于检测到的手部信息进行交互。 | 对比文件使用联合概率图来检测和跟踪用户的手(对象)。检测到手部位置、运动等信息后,可以用于产生交互指令或覆盖信息,这本质上属于产生与图像中对象(手)相关联的增强信息(AR信息的一种形式)。虽然对比文件未明确使用“AR信息”这一术语,但本领域技术人员根据其公开的检测结果可用于增强现实交互(如控制游戏、地图)这一目的,能够合理推断出基于组合概率图可以产生与图像中对象相关联的增强信息。因此,该技术特征被隐含公开。 |
| **G**:其中基于所述组合概率图而产生所述AR信息包含基于所述组合优先级图而区分所述第一图像中的不同对象的优先级。<br>**未公开** | 对比文件未描述基于联合概率图对不同对象进行优先级区分。其检测手部后,并未说明对手或其他对象进行优先级排序处理。 | 目标专利中,基于组合概率图区分对象优先级是为了优化AR处理资源,优先处理用户更可能感兴趣的对象(说明书[0004],[0025]段)。对比文件中使用联合概率图是为了更准确地检测和跟踪手,并未涉及在多个对象间区分处理优先级的概念。两者作用不同。因此,未被公开。 |
| **H**:其中所述概率图包含多个瓦片,且至少部分基于所述第二图像中的所述用户的所述眼睛而给予所述概率图的一个或一个以上瓦片比其它瓦片高的优先级。<br>**未公开** | 对比文件的概率图是基于像素的(例如,第[0030]段:“probability map M... indicates the probability that the pixel i,j...”),未提及“瓦片”(tiles)这一划分概念。也未提及基于眼睛信息调整优先级。 | 目标专利中“瓦片”是图像划分和优先级分配的基本单元(说明书[0024]段,图3C-3D)。对比文件的概率图计算和对象检测均以像素或概率质量区域为单位,没有公开基于“瓦片”的结构。因此,该技术特征未被公开。 |
| **I**:其中所述第一概率图界定所述第一图像中的具有比所述第一图像中的其它区域高的包含感兴趣的对象的概率的一个或一个以上区域;并且所述第二概率图界定基于所述用户眼睛相对于所述第一图像中的其它区域具有更高的用户兴趣的概率的一个或一个以上区域。<br>**未公开** | 第一概率图部分:第[0030]段描述第一概率图(M)表示像素对应皮肤的概率,这可以理解为界定了皮肤概率更高的区域。<br>第二概率图部分:第[0032]段描述第二概率图(N)基于深度信息,表示像素对应手部的概率,其概率高低取决于物体与相机的距离,越近越高。 | 对于第一概率图,对比文件部分公开了“界定具有更高概率的区域”这一概念。然而,对于第二概率图,目标专利界定的是“基于用户眼睛的...用户兴趣的概率”,其反映的是用户的主观注意力方向。对比文件界定的则是“基于深度信息的手部概率”,反映的是物体的客观空间位置。两者所基于的信息和所界定的“概率”内涵根本不同。因此,技术特征I作为一个整体,其第二概率图部分未被公开,导致该整体技术特征未被公开。 |
| **J**:其进一步包括产生所述第一或第二图像中的至少一者的镜像版本,使得所述第一和第二图像从共同角度对准,其中所述第一和第二概率图中的至少一者是基于所述镜像版本而产生。<br>**未公开** | 对比文件未提及对图像进行镜像处理以实现角度对准。其使用立体相机,两个相机的图像本身是从略有不同的空间位置获取,但用于计算视差,并未提及需要镜像对准。 | 目标专利中产生镜像版本是因为第一相机(向外)和第二相机(向用户)指向相反方向,需要镜像以使视角一致(说明书[0028]段,图3B)。对比文件未描述相机具有此种相对关系,也未提及图像镜像处理。因此,该技术特征未被公开。 |
| **K**:其中使所述第一和第二图像时间同步。<br>**直接公开** | 对比文件使用立体相机系统,其两个相机捕获的图像是同一时刻的场景(第[0032]段提及使用立体相机获取深度信息)。方法流程(图3,步骤302)中获取“a new frame”,该帧应包含来自立体相机的时间同步的图像数据。 | 对比文件虽未明确使用“时间同步”一词,但立体相机系统捕获左右视图用于计算视差图,这必然要求两幅图像是同一时刻捕获的,即时间同步。本领域技术人员能够毫无疑义地从立体相机的工作原理中得出第一和第二图像是时间同步的。因此,该技术特征被直接公开。 |
| **L**:其进一步包括针对第一图像序列和第二图像序列的每个图像来重复所述方法,其中所述第一图像序列与所述第二图像序列时间同步。<br>**隐含公开** | 第[0030]段:“The system in the example embodiments starts running without a skin-colour model. A new frame is acquired in step 302.” 图3所示的流程是一个循环过程,对每个新获取的帧(frame)执行后续步骤。 | 对比文件描述的方法是一个持续运行的过程,针对每个新获取的帧(即图像序列中的每个图像)执行检测和跟踪步骤。由于立体相机持续捕获时间同步的图像序列,该方法必然针对时间同步的图像序列的每个图像重复执行。本领域技术人员能够从该方法持续运行的描述中合理推断出此特征。因此,被隐含公开。 |
| **M**:其进一步包括针对第一图像序列中的每第N图像以及第二图像序列中的每第N图像来重复所述方法,其中所述第一图像序列与所述第二图像序列时间同步,且其中N表示大于或等于2的整数。<br>**未公开** | 对比文件未提及跳帧处理(即每第N图像)。其描述的是对每个新帧进行处理(步骤302)。 | 目标专利中该特征是为了节省处理资源(说明书[0038]段)。对比文件的方法旨在实时检测和跟踪,未公开或暗示可以跳过某些帧进行处理。因此,该技术特征未被公开。 |
| **N**:其中通过包含所述第一相机、所述第二相机和显示器的手持式装置来执行所述方法。<br>**未公开** | 对比文件描述的系统包括立体相机、显示器和计算机(第[0038], [0041]段,图6),但未限定为“手持式装置”。 | 目标专利明确要求方法在“手持式装置”中执行,这是其解决手持设备处理能力有限问题的重要上下文(说明书[0003], [0025]段)。对比文件未提及装置是手持式的。因此,该技术特征未被公开。 |
| **O**:其中实时地执行所述方法。<br>**直接公开** | 第[0008]段:“...the model training and classification system work in real-time...”。第[0036]段:“...the system can detect hand motions in public places... in real-time.” | 对比文件多次明确提到系统是“实时(real-time)”工作的。这与目标专利中实时产生和显示AR信息的要求一致。因此,该技术特征被直接公开。 |
| **P**:其进一步包括:使用所述第一相机俘获第一图像序列,使用所述第二相机俘获第二图像序列,其中所述第二图像序列包含所述用户的所述眼睛。<br>**未公开** | 对比文件描述了使用相机捕获图像序列(第[0030]段:“A new frame is acquired...”),但第二图像序列(如果立体相机的另一路图像可视为第二序列)包含的是用于深度计算和手部检测的信息,并非专门包含“用户的眼睛”序列。 | 该技术特征实质上是特征A和B在图像序列层面的延伸。如前述,对比文件未公开专门捕获包含“用户的眼睛”的图像(第二图像),因此其序列版本也未被公开。 |
| **Q**:基于所述第二图像序列中的所述用户的所述眼睛而产生多个概率图。<br>**未公开** | 对比文件未提及基于眼睛图像序列产生概率图。 | 该技术特征是特征D在序列层面的延伸。由于特征D未被公开,因此Q也未被公开。 |
| **R**:至少部分基于所述多个概率图而产生所述AR信息。<br>**未公开** | 对比文件未提及基于多个(基于眼睛的)概率图产生AR信息。 | 该技术特征依赖于特征Q,而Q未被公开。对比文件产生AR信息(如交互指令)是基于联合概率图(组合概率图),而非专门基于多个来自眼睛序列的概率图。因此,未被公开。 |
| **S**:显示所述AR信息与所述第一图像序列。<br>**未公开** | 对比文件未明确描述将产生的AR信息(如手部位置、控制指令)与原始图像序列一起显示。其可能显示检测结果,但未明确说明是覆盖在图像上的增强现实式显示。 | 目标专利中“显示AR信息与第一图像”是增强现实的典型体现,即信息覆盖在图像上(说明书[0002], [0022]段)。对比文件未公开此显示方式。因此,该技术特征未被公开。 |
| **T**:其进一步包括通过以优先级区分的次序处理AR信息而基于所述不同对象的优先级区分来执行对所述不同对象的对象识别。<br>**未公开** | 对比文件未描述基于优先级次序处理对象识别。其对象识别(手部检测)是基于联合概率图一次性完成的,未引入处理次序的优先级概念。 | 该技术特征是特征G的进一步具体化。如特征G所述,对比文件没有公开优先级区分,因此也未公开基于优先级次序执行对象识别。 |
| **U**:其进一步包括显示所述增强现实AR信息与所述第一图像。<br>**未公开** | 同特征S,对比文件未明确描述显示覆盖在图像上的AR信息。 | 同特征S,该技术特征未被公开。 |
<<<C>>><<<E>>><<<K>>><<<f>>><<<l>>>