对比文件名称:2009-07-07_US7556377B_发明授权_US07556377B2 System and method of detecting eye fixations using adaptive thresholds
目标专利名称:基于手持式装置中的眼睛俘获的增强现实处理CN103262097B
本次调用的模型名称:深度思考模型
| 技术特征描述及公开性判断结果 | 对比文件原文引用 | 公开性论述 |
| A: 使用装置的第一相机俘获第一图像,所述第一相机相对于所述装置的用户指向外《未被公开》 | 未找到相关内容。对比文件仅描述了用于捕获用户眼睛视频的相机(见[0002]段及图1)。 | 对比文件所公开的系统(见图1及[0002]段)仅包含一个用于记录用户眼睛视频的相机(104),其目的是确定用户在显示器(102)上的注视点。该相机指向用户,而非如目标专利所述“相对于用户指向外”以俘获用户观看的场景。因此,本领域技术人员无法从对比文件中直接或隐含地得出使用向外指向的相机俘获场景图像的技术方案。 |
| B: 使用所述装置的第二相机俘获第二图像,其中所述第二图像包含所述用户的眼睛《隐含公开》 | [0002]段:“In eye gaze tracking, a camera placed near a visual display records graphical data including the position of the user's pupils...”;[0012]段:“...A camera records video data of the user's eye...”;图1及相关描述。 | 对比文件明确公开了使用相机(104)记录用户眼睛的视频数据,其中包含用户瞳孔的位置([0002]段)。虽然对比文件系统可能仅使用单个相机追踪眼睛,但“使用相机俘获包含用户眼睛的图像”这一技术手段已被明确公开。本领域技术人员可以毫无疑义地理解,为了执行眼睛注视追踪,系统必然需要获取包含用户眼睛的图像。因此,该技术特征被对比文件隐含公开。 |
| C: 基于所述第一图像中的一个或一个以上对象而产生第一概率图《未被公开》 | 未找到相关内容。对比文件未涉及对向外相机俘获的场景图像进行对象分析或生成概率图。 | 对比文件的核心在于通过分析眼睛视频数据来检测注视点(fixations),其处理对象是眼睛位置坐标数据(x, y, t),而非对场景图像中的对象进行分析以生成表示“包含感兴趣对象的概率”的图。因此,对比文件没有公开,本领域技术人员也无法通过推理得出基于场景图像生成第一概率图的技术方案。 |
| D: 基于所述第二图像中的所述用户的所述眼睛而产生第二概率图《未被公开》 | 未找到相关内容。对比文件基于眼睛视频数据计算的是注视点(fixations)和扫视估计(saccade estimate),例如Sx和Sy(见[0040]-[0042]段),这是一种用于区分注视和扫视的自适应阈值,并非表示“用户兴趣的概率”的图。 | 对比文件通过处理眼睛图像数据,得到的是用于检测注视事件的阈值(如扫视估计Sx, Sy)以及最终的注视点坐标区域(如方框118, 120, 122,见图4)。这不同于目标专利中基于眼睛位置/方向生成的、用于指示图像中不同区域用户兴趣概率的“概率图”。目标专利的概率图(如图3D, 4B)旨在为AR处理的区域划分优先级,而对比文件的输出是确定的注视区域。两者目的和形式均不同,因此未被公开。 |
| E: 基于所述第一和第二概率图而产生组合概率图《未被公开》 | 未找到相关内容。 | 由于对比文件既未公开第一概率图(特征C),也未公开第二概率图(特征D),因此更不可能公开将两者组合产生组合概率图的技术特征。 |
| F: 至少部分基于所述组合概率图而产生与所述第一图像中的所述一个或一个以上对象相关联的增强现实AR信息《未被公开》 | 未找到相关内容。 | 对比文件的应用场景是分析用户在显示器上的注视行为(例如用于网页或界面设计反馈,见[0003]段),并未涉及任何增强现实(AR)信息的产生或与场景中对象的关联。因此,该特征未被公开。 |
| G: 其中基于所述组合概率图而产生所述AR信息包含基于所述组合优先级图而区分所述第一图像中的不同对象的优先级《未被公开》 | 未找到相关内容。 | 同上,对比文件未涉及AR信息产生,也未涉及基于概率图对场景中的对象进行优先级区分以进行AR处理。 |
| H: 其中所述概率图包含多个瓦片,且至少部分基于所述第二图像中的所述用户的所述眼睛而给予所述概率图的一个或一个以上瓦片比其它瓦片高的优先级《未被公开》 | 未找到相关内容。 | 对比文件中描述的眼睛注视分析是基于连续的坐标点(x, y)和随时间变化的序列来定义注视区域(如图4中的方框118, 120, 122),并未采用“瓦片”(tiles)划分图像区域并基于眼睛信息为瓦片分配不同优先级的概念。因此,该具体限定未被公开。 |
| I: 其中所述第一概率图界定所述第一图像中的具有比所述第一图像中的其它区域高的包含感兴趣的对象的概率的一个或一个以上区域;并且中所述第二概率图界定基于所述用户眼睛相对于所述第一图像中的其它区域具有更高的用户兴趣的概率的一个或一个以上区域《未被公开》 | 未找到相关内容。 | 该特征对第一、第二概率图的具体定义进行了限定。对比文件既未公开对场景图像进行对象概率分析(第一概率图),也未公开基于眼睛生成表示“用户兴趣的概率”的图(第二概率图)。因此,该具体限定未被公开。 |
| J: 其进一步包括产生所述第一或第二图像中的至少一者的镜像版本,使得所述第一和第二图像从共同角度对准,其中所述第一和第二概率图中的至少一者是基于所述镜像版本而产生《未被公开》 | 未找到相关内容。 | 对比文件仅处理来自单一相机(指向用户)的眼睛视频数据,不存在需要将两个相机(一个向内,一个向外)的图像进行对准的问题。因此,未公开产生镜像版本以实现图像对准的技术特征。 |
| K: 其中使所述第一和第二图像时间同步《隐含公开》 | [0002]段:“...a streaming estimate of the spot on the display viewed by the user may be generated and recorded as a stream of gaze points (x, y, t).”;[0029]段:“The data points may be recorded...for later analysis or may be analyzed in real-time...” | 对比文件虽然未明确提及“第一图像”和“第二图像”的时间同步,但其核心是处理与时间戳(t)关联的眼睛位置数据流(x, y, t)。为了实现准确的注视点估计,眼睛图像(即“第二图像”)的捕获时间必须与所估计的注视点位置时间相关联,这隐含了数据采集的时间同步性。本领域技术人员可以合理推断,在眼睛追踪系统中,图像捕获与数据处理是时间关联的。因此,该广义的“时间同步”概念被隐含公开。但需注意,目标专利中特指两个相机图像间的时间同步,而对比文件是单相机系统。 |
| L: 其进一步包括针对第一图像序列和第二图像序列的每个图像来重复所述方法,其中所述第一图像序列与所述第二图像序列时间同步《未被公开》 | 未找到相关内容。 | 对比文件描述的是对眼睛视频数据流进行连续处理以检测注视点(见流程图600)。虽然这涉及对序列中数据点的重复处理,但对比文件仅涉及一个图像序列(眼睛视频),并未公开存在与眼睛图像序列时间同步的、由另一相机捕获的“第一图像序列”。因此,该涉及双序列同步重复处理的特征未被公开。 |
| M: 其进一步包括针对第一图像序列中的每第N图像以及第二图像序列中的每第N图像来重复所述方法,其中所述第一图像序列与所述第二图像序列时间同步,且其中N表示大于或等于2的整数《未被公开》 | 未找到相关内容。 | 对比文件未提及以跳过帧(每第N帧)的方式进行处理。其处理流程(如图6,7)是针对连续数据点或时间窗口进行的,没有公开按固定间隔抽取图像进行处理的技术方案。 |
| N: 其中通过包含所述第一相机、所述第二相机和显示器的手持式装置来执行所述方法《未被公开》 | 未找到相关内容。对比文件图1所示系统包含显示器(102)和相机(104),但未限定其为“手持式装置”。其描述更倾向于一个设置在用户面前的固定系统(如[0025]段“integrated into the frame of the display”)。 | 对比文件未明确或隐含公开其系统是手持式装置。其描述(如显示器、集成在显示器框架中的相机)更符合桌面式或固定式眼睛追踪系统的典型配置。因此,“手持式装置”这一特定设备类型未被公开。 |
| O: 其中实时地执行所述方法《隐含公开》 | [0003]段:“...gaze tracking stream in real time has been used to augment a graphical user interface.”;[0029]段:“...or may be analyzed in real-time...” | 对比文件明确提到了“实时”(real time)生成注视点流以及实时分析的可能性。虽然其实时应用场景(如增强GUI)与目标专利的AR处理不同,但“实时地执行方法”这一时间特性已被对比文件明确公开。因此,该特征被直接公开。 |
| P: 其进一步包括:使用所述第一相机俘获第一图像序列,使用所述第二相机俘获第二图像序列,其中所述第二图像序列包含所述用户的所述眼睛《未被公开》 | 未找到相关内容。 | 对比文件公开了使用相机记录用户眼睛的视频数据(即序列),如[0012]段所述。这相当于公开了“使用第二相机俘获包含用户眼睛的第二图像序列”。然而,对比文件并未公开存在用于俘获向外场景的“第一相机”或“第一图像序列”。因此,该同时涉及两个相机序列的技术特征作为一个整体未被公开。 |
| Q: 基于所述第二图像序列中的所述用户的所述眼睛而产生多个概率图《未被公开》 | 未找到相关内容。 | 如特征D所述,对比文件基于眼睛序列产生的是注视点或自适应阈值,而非目标专利所定义的“概率图”。因此,该特征未被公开。 |
| R: 至少部分基于所述多个概率图而产生所述AR信息《未被公开》 | 未找到相关内容。 | 如特征F所述,对比文件未涉及AR信息的产生。 |
| S: 显示所述AR信息与所述第一图像序列《未被公开》 | 未找到相关内容。 | 对比文件未涉及将AR信息与场景图像序列一起显示。 |
| T: 其进一步包括通过以优先级区分的次序处理AR信息而基于所述不同对象的优先级区分来执行对所述不同对象的对象识别《未被公开》 | 未找到相关内容。 | 对比文件未涉及对象识别,也未涉及基于优先级次序处理AR信息。其注视点检测算法(如图6,7流程)是用于确定连续数据点是否属于一个注视事件,而非用于对不同的外部对象进行识别和优先级排序。 |
| U: 其进一步包括显示所述增强现实AR信息与所述第一图像《未被公开》 | 未找到相关内容。 | 对比文件未涉及显示AR信息。其输出是注视点数据或注视区域,可能用于分析或界面控制,但并非覆盖在场景图像上的AR信息。 |
<<<O>>><<<b>>><<<k>>>