2002-08-20_US6437758B_发明授权_US06437758B1 Method and apparatus for eyetrack—mediated downloading_+++B_D_O_g_k_q+++.docx

**对比文件名称**:2002-08-20_US6437758B_发明授权_US06437758B1 Method and apparatus for eyetrack—mediated downloading

**目标专利名称**:基于手持式装置中的眼睛俘获的增强现实处理 CN103262097B

**本次调用的模型名称**:gpt-4

以下是根据您的要求创建的特征比对表格,严格依据目标专利权利要求的技术特征划分进行比对。

### 特征比对表格

技术特征描述及公开性判断对比文件原文引用公开性论述
**技术特征A**:其包含:使用装置的第一相机俘获第一图像,所述第一相机相对于所述装置的用户指向外<br>**公开性判断**:未公开未发现明确记载。目标专利中的“第一相机”是用于俘获用户所观看的外界场景(第一图像)的相机。对比文件涉及的是在计算机显示设备上确定用户注视位置的眼动跟踪系统。对比文件描述的系统包含显示设备(图2的203)、眼动跟踪设备(图2的201)以及处理单元,其处理的是显示屏幕上已有的或正在下载的图像(如图5的505、513、519),并未提及或隐含一个专门用于“指向外”以俘获用户前方现实世界场景的“第一相机”。因此,对比文件未公开技术特征A。
**技术特征B**:使用所述装置的第二相机俘获第二图像,其中所述第二图像包含所述用户的眼睛<br>**公开性判断**:《直接公开》说明书第2栏第24-31行:“Gaze Tracking Devices...These devices often include image processing capabilities that operate on a video image of an eye to determine the gaze direction of the eye.”; 图2及对应描述:展示了一个附着在计算机显示器(203)上的眼动跟踪设备(201),该设备包含视频透镜(205)。对比文件明确描述了使用眼动跟踪设备,该设备通过视频图像来捕获用户的眼睛,以确定注视方向。图2所示的设备(201)即相当于一个用于捕获用户眼睛图像(第二图像)的“第二相机”。因此,本领域技术人员能够毫无疑义地从对比文件中得出技术特征B。
**技术特征C**:基于所述第一图像中的一个或一个以上对象而产生第一概率图<br>**公开性判断**:未公开未发现明确记载。目标专利的“第一概率图”是基于向外俘获的场景图像(第一图像)中的对象分析产生的,用于标识图像中可能包含感兴趣对象的区域(如说明书第[0033]段)。对比文件并未对任何由“第一相机”俘获的场景图像进行对象分析以产生此类概率图。对比文件关注的焦点是基于用户注视位置来确定屏幕上哪个“视图”(view)或“区域”(area)是用户感兴趣的(如图5的515),这完全不同于从场景图像内容本身分析对象概率。因此,技术特征C未被公开。
**技术特征D**:基于所述第二图像中的所述用户的所述眼睛而产生第二概率图<br>**公开性判断**:《直接公开》说明书第4栏第38行至第5栏第7行(结合图3、4):“The gaze position is developed when the system detects that the user has become interested in a particular area of the display...The process examines the gaze coordinates (raw) for a focus pattern...determines an area of focus...the gaze position is made available...In the case where the gaze position is presented as an area...”; 图3展示了基于原始注视坐标确定的注视位置区域(305, 309)。对比文件详细描述了基于从眼动跟踪设备(第二相机)获得的原始注视坐标(raw gaze coordinates),通过处理和分析(例如,检测聚焦模式、确定聚焦区域)来产生一个“注视位置”(gaze position)。这个“注视位置”可以是一个点(307)或一个区域(305, 309),它标识了用户眼睛注视所对应的屏幕区域。该“注视位置”在功能和作用上与目标专利的“第二概率图”(用于标识用户基于眼睛注视而可能感兴趣的区域)相同,都是将眼睛图像信息转化为一个表示兴趣概率的空间分布指示。因此,技术特征D被对比文件直接公开。
**技术特征E**:基于所述第一和第二概率图而产生组合概率图<br>**公开性判断**:未公开未发现明确记载。目标专利的“组合概率图”是将基于场景对象分析的第一概率图和基于眼睛注视的第二概率图进行组合(例如相乘)得到的(参见图5及说明书第[0055]-[0057]段)。对比文件仅公开了基于眼睛注视确定兴趣区域(即第二概率图),没有公开任何基于场景图像内容分析产生的第一概率图,因此更不存在将两者组合以产生一个“组合概率图”的技术方案。技术特征E未被公开。
**技术特征F**:至少部分基于所述组合概率图而产生与所述第一图像中的所述一个或一个以上对象相关联的增强现实AR信息<br>**公开性判断**:未公开未发现明确记载。由于对比文件未公开“第一概率图”和“组合概率图”(技术特征C、E),因此也就不可能公开“基于组合概率图产生AR信息”。此外,对比文件中基于注视位置触发的操作(如增加特定图像下载带宽、提供音频字幕、调整文本大小)是针对计算机显示内容的系统响应,并非目标专利所定义的、与向外俘获的现实场景图像中的对象相关联并叠加显示的“增强现实(AR)信息”。因此,技术特征F未被公开。
**技术特征G**:其中基于所述组合概率图而产生所述AR信息包含基于所述组合优先级图而区分所述第一图像中的不同对象的优先级。<br>**公开性判断**:《隐含公开》说明书第6栏第20-33行(结合图5、6):“If the user is interested in the image labeled as 513...a gaze position area 515 intersects the image 513 thus identifying the image 513 as an area of interest...Once the area of interest is determined, the system obtains the bandwidth allocated to the area of interest and, if possible, increases the bandwidth allocation...”对比文件公开了基于用户注视位置(相当于第二概率图)来确定屏幕上哪个图像(或区域)是“感兴趣区域”(area of interest),并据此优先增加该区域对应数据流的带宽。这体现了基于用户注视这一单一因素,对屏幕上不同内容(可类比为“不同对象”)进行优先级区分的思想。虽然对比文件没有“组合概率图”,但其核心逻辑“基于反映用户兴趣的指标(眼睛注视)来区分处理优先级”与技术特征G中“基于优先级图区分对象优先级”的部分实质是相通的。本领域技术人员可以从对比文件公开的“基于注视区分下载优先级”合理推断出,在具备组合概率图的情况下,可以基于该图来区分对象处理的优先级。因此,技术特征G被对比文件隐含公开。
**技术特征H**:其中所述概率图包含多个瓦片,且至少部分基于所述第二图像中的所述用户的所述眼睛而给予所述概率图的一个或一个以上瓦片比其它瓦片高的优先级。<br>**公开性判断**:未公开未发现明确记载。目标专利的“瓦片”(tile)是将图像划分为多个规则网格区域的概念(如图3C)。对比文件中确定和表示用户兴趣区域的方式是注视点(307)或注视区域(圆形305、309),并未将屏幕或图像预先划分为多个“瓦片”并为每个瓦片分配基于眼睛注视的优先级值。技术特征H中“概率图包含多个瓦片”这一具体划分方式未被对比文件公开。
**技术特征I**:其中所述第一概率图界定所述第一图像中的具有比所述第一图像中的其它区域高的包含感兴趣的对象的概率的一个或一个以上区域;并且所述第二概率图界定基于所述用户眼睛相对于所述第一图像中的其它区域具有更高的用户兴趣的概率的一个或一个以上区域。<br>**公开性判断**:未公开对于“第一概率图”部分:未发现明确记载。<br>对于“第二概率图”部分:参见技术特征D的引用。技术特征I包含两个并列部分。第一部分关于“第一概率图”的界定,对比文件未公开,理由同技术特征C。第二部分关于“第二概率图”的界定,对比文件公开的“注视位置”(gaze position)确实界定了基于用户眼睛相对于其他区域具有更高用户兴趣概率的区域(如图3的305、309区域)。然而,由于技术特征I是一个整体特征,其第一部分未被公开,导致整个技术特征I所描述的两个概率图并存的方案未被对比文件公开。
**技术特征J**:其进一步包括产生所述第一或第二图像中的至少一者的镜像版本,使得所述第一和第二图像从共同角度对准,其中所述第一和第二概率图中的至少一者是基于所述镜像版本而产生。<br>**公开性判断**:未公开未发现明确记载。目标专利中产生镜像版本是为了解决第一相机(向外)和第二相机(向内)方向相对的问题,使两者的图像能从同一视角进行对准(说明书第[0028]段)。对比文件的眼动跟踪设备(相机)和显示屏幕都面向用户,不存在两个相机方向相对、需要镜像对准的场景。因此,技术特征J未被公开。
**技术特征K**:其中使所述第一和第二图像时间同步。<br>**公开性判断**:《隐含公开》说明书第4栏第38-40行:“The gaze position is developed when the system detects that the user has become interested in a particular area of the display.”; 整个系统实时响应用户的注视。对比文件描述的眼动跟踪系统持续监控用户眼睛,并根据实时或近实时的注视数据来确定用户当前感兴趣的显示区域。这意味着系统处理的“用户眼睛图像”(第二图像)与“当前显示内容”(可类比为第一图像,尽管不是由向外相机俘获)在时间上是关联的、同步的,以反映用户当下对显示内容的关注。本领域技术人员可以合理推断,为了准确关联注视点与显示内容,系统需要使眼睛图像与对应的显示内容在时间上同步。因此,技术特征K被对比文件隐含公开。
**技术特征L**:其进一步包括针对第一图像序列和第二图像序列的每个图像来重复所述方法,其中所述第一图像序列与所述第二图像序列时间同步。<br>**公开性判断**:未公开未发现明确记载。对比文件描述了系统持续监控注视位置并作出响应,这是一种连续处理模式,但并未明确揭示其是针对“第一图像序列”(向外场景视频流)和“第二图像序列”(眼睛视频流)的“每个图像”进行重复处理的方法步骤,也未明确这两个序列的概念及其时间同步关系。技术特征L限定了具体的重复执行方式,对比文件未达到此披露程度。
**技术特征M**:其进一步包括针对第一图像序列中的每第N图像以及第二图像序列中的每第N图像来重复所述方法,其中所述第一图像序列与所述第二图像序列时间同步,且其中N表示大于或等于2的整数。<br>**公开性判断**:未公开未发现明确记载。对比文件未提及任何以跳帧(每第N图像)方式进行处理以节省资源的技术方案。技术特征M是目标专利中一个具体的优化实施方式,未被对比文件公开。
**技术特征N**:其中通过包含所述第一相机、所述第二相机和显示器的手持式装置来执行所述方法。<br>**公开性判断**:未公开对比文件附图1、2展示的系统包含计算机(102)、显示器(147/203)、眼动跟踪设备(155/201)等,属于台式计算机系统环境。对比文件实施于传统的台式计算机系统(如图1的102),其显示器(147/203)和眼动跟踪设备(201)并非集成于一个“手持式装置”中。目标专利明确要求方法是“通过...手持式装置来执行”,这是对装置形态的限定。对比文件未公开手持式装置这一特定技术特征。
**技术特征O**:其中实时地执行所述方法。<br>**公开性判断**:《直接公开》说明书第2栏第28-31行:“Image processing software on the computer computes the user's gazepoint on the display sixty times a second...”; 说明书第6栏描述根据实时注视调整带宽。对比文件明确说明了眼动跟踪系统以每秒60次的频率计算用户注视点,并且基于实时的注视位置来调整下载带宽(图6流程)。这清楚地表明其方法是“实时地执行”的。因此,技术特征O被对比文件直接公开。
**技术特征P**:其进一步包括:使用所述第一相机俘获第一图像序列,使用所述第二相机俘获第二图像序列,其中所述第二图像序列包含所述用户的所述眼睛。<br>**公开性判断**:未公开对于“第一相机俘获第一图像序列”:未发现明确记载。<br>对于“第二相机俘获第二图像序列”:眼动跟踪设备持续工作,可视为俘获序列图像。技术特征P包含使用第一相机俘获向外场景的图像序列。对比文件未公开用于俘获向外场景的“第一相机”,因此更谈不上由其俘获“第一图像序列”。虽然眼动跟踪设备可视为持续俘获眼睛图像序列(第二图像序列),但由于技术特征P是一个整体步骤,其关键部分未被公开,故整个技术特征P未被公开。
**技术特征Q**:基于所述第二图像序列中的所述用户的所述眼睛而产生多个概率图。<br>**公开性判断**:《隐含公开》系统持续产生注视位置(gaze position),例如每秒60次(说明书第2栏)。每个注视位置可视为一个基于当前眼睛图像的“概率图”。对比文件描述系统持续(如每秒60次)基于眼睛图像确定用户的注视位置(参见技术特征D、O)。这一系列随时间产生的注视位置,每个都标识了基于当前眼睛图像的用户兴趣区域,其集合即相当于“基于第二图像序列...产生多个概率图”。本领域技术人员能够从对比文件持续监控并产生注视位置的功能中,合理推断出技术特征Q。因此,技术特征Q被对比文件隐含公开。
**技术特征R**:至少部分基于所述多个概率图而产生所述AR信息。<br>**公开性判断**:未公开未发现明确记载。即使认为对比文件隐含公开了“多个概率图”(技术特征Q),其基于这些概率图所产生的响应(带宽调整、字幕播放、文本缩放)也并非目标专利所定义的“增强现实(AR)信息”。AR信息特指与向外俘获的现实场景图像中的对象相关联并叠加显示的补充信息。因此,技术特征R未被公开。
**技术特征S**:显示所述AR信息与所述第一图像序列。<br>**公开性判断**:未公开未发现明确记载。由于对比文件未公开“AR信息”(技术特征F、R)及由“第一相机”俘获的“第一图像序列”(技术特征P),因此也就不可能公开“显示AR信息与第一图像序列”这一步骤。技术特征S未被公开。
**技术特征T**:其进一步包括通过以优先级区分的次序处理AR信息而基于所述不同对象的优先级区分来执行对所述不同对象的对象识别。<br>**公开性判断**:未公开未发现明确记载。对比文件公开了基于注视位置区分处理优先级(如优先下载),但区分优先级后执行的是“增加带宽”等系统操作,而非目标专利中特定的“对象识别”(Object Recognition)步骤。对象识别是AR处理的核心,用于识别场景中的具体物体或人脸等。对比文件未涉及此类技术。因此,技术特征T未被公开。
**技术特征U**:其进一步包括显示所述增强现实AR信息与所述第一图像。<br>**公开性判断**:未公开未发现明确记载。理由同技术特征S。对比文件未公开“AR信息”与“第一图像”的组合显示。其显示的是常规的计算机界面内容及基于注视的系统反馈,并非叠加在向外场景图像上的AR信息。

### 公开性判断总结及代码输出

根据上述比对分析:

- **直接公开**的技术特征有:**B**、**D**、**O**。

- **隐含公开**的技术特征有:**G**、**K**、**Q**。

- 其余技术特征(A、C、E、F、H、I、J、L、M、N、P、R、S、T、U)既未被直接公开,也未被隐含公开。

根据输出格式要求,在回答结尾插入对应的代码。

<<<B>>><<<D>>><<<O>>><<<g>>><<<k>>><<<q>>>

权利要求与技术特征
Powered by Django

网站备案号:渝ICP备2023012882号


重庆市非显而易见网络科技有限责任公司 A Anti NPE NPE