2010-10-14_US2010260426A_发明申请_US20100260426A1 SYSTEMS AND METHODS FOR IMAGE RECOGNITION USING MOBILE DEVICES_+++A_L_M_N_O_S_U_c_g_t+++.docx

对比文件名称:2010-10-14_US2010260426A_发明申请_US20100260426A1 SYSTEMS AND METHODS FOR IMAGE RECOGNITION USING MOBILE DEVICES

目标专利名称:基于手持式装置中的眼睛俘获的增强现实处理CN103262097B

模型名称:DeepSeek-R1

## 特征比对表格

技术特征描述以及公开性判断结果对比文件原文引用公开性论述
**技术特征A:** 使用装置的第一相机俘获第一图像,所述第一相机相对于所述装置的用户指向外<br>**《直接公开》**[0021] "mobile device 130 can acquire and pre-process an image 100 to initiate a mobile visual search." <br>[0031] "mobile device 130 can acquire and pre-process an image 100 to initiate a mobile visual search. Mobile device can detect one or more objects based on clusters of salient features, or features of interest, in image 100..." <br>[0041] "image sensor 200 can generate image 100 after capturing an area covering the target."对比文件公开了移动设备(如手机)使用其图像传感器(image sensor 200)捕获图像(image 100)以启动视觉搜索。根据移动设备的常规使用方式,用户将设备指向外部目标以捕获图像,这意味着图像传感器相对于用户指向外。本领域技术人员能够毫无疑义地得出该技术方案。因此,技术特征A被对比文件直接公开。
**技术特征B:** 使用所述装置的第二相机俘获第二图像,其中所述第二图像包含所述用户的眼睛<br>**《未公开》**对比文件全文仅描述了使用单个图像传感器(image sensor 200)捕获包含外部目标的图像(image 100)。没有提及存在第二个相机,也没有提及捕获包含用户眼睛的图像。因此,技术特征B未被对比文件公开。
**技术特征C:** 基于所述第一图像中的一个或一个以上对象而产生第一概率图<br>**《隐含公开》**[0041] "mobile device 130 can detect one or more objects based on clusters of salient features... in image 100" <br>[0045] "mobile device 130 can determine the detected objects' categories by generating, in real-time, feature vectors corresponding to the detected objects and comparing the feature vectors with image coefficients of possible image candidates..." <br>[0061] "mobile device 130 can compare the selected object's feature vector with image coefficients of trained images stored in image coefficient library 262 to recognize or otherwise determine characteristics of the selected object."对比文件公开了移动设备检测图像中的一个或多个对象,并为检测到的对象生成特征向量,通过将其与训练图像的系数库进行比较来识别或确定对象类别/特征。这个过程本质上是评估图像中特定区域(即对象所在区域)包含“感兴趣对象”(即可识别对象)的概率。虽然对比文件未明确使用“概率图”这一术语,但其描述的“检测对象并基于特征匹配进行识别”的技术手段,在功能上等同于目标专利中“基于图像中的对象产生概率图”以评估对象识别优先级的技术构思。本领域技术人员可以从对比文件的内容中合理推断出这一技术特征。因此,技术特征C被对比文件隐含公开。
**技术特征D:** 基于所述第二图像中的所述用户的所述眼睛而产生第二概率图<br>**《未公开》**如技术特征B所述,对比文件未公开使用第二相机捕获包含用户眼睛的图像。因此,基于不存在的第二图像中的用户眼睛来产生概率图的技术特征D也未被公开。
**技术特征E:** 基于所述第一和第二概率图而产生组合概率图<br>**《未公开》**由于对比文件未公开技术特征D(第二概率图),因此将第一概率图与第二概率图进行组合以产生组合概率图的技术特征E也必然未被公开。
**技术特征F:** 至少部分基于所述组合概率图而产生与所述第一图像中的所述一个或一个以上对象相关联的增强现实AR信息<br>**《未公开》**由于技术特征E(组合概率图)未被公开,因此“至少部分基于所述组合概率图而产生AR信息”的技术特征F也未被公开。
**技术特征G:** 其中基于所述组合概率图而产生所述AR信息包含基于所述组合优先级图而区分所述第一图像中的不同对象的优先级。<br>**《隐含公开》**[0042] "mobile device 130 can highlight or otherwise indicate detected objects of the image by superimposing indicators over the image." <br>[0042] "mobile device 130 can receive input from the user to select at least one of the highlighted objects..." <br>[0065] "mobile device 130 can crop, compress, scale, convert to grayscale, or otherwise process the acquired image to extract or otherwise generate at least one sub-image based on the selected object."对比文件公开了移动设备检测并高亮显示图像中的多个对象(参见图6A, 6B),用户可以从高亮对象中选择一个(即用户指示了其感兴趣的对象)。随后,移动设备基于用户选择的该对象来处理图像(例如裁剪)并生成视觉搜索查询。这个过程隐含了基于用户的选择(一种优先级指示)来区分图像中不同对象的处理优先级,用户选择的对象获得最高优先级并被进一步处理以生成相关信息(即一种AR信息)。虽然对比文件中的优先级区分基于用户显式选择,而非基于眼睛的概率图,但“区分对象优先级以产生相关信息”的核心技术构思是相同的。本领域技术人员可以合理推断出这一特征。因此,技术特征G被对比文件隐含公开。
**技术特征H:** 其中所述概率图包含多个瓦片,且至少部分基于所述第二图像中的所述用户的所述眼睛而给予所述概率图的一个或一个以上瓦片比其它瓦片高的优先级。<br>**《未公开》**对比文件未将图像划分为“瓦片”(tiles)来处理,也未提及基于用户眼睛给予某些瓦片更高优先级。因此,技术特征H未被公开。
**技术特征I:** 其中所述第一概率图界定所述第一图像中的具有比所述第一图像中的其它区域高的包含感兴趣的对象的概率的一个或一个以上区域;并且中所述第二概率图界定基于所述用户眼睛相对于所述第一图像中的其它区域具有更高的用户兴趣的概率的一个或一个以上区域。<br>**《未公开》**对比文件部分公开了第一概率图的相关内容(如特征C所述,其隐含了识别可能包含感兴趣对象的区域),但完全没有公开涉及“用户眼睛”和“用户兴趣的概率”的第二概率图。因此,完整的技术特征I(包含第一和第二概率图的定义)未被对比文件公开。
**技术特征J:** 其进一步包括产生所述第一或第二图像中的至少一者的镜像版本,使得所述第一和第二图像从共同角度对准,其中所述第一和第二概率图中的至少一者是基于所述镜像版本而产生。<br>**《未公开》**对比文件仅涉及单个图像传感器捕获的图像,不存在两个需要对准的相机图像,因此也不需要产生镜像版本。技术特征J未被公开。
**技术特征K:** 其中使所述第一和第二图像时间同步。<br>**《未公开》**由于对比文件未公开使用两个相机捕获第一和第二图像,因此使这两个图像时间同步的技术特征K也未被公开。
**技术特征L:** 其进一步包括针对第一图像序列和第二图像序列的每个图像来重复所述方法,其中所述第一图像序列与所述第二图像序列时间同步。<br>**《直接公开》**[0031] "mobile device 130 can also retrieve one or more stored images or capture one or more frames of a video to generate image 100." <br>[0041] "Mobile device 130 can also retrieve one or more stored images or capture one or more frames of a video to generate image 100." <br>说明书整体描述了移动设备可以重复执行视觉搜索过程。对比文件公开了移动设备可以捕获视频的一帧或多帧来生成图像(即图像序列),并且说明书描述的系统和方法旨在可重复执行(例如,用户可以多次进行视觉搜索)。虽然对比文件未明确提及“第二图像序列”,但其描述的图像捕获和处理方法可以应用于连续的图像帧。对于本领域技术人员而言,将所述方法针对图像序列(如视频流)进行重复执行是显而易见的。因此,技术特征L被对比文件直接公开。
**技术特征M:** 其进一步包括针对第一图像序列中的每第N图像以及第二图像序列中的每第N图像来重复所述方法,其中所述第一图像序列与所述第二图像序列时间同步,且其中N表示大于或等于2的整数。<br>**《直接公开》**[0031] "mobile device 130 can also retrieve one or more stored images or capture one or more frames of a video to generate image 100." <br>[0041] "Mobile device 130 can also retrieve one or more stored images or capture one or more frames of a video to generate image 100."对比文件公开了可以从视频中捕获“一帧或多帧”来生成图像。这意味着系统可以不必处理每一帧,而是可以按一定间隔(例如,每第N帧)处理视频序列中的图像。本领域技术人员为了实现处理效率与实时性的平衡,选择性地处理图像序列中的部分图像(如每第N帧)是常规技术手段。因此,技术特征M被对比文件直接公开。
**技术特征N:** 其中通过包含所述第一相机、所述第二相机和显示器的手持式装置来执行所述方法。<br>**《直接公开》**[0003] "mobile communication devices, such as cellular phones..." <br>[0030] "Examples of mobile device 130 can include any mobile electronic device, such as, without any limitations, a cellular telephone (“cell phone”), a personal digital assistant (PDA), a digital camera..." <br>图2显示了移动设备包含图像传感器200和处理器等组件,其必然包含显示器用于显示信息(如图6D)。对比文件明确说明所描述的方法和系统用于移动设备(mobile device),例如蜂窝电话、PDA、数码相机等,这些都是典型的手持式装置。对比文件的图2和说明书描述了设备包含图像传感器(相当于第一相机)和处理器,并且图6D显示了在设备上显示信息,这意味着设备包含显示器。虽然对比文件未提及“第二相机”,但“通过手持式装置来执行方法”这一上位特征已被直接公开。因此,技术特征N被对比文件直接公开。
**技术特征O:** 其中实时地执行所述方法。<br>**《直接公开》**[0031] "mobile device 130 can detect objects in image and highlight or otherwise indicate in real-time or near real-time one or more of the objects to the user." <br>[0071] "remote server 140 and hence image recognition system 120 can provide relevant information content in real-time or near real-time, in response to the visual search query."对比文件多次强调“实时(real-time)”或“近实时(near real-time)”地执行操作,包括在移动设备上实时检测并高亮对象,以及服务器实时或近实时地提供相关信息内容。因此,技术特征O被对比文件直接公开。
**技术特征P:** 其进一步包括:使用所述第一相机俘获第一图像序列,使用所述第二相机俘获第二图像序列,其中所述第二图像序列包含所述用户的所述眼睛<br>**《直接公开》**[0031] "mobile device 130 can also retrieve one or more stored images or capture one or more frames of a video to generate image 100." <br>[0041] "Mobile device 130 can also retrieve one or more stored images or capture one or more frames of a video to generate image 100."对比文件公开了移动设备可以捕获视频的一帧或多帧来生成图像,这等同于俘获一个图像序列。因此,“使用第一相机俘获第一图像序列”被直接公开。然而,对比文件未公开使用第二相机俘获包含用户眼睛的第二图像序列。因此,技术特征P中关于第一图像序列的部分被直接公开,但关于第二图像序列的部分未被公开。由于权利要求的技术特征是一个整体,且第二部分未被公开,因此整体技术特征P未被对比文件公开。**注意**:根据审查指南,一个技术特征应作为一个整体判断。特征P明确包含了“第一图像序列”和“第二图像序列”两个并列的捕获动作。对比文件仅公开了前者,未公开后者,故整体特征P未被公开。
**技术特征Q:** 基于所述第二图像序列中的所述用户的所述眼睛而产生多个概率图<br>**《未公开》**如技术特征B和P所述,对比文件未公开第二图像序列,更未公开基于其中的用户眼睛产生概率图。因此,技术特征Q未被公开。
**技术特征R:** 至少部分基于所述多个概率图而产生所述AR信息<br>**《未公开》**由于技术特征Q(基于眼睛序列的多个概率图)未被公开,因此基于这些概率图产生AR信息的技术特征R也未被公开。
**技术特征S:** 显示所述AR信息与所述第一图像序列。<br>**《直接公开》**[0065] "mobile device 130 can receive from back-end 300 and present to the user a visual search result in response to the visual search query." <br>图6D显示了产品信息(650, 660)、链接(670, 680)等相关信息内容与图像(如t-shirt 630)一同显示在移动设备上。对比文件公开了移动设备接收并呈现视觉搜索结果(即相关信息内容),并且图6D明确示出了这些信息内容(可视为AR信息)与所捕获的图像(或基于其的子图像)一起显示。这等同于显示AR信息与图像。当图像是序列时,该方法同样适用。因此,技术特征S被对比文件直接公开。
**技术特征T:** 其进一步包括通过以优先级区分的次序处理AR信息而基于所述不同对象的优先级区分来执行对所述不同对象的对象识别。<br>**《隐含公开》**[0042] "mobile device 130 can highlight or otherwise indicate detected objects of the image...", "mobile device 130 can receive input from the user to select at least one of the highlighted objects..." <br>[0043] "mobile device 130 can categorize, recognize, or otherwise determine characteristics the selected object."对比文件公开了移动设备检测并高亮多个对象,用户从中选择一个对象。随后,移动设备对该“被选中的”对象执行识别和特征确定。这个过程隐含了基于用户选择所建立的优先级(选中的对象具有最高优先级)来执行对象识别。虽然其优先级建立机制(用户显式选择)与目标专利(基于眼睛的概率图)不同,但“基于优先级区分来执行对不同对象的对象识别”这一技术构思是相同的。本领域技术人员可以合理推断出这一特征。因此,技术特征T被对比文件隐含公开。
**技术特征U:** 其进一步包括显示所述增强现实AR信息与所述第一图像。<br>**《直接公开》**[0065] "mobile device 130 can receive from back-end 300 and present to the user a visual search result in response to the visual search query." <br>图6D显示了产品信息(650, 660)、链接(670, 680)等相关信息内容与图像(如t-shirt 630)一同显示在移动设备上。对比文件公开了移动设备接收并呈现视觉搜索结果(即相关信息内容),并且图6D明确示出了这些信息内容(可视为AR信息)与所捕获的图像一起显示。因此,技术特征U被对比文件直接公开。

<<<A>>><<<L>>><<<M>>><<<N>>><<<O>>><<<S>>><<<U>>><<<c>>><<<g>>><<<t>>>

权利要求与技术特征
Powered by Django

网站备案号:渝ICP备2023012882号


重庆市非显而易见网络科技有限责任公司 A Anti NPE NPE