2005-12-01_WO2005114476A_发明申请_WO2005114476A1 MOBILE IMAGE-BASED INFORMATION RETRIEVAL SYSTEM_+++A_N_c_l_o_s_u+++.docx

对比文件名称:2005-12-01_WO2005114476A_发明申请_WO2005114476A1 MOBILE IMAGE-BASED INFORMATION RETRIEVAL SYSTEM

目标专利名称:基于手持式装置中的眼睛俘获的增强现实处理CN103262097B

模型名称:专利创造性评估模型

特征比对表格:

技术特征描述及公开性判断对比文件原文引用公开性论述
**A:** 其包含:使用装置的第一相机俘获第一图像,所述第一相机相对于所述装置的用户指向外《直接公开》[p0006] “Almost all mobile phones come with an integrated camera or image capture device.”;[0056] “mobile telephone has a built-in camera”对比文件明确公开了移动电话具有内置相机。本领域技术人员可以毫无疑义地理解,当用户使用该内置相机拍摄外部场景(如景物、广告牌等)以进行图像检索时,该相机自然是相对于用户指向外的。这公开了“使用装置的第一相机俘获第一图像,所述第一相机相对于所述装置的用户指向外”这一技术特征。
**B:** 使用所述装置的第二相机俘获第二图像,其中所述第二图像包含所述用户的眼睛《未被公开》未找到相关描述。对比文件全文仅描述了一个内置相机用于捕获外部场景图像,从未提及存在第二个相机,也从未提及捕获包含用户眼睛的图像。因此,该技术特征未被对比文件公开。
**C:** 基于所述第一图像中的一个或一个以上对象而产生第一概率图《隐含公开》[0038] “Each engine returns the recognition results with confidence values and an integrator module that outputs a final list of objects recognized.”;[0056] “optical character recognition engine for generating a first confidence value... object recognition engine for generating a second confidence value... face recognition engine for generating a third confidence value... and an integrator module for receiving the first, second, and third confidence values and generating a recognition output.”对比文件公开了多个识别引擎(如OCR、物体识别、人脸识别)对输入图像进行分析,并为识别结果生成“置信值”。这些置信值本质上表征了图像中存在特定对象(如文字、物体、人脸)的概率或可能性。多个引擎输出多个置信值,可以视为基于图像内容(包含对象)产生了一系列概率值或评分,这构成了一个概率评估体系。虽然未明确使用“概率图”这一术语,但本领域技术人员可以理解,基于图像中的对象生成置信值/概率值,是进行对象识别和信息检索的常规且必要的步骤,可以合理推断出“基于第一图像中的一个或一个以上对象而产生第一概率图(或类似数据)”。
**D:** 基于所述第二图像中的所述用户的所述眼睛而产生第二概率图《未被公开》未找到相关描述。由于对比文件未公开俘获用户眼睛的第二图像(特征B),因此自然不可能基于该图像产生任何概率图。该技术特征未被公开。
**E:** 基于所述第一和第二概率图而产生组合概率图《未被公开》[0038] “Each engine returns the recognition results with confidence values and an integrator module that outputs a final list of objects recognized.”对比文件公开了将多个识别引擎(如OCR、物体识别)输出的置信值进行整合(integrator module),以产生最终识别结果。这可以视为将多个来源(均基于第一图像)的置信度信息进行组合。然而,目标专利的组合概率图是特指基于**第一图像对象**的概率图与基于**第二图像眼睛**的概率图的组合。由于第二概率图(特征D)不存在,因此对比文件不可能公开将这两种特定来源的概率图进行组合的技术特征。
**F:** 至少部分基于所述组合概率图而产生与所述第一图像中的所述一个或一个以上对象相关联的增强现实AR信息《未被公开》[0034] “Successful recognition leads to a single or several textual identifiers denoting object, faces or strings that are passed on to the so called media server. Upon receipt of the text strings the media server sends associated mobile multimedia content back to the VMS client on the phone.”;[0081]-[00116] 描述了返回各种相关信息(如解说、翻译、网页等)。对比文件公开了基于识别结果(如文本标识符)检索并返回与图像中对象相关的信息(如URL、音频、文本等),这类似于产生AR信息。然而,目标专利要求该AR信息的产生是“至少部分基于所述组合概率图”。如前所述,对比文件未公开组合概率图(特征E),因此也不可能基于该组合概率图来产生AR信息。虽然对比文件公开了基于识别结果(可视为一种概率评估的输出)产生相关信息,但这与目标专利限定的特定依据(组合概率图)不同。
**G:** 其中基于所述组合概率图而产生所述AR信息包含基于所述组合优先级图而区分所述第一图像中的不同对象的优先级。《未被公开》未找到相关描述。对比文件未公开基于组合概率图区分对象优先级。其识别引擎可能输出带置信值的多个结果,但并未描述根据一个综合的优先级图来安排AR信息产生或对象处理的次序。
**H:** 其中所述概率图包含多个瓦片,且至少部分基于所述第二图像中的所述用户的所述眼睛而给予所述概率图的一个或一个以上瓦片比其它瓦片高的优先级。《未被公开》未找到相关描述。对比文件未提及将图像划分为“瓦片”,也未提及基于用户眼睛信息对图像不同区域(瓦片)赋予不同优先级。
**I:** 其中所述第一概率图界定所述第一图像中的具有比所述第一图像中的其它区域高的包含感兴趣的对象的概率的一个或一个以上区域;并且中所述第二概率图界定基于所述用户眼睛相对于所述第一图像中的其它区域具有更高的用户兴趣的概率的一个或一个以上区域。《未被公开》未找到相关描述。对比文件未明确区分两种概率图(基于对象存在概率和基于用户兴趣概率),更未对这两种概率图的作用进行如权利要求所述的界定。
**J:** 其进一步包括产生所述第一或第二图像中的至少一者的镜像版本,使得所述第一和第二图像从共同角度对准,其中所述第一和第二概率图中的至少一者是基于所述镜像版本而产生。《未被公开》未找到相关描述。对比文件只涉及单一图像,不存在两个需要对准的图像,因此不可能公开图像镜像对准的技术特征。
**K:** 其中使所述第一和第二图像时间同步。《未被公开》未找到相关描述。对比文件未涉及两个图像,因此不存在使两个图像时间同步的技术特征。
**L:** 其进一步包括针对第一图像序列和第二图像序列的每个图像来重复所述方法,其中所述第一图像序列与所述第二图像序列时间同步。《隐含公开》[0024] “The server hosts visual recognition engines that recognize the objects shown in the image and that returns search results in appropriate format back the user.”; [0034] “(1) The user takes an image with his camera phone and sends it to the recognition server.”对比文件描述的系统允许用户多次拍摄图像并提交给服务器进行识别和检索。本领域技术人员可以毫无困难地理解,该方法可以针对用户连续捕获的一系列图像(第一图像序列)重复执行。虽然对比文件未明确提及“第二图像序列”(因为无第二相机),但从其描述的连续使用场景可以合理推断,所述图像检索方法是可重复进行的。至于“第二图像序列与第一图像序列时间同步”,由于缺少第二图像序列,该限定无法被公开。但“针对第一图像序列的每个图像来重复所述方法”这一部分可被隐含公开。
**M:** 其进一步包括针对第一图像序列中的每第N图像以及第二图像序列中的每第N图像来重复所述方法,其中所述第一图像序列与所述第二图像序列时间同步,且其中N表示大于或等于2的整数。《未被公开》未找到相关描述。对比文件未公开间隔地(每第N图像)处理方法,也未提及两个图像序列及其同步采样。
**N:** 其中通过包含所述第一相机、所述第二相机和显示器的手持式装置来执行所述方法。《直接公开》[p0006] “Almost all mobile phones come with an integrated camera...”; [0056] “mobile telephone 12...”; 移动电话必然包含显示器。对比文件明确将整个系统应用于“mobile telephone”(移动电话),这是一种典型的手持式装置,其包含内置相机(第一相机)和显示器。虽然未提及第二相机,但“通过包含所述第一相机...和显示器的手持式装置来执行所述方法”这一技术特征已被直接公开。
**O:** 其中实时地执行所述方法。《隐含公开》[0034] “Within seconds you will receive an audio-visual narrative... If you happen to be connected a 3G network the response time would be below a second.”; [0081] 整个系统旨在提供快速信息检索。对比文件描述了用户在拍摄图像后,能在几秒内甚至亚秒级(3G网络)收到反馈信息。这符合本领域对“实时”或“近实时”处理的理解。因此,可以合理推断该方法旨在被实时执行。
**P:** 其进一步包括:使用所述第一相机俘获第一图像序列,使用所述第二相机俘获第二图像序列,其中所述第二图像序列包含所述用户的所述眼睛《未被公开》未找到相关描述。对比文件可以隐含公开俘获第一图像序列(连续拍照),但明确缺少使用第二相机俘获包含用户眼睛的第二图像序列的描述。
**Q:** 基于所述第二图像序列中的所述用户的所述眼睛而产生多个概率图《未被公开》未找到相关描述。由于缺少第二图像序列,该技术特征无法被公开。
**R:** 至少部分基于所述多个概率图而产生所述AR信息《未被公开》未找到相关描述。由于缺少基于第二图像序列产生的多个概率图,该技术特征无法被公开。
**S:** 显示所述AR信息与所述第一图像序列。《隐含公开》[0034] “Upon receipt of the text strings the media server sends associated mobile multimedia content back to the VMS client on the phone.”; [00116] “A user can take a photo of an object and submit it to the database together with a textual annotation that he can retrieve later when taking a picture of the object.”对比文件明确描述了将检索到的信息(如URL、音频、文本注释等)发送回手机客户端。本领域技术人员可以理解,这些信息需要在手机的显示器上呈现给用户,与用户之前拍摄的图像(或当前视图)相关联地显示。因此,可以合理推断出“显示所述AR信息与所述第一图像(序列)”。
**T:** 其进一步包括通过以优先级区分的次序处理AR信息而基于所述不同对象的优先级区分来执行对所述不同对象的对象识别。《未被公开》未找到相关描述。对比文件未公开基于优先级区分次序来处理对象识别。其识别引擎可能并行处理或按固定流程处理,但未提及根据优先级动态调整处理次序。
**U:** 其进一步包括显示所述增强现实AR信息与所述第一图像。《隐含公开》同特征S的引用。同特征S的论述,显示检索到的信息与图像,可以视为隐含公开了“显示所述增强现实AR信息与所述第一图像”。

<<<A>>><<<N>>><<<c>>><<<l>>><<<o>>><<<s>>><<<u>>>

权利要求与技术特征
Powered by Django

网站备案号:渝ICP备2023012882号


重庆市非显而易见网络科技有限责任公司 A Anti NPE NPE