非显而易见性评估仅供参考,不构成法律建议。
| 编号 | 名称 |
|---|---|
| 0 | US2013129143A1_Description_20260221_0616_+++A_B_C_H+++.docx |
| 0 | US2015265251A1_Description_20260221_0613.docx |
| 0 | US2015178383A1_Description_20260221_0614_+++A_b_c_d+++.docx |
| 0 | US2015139485A1_Description_20260221_0617_+++A_H_c_q+++.docx |
| 0 | US2015112182A1_Description_20260221_0613_+++H_b+++.docx |
| 0 | US2014376819A1_Description_20260221_0618_+++B_H_a_c_e_i_r+++.docx |
| 0 | US2014188462A1_Description_20260221_0612_+++A_C_D_E_F_G_H_I_J_L_M_O_Q_R_S_V_t+++.docx |
| 0 | US2014078320A1_Description_20260221_0615_+++A_B_C_I_d_h_q+++.docx |
| 0 | US2013301934A1_Description_20260221_0616_+++a+++.docx |
| 0 | US2013218813A1_Description_20260221_0615_+++H_b+++.docx |
| 0 | US2013156262A1_Description_20260221_0616.docx |
| 0 | US2015324655A1_Description_20260221_0614_+++H_a_c_i_q+++.docx |
| 0 | US2013096817A1_Description_20260221_0617_+++H+++.docx |
| 0 | US2013033608A1_Description_20260221_0614_+++B_C_H_a+++.docx |
| 0 | US2012263388A1_Description_20260221_0617_+++c+++.docx |
| 0 | US2012092509A1_Description_20260221_0616_+++J_O+++.docx |
| 0 | US2011302111A1_Description_20260221_0616_+++a_b_c_i+++.docx |
| 0 | US2011282828A1_Description_20260221_0615_+++C_H_b_i+++.docx |
| 0 | US2011235858A1_Description_20260221_0614_+++A_C_H_I_b+++.docx |
| 0 | US2011222724A1_Description_20260221_0613_+++A_F_G_b_e+++.docx |
| 0 | US2011119210A1_Description_20260221_0615_+++C_E_F_a_b_c_g_i_q+++.docx |
| 0 | US2010312609A1_Description_20260221_0611_+++a+++.docx |
| 0 | US2016180195A1_Description_20260221_0614_+++A_H_b+++.docx |
| 0 | WO2015018107A1_Description_20260220_0309.docx |
| 0 | WO2015018107A1_Description_20260219_1822.docx |
| 0 | WO2009131629A1_Description_20260220_0320_+++A_H_b+++.docx |
| 0 | WO2009131629A1_Description_20260219_2011_+++A_B_C_H_I_q+++.docx |
| 0 | US2016307071A1_Description_20260221_0618_+++b_c_h+++.docx |
| 0 | US2016275414A1_Description_20260221_0614_+++C_H_a_d+++.docx |
| 0 | US2016259995A1_Description_20260221_0617.docx |
| 0 | US2016239706A1_Description_20260221_0611_+++h+++.docx |
| 0 | US2016225053A1_Description_20260221_0611_+++A_b+++.docx |
| 0 | US2016217349A1_Description_20260221_0617_+++D_H_a_b_i+++.docx |
| 0 | US2010226535A1_Description_20260221_0615_+++H+++.docx |
| 0 | US2016180151A1_Description_20260221_0613_+++A_C_b_i+++.docx |
| 0 | US2016179844A1_Description_20260221_0613_+++A_c_j_q+++.docx |
| 0 | US2016140451A1_Description_20260221_0616_+++B_H_a_e_f_g_r+++.docx |
| 0 | US2016140146A1_Description_20260221_0611_+++A_E_F_R_b_g_i+++.docx |
| 0 | US2016070673A1_Description_20260221_0612_+++H+++.docx |
| 0 | US2016042252A1_Description_20260221_0615_+++A_C_I_b_e_r+++.docx |
| 0 | US2016035078A1_Description_20260221_0612_+++A_b+++.docx |
| 0 | US2016034788A1_Description_20260221_0616_+++A_C_I+++.docx |
| 0 | US2016019415A1_Description_20260221_0615_+++A_B_t+++.docx |
| 0 | US5239594A_Description_20260219_2037_+++F_a_c_e_g_i_r+++.docx |
| 0 | US8311337B2_Description_20260219_2359_+++C_a_e_r_t_u_v+++.docx |
| 0 | US8189880B2_Description_20260220_1537_+++C_E_I_K_O_R_S_a_b_f_g_j_q+++.docx |
| 0 | US8086048B2_Description_20260219_2124_+++C_H_a_q+++.docx |
| 0 | US7574054B2_Description_20260219_2057.docx |
| 0 | US7164798B2_Description_20260220_0009_+++A_C_D_E_G_H_I_T_b+++.docx |
| 0 | US6327581B1_Description_20260219_2042_+++H_a+++.docx |
| 0 | US5832182A_Description_20260219_2038.docx |
| 0 | US5822742A_Description_20260219_2043_+++c_i+++.docx |
| 0 | US5444796A_Description_20260219_2030_+++c_e_f_g+++.docx |
| 0 | US5337370A_Description_20260219_2031_+++B_a_c_i_j_q+++.docx |
| 0 | US8386574B2_Description_20260220_0019_+++D_H_a_b_c_g_i+++.docx |
| 0 | JPH08227408A_Description_20260221_0611_+++c_f_g_i+++.docx |
| 0 | JP2011175497A_Description_20260219_2139_+++C_F_G_H_a_b_c_d_e_i+++.docx |
| 0 | JP2011044044A_Description_20260219_2122_+++C_E_G_J_Q_R_a_b_d_f_i+++.docx |
| 0 | JP2008009914A_Description_20260219_2306_+++H+++.docx |
| 0 | JP2007048172A_Description_20260219_2033_+++C_H+++.docx |
| 0 | EP3114611A1_Description_20260304_2010_+++A_C_E_F_G_I_J_L_M_O_Q_R_S_T_U_V_b_d_h_k_n_p+++.docx |
| 0 | CN103530689A_Description_20260219_2348_+++C_G_I_a+++.docx |
| 0 | CN103164441A_Description_20260220_0002.docx |
| 0 | CN102637255A_Description_20260219_2040.docx |
| 0 | US2003063780A1_Description_20260221_0611_+++a_b_c+++.docx |
| 0 | US2010191391A1_Description_20260221_0614_+++A_H_b+++.docx |
| 0 | US2010036786A1_Description_20260221_0614_+++H_a_c_e_g_i_j_q_r_s+++.docx |
| 0 | US2009196464A1_Description_20260221_0611.docx |
| 0 | US2008298766A1_Description_20260221_0616_+++C_E_I_J_K_O_R_S_g_q+++.docx |
| 0 | US2008292196A1_Description_20260221_0614_+++c_i+++.docx |
| 0 | US2008232687A1_Description_20260221_0614.docx |
| 0 | US2008159624A1_Description_20260221_0611_+++A_H+++.docx |
| 0 | US2008103996A1_Description_20260221_0612_+++E_F_G_H_R_c+++.docx |
| 0 | US2005276452A1_Description_20260221_0611.docx |
| 0 | US2004165767A1_Description_20260221_0617_+++A_C_H_b_d_e_f_g+++.docx |
| 0 | CN102254180A_Description_20260219_2237_+++C_I+++.docx |
| 0 | US9785866B2_Description_20260220_1536_+++A_H_b+++.docx |
| 0 | US9298978B1_Description_20260219_2034_+++A_B_C_E_H_I_R_T_f+++.docx |
| 0 | US8983193B1_Description_20260220_0348.docx |
| 0 | US8965112B1_Description_20260220_0349_+++a_b+++.docx |
| 0 | US8913152B1_Description_20260220_0344_+++C_F_G_H_I_S_a_b_d_e_j_k_q_r+++.docx |
| 0 | US8879813B1_Description_20260220_0351_+++A_H+++.docx |
| 0 | US8811726B2_Description_20260219_2358_+++H_a_b+++.docx |
| 0 | US8611678B2_Description_20260220_1541_+++A_C_H+++.docx |
| 0 | US8396286B1_Description_20260219_2036_+++H+++.docx |
一种用于图像处理的方法,包括: 用第一预先训练的分类器来确定多个所存储图像的特征,所述多个所存储图像的特征不同于用于训练所述第一预先训练的分类器的多个训练图像; 至少部分地基于所确定的特征来将所述多个所存储图像中的每一个图像指派给多个群集中的群集; 基于所述图像离对应于所述图像的最接近的群集中心的距离小于第一阈值、与所述最接近的群集中心相关联的预定义图像数目小于第二阈值、和/或与最接近的群集中心相关联的图像百分比小于第三阈值来向所述多个所存储图像中的图像指派标记; 修改所指派的标记; 当所述所指派的标记被修改时用所述图像来重新训练所述第一预先训练的分类器;以及至少部分地基于所述预先训练的分类器来对所述图像重新分类。
作为一名经验丰富的专利代理师,我将针对权利要求1的技术特征,结合提供的五篇对比文件(以下简称D1-D5)进行深度的特征比对与创造性分析。
为便于表述,本文对对比文件作如下编号:
D1: EP3114611A1 (PHOTO MANAGEMENT)
D2: JP2011044044A (INFORMATION TERMINAL...)
D3: JP2011175497A (DATA EXTRACTION APPARATUS...)
D4: US2004165767A1 (THREE-DIMENSIONAL PATTERN RECOGNITION...)
D5: US8913152B1 (TECHNIQUES FOR USER CUSTOMIZATION IN A PHOTO MANAGEMENT SYSTEM)
在进行创造性(Inventive Step)分析时,最接近的现有技术应当是与本发明处于相同技术领域、解决相同或相似技术问题,并且公开了最多相同技术特征的对比文件。
结论:D1(EP3114611A1)和 D5(US8913152B1)最适合作为最接近的对比文件。其中 D1 是最佳选择。
分析理由:
从技术领域和解决的技术问题来看:权利要求1涉及一种“图像处理(分类与标记)”的方法,特别是通过用户对自动聚类结果的修改来重新训练分类器,以实现个性化的照片管理。
D1 解决的正是“改进对所捕捉的图像的管理(Photo Management)”问题,且采用了深度卷积神经网络(DCN)和k-means聚类,并通过用户移动图像来微调和重新训练网络(解决了个性化分类问题)。D1与目标专利的技术领域、解决的技术问题完全一致。
D5 同样解决的是“照片管理系统中的用户定制(User customization in a photo management system)”问题,通过用户的反馈(添加、删除、移动照片)来调整聚类和特征权重(增量机器学习),与本专利高度契合。
D2 虽然也涉及照片管理(通过人脸识别),但其依赖的是平均相似度计算,且未明确公开“重新训练预先训练的分类器”这一机器学习维度的核心特征。
D3 属于自然语言处理(文本实体关系提取)领域,D4 属于医疗3D图像(结肠息肉识别)领域,二者解决的技术问题和应用场景与本专利相去甚远,不适合作为最接近的现有技术。
从技术效果来看:本发明旨在通过“初始分类-阈值打标-用户修改-重新训练”的闭环,实现越来越准确的照片智能分群。D1 明确公开了这一完整的闭环逻辑和技术效果。
以下是权利要求1各项技术特征在核心对比文件(D1, D2, D5)中的公开情况汇总。由于D3(文本处理)和D4(医疗识别)与本专利解决的问题差异过大且未公开主要特征,故在表格中省略,但在后续文字中会作简要说明。
| 技术特征 | 特征描述 | D1 (EP3114611A1) | D5 (US8913152B1) | D2 (JP2011044044A) |
| A | 用第一预先训练的分类器来确定多个所存储图像的特征 | 公开 | 公开 | 实质公开 |
| B | 图像特征不同于用于训练分类器的训练图像 | 公开 | 公开 | 公开 |
| C | 基于确定的特征将图像指派给群集 | 公开 | 公开 | 公开 |
| D | 基于距离聚类中心小于阈值、或相关联的图像数目/百分比小于阈值来指派标记 | 公开 | 未公开 (使用了DPP和层次聚类算法,未采用本特征的距离/阈值规则) | 未明确公开 (使用平均相似度阈值) |
| E | 修改所指派的标记 | 公开 | 公开 | 公开 |
| F | 当标记被修改时,用所述图像来重新训练分类器 | 公开 | 公开 | 未明确公开 (仅更新了群集的平均值参数) |
| G | 基于预先训练的分类器对图像重新分类 | 公开 | 公开 | 公开 |
D1 实际上与目标专利CN106104577B是同族专利的欧洲版本,因此其说明书毫无异议地公开了权利要求1的所有特征:
特征A(预训练分类器确定特征):参见D1第[0066]段:“...a pre-trained deep convolutional network feature extractor... removed to obtain a feature vector for each image.”(预先训练的深度卷积网络特征提取器...以获得每个图像的特征向量)。
特征B(与训练图像不同):参见D1第[0066]-[0067]段:“pre-trained with images that include various class labels... extracts the relevant features from the images stored in the device.” 说明预训练的图像带有类标签,而应用时是针对设备中存储的图像提取特征,二者不同。
特征C(指派给群集):参见D1第[0068]段:“the feature vectors are clustered using a clustering system, such as using k-means... a feature vector is assigned to a cluster.”(使用k-means对特征向量分群集,并将特征向量指派给群集)。
特征D(基于距离阈值、百分比阈值指派标记):参见D1第[0070]段:“a label is assigned... based on the distance... images within a certain distance... specific percentage of images...” 以及第[0075]段:“only images within a specified distance d... or only the p percent closest are labeled.”(仅标记指定距离d内的图像,或者仅p%的最接近图像被标记)。完全对应特征D。
特征E(修改标记):参见D1第[0077]段:“user may determine that the image of the person should belong in the cluster for images of people and may subsequently move the image...”(用户移动图像,即修改指派的标记)。
特征F(重新训练):参见D1第[0077]-[0078]段:“deep convolutional network learns the user's preferences... k-means clustering may be fine-tuned... based on real time training of the neural network classifier.”(基于重新分类,神经网络实时训练以学习用户偏好)。
特征G(重新分类):参见D1第[0072]段:“The images are re-sorted according to the new classification boundaries.”(图像根据新的分类边界重新分拣)。
D5 是一篇极具杀伤力的对比文件,它实质公开了权利要求的核心互动逻辑:
特征A & B:参见D5第[0087]、[0099]段。D5使用支持向量机(SVMs)提取质量和相似性特征,并且其权重是从“参考照片集(reference photo collection,如公共图库)”中学习的,不同于用户存储的图像。
特征C:参见D5第[0078]段:“determine one or more clusters for the subset of the plurality of photos using a hierarchical clustering algorithm.”(使用层次聚类算法确定群集)。
特征E:参见D5第[0082]-[0084]段:“user input can include... dragging and dropping a specific cluster or a specific photo to add a photo to a group, delete a photo from a group, or merge two or more groups.”(用户拖拽图像以添加到组、删除或移动)。
特征F & G:参见D5第[0086]-[0087]段:“photo album adjustment module 324 can selectively adjust one or more of the quality weights... incremental machine learning techniques for SVMs... determine a second plurality of modified clusters...”(调整权重,执行SVM增量机器学习,并确定第二组修改后的群集重新分类)。
区别点(特征D):D5 使用的是行列式点过程(DPP)和层次聚类,并未明确公开基于“离聚类中心距离小于第一阈值/预定义数目小于第二阈值/百分比小于第三阈值”来分配标记的数学逻辑。
特征A-C:参见D2第[0032]、[0047]、[0056]段,公开了使用预先学习的字典提取人脸特征并将其分类到群集(组)中。
特征E & G:参见D2第[0062]-[0064]段及[0080]段,允许用户手动修改分类,并将其反映在后续的自动分类中。
区别点(特征D & F):D2 第[0077]-[0078]段使用的是平均相似度(average similarity)超过阈值来进行分组,而不是距离中心的距离或百分比。此外,D2的手动修改反映在“分类群的母体计算”中,并未明确公开对底层用于特征提取的“分类器/字典”进行重训练(Retrain)。
D3 (JP2011175497A):属于自然语言处理领域(参见[0003]段“特定の記号列の組み合わせ... テキストから収集”)。它处理的是文本实体关系的提取和基于最大熵(ME)的机器学习,虽然包含负例生成的阈值概念,但未实质公开“用于图像处理的方法”以及与图像群集相关的特征。
D4 (US2004165767A1):属于医学图像处理领域。虽然使用了SVM分类器提取特征([0011]),但其目的是自动检测结肠息肉候选区域,并未公开“用户修改标记并重新训练”的交互式照片管理逻辑。
在无效宣告或实质审查的创造性答辩中,D1 是本专利的致命文件(如果D1的公开日在本专利的优先权日/申请日之前,将直接破坏新颖性或创造性)。
如果排除同族专利D1的影响,在以 D5 作为最接近的现有技术进行创造性评判时,答辩的核心应聚焦于“特征D”。即:强调本发明采用“基于距离、数量和百分比三个维度的阈值(第一、第二、第三阈值)”来指派初始标记,该特定的数学逻辑不仅提高了聚类初始分配的准确度,且降低了运算复杂度,这是D5的层次聚类(Hierarchical clustering)和DPP算法所不具备的。
作为一名经验丰富的专利代理师,我将紧密结合您提供的目标专利说明书(CN106104577B)为您解释权利要求1的技术方案,并基于对比文件1(D1:JP2011044044A)提供详细的特征比对分析以及最接近的对比文件(CPA)适用性评估。
权利要求1请求保护一种用于图像处理的方法,其核心逻辑在于基于深度学习分类器进行图像的聚类与分类,并利用用户的反馈(修改标记)来重新训练分类器,从而实现个性化和更高精度的图像管理。
具体而言结合说明书:
特征A和B(特征提取):对应说明书[0098]-[0099],方法首先使用一个预先在不同图像集上训练好的深度卷积网络(特征提取器)来提取设备中存储图像的特征向量。
特征C(分群集/聚类):对应说明书[0100],使用诸如k-means或g-means等无监督分群集系统,基于提取出的特征向量将图像分配到不同的群集(Cluster)中。
特征D(指派标记):对应说明书[0102],基于特征向量与群集中心的距离(小于指定距离),或者基于阈值比例(如群集中最接近的p%),为这些图像指派特定的初始标记(例如分为“建筑物”、“动物”、“日落”等)。
特征E(修改标记):对应说明书[0108]-[0111],用户可以根据自己的偏好对这些自动指派的标记进行修改,例如将分错的“人的图像”从“建筑物群集”移动到“人的群集”。
特征F和G(重新训练与重新分类):对应说明书[0109]-[0112],当用户修改了标记(例如移动了图像)后,系统会用这些被修改的图像去重新训练分类器(如多层感知器或支持向量机),让神经网络学习用户的偏好,并基于更新后的分类器对存储的图像进行重新分拣和分类(监督式学习),以提高未来的分类准确性。
对比文件D1(JP2011044044A)公开了一种能够对更新后的图像文件(如人脸图像)进行自动分类,并允许用户手动修正,进而提高后续分类精度的信息终端及其控制方法。
详细特征比对表格如下:
| 权利要求1技术特征 | 对比文件1 (D1: JP2011044044A) 的公开情况 | 公开程度 |
|
技术特征A: 用第一预先训练的分类器来确定多个所存储图像的特征, |
[0047] 预先使用大量人脸图像学习到的与人脸相关的信息作为人脸检索用字典数据53被注册。 [0053] 人脸特征检测部61,针对人脸矩形检测部21检测出的人脸矩形,计算例如由构成人脸矩形图像的各像素的亮度值之差所表示的特征量。 |
实质公开。D1虽未明确使用“第一预先训练的分类器”这一具体词汇,但其预先利用大量图像训练得到了字典数据(分类器基础),并由人脸特征检测部计算(确定)提取出特征量。 |
|
技术特征B: 所述多个所存储图像的特征不同于用于训练所述第一预先训练的分类器的多个训练图像; |
[0008]-[0011] ...当检测到未注册或更新的图像文件时,从该图像文件中检测出人脸图像... [0047] ...预先使用大量人脸图像学习到的... |
毫无异议公开。D1中被处理的是用户终端中新追加或更新的照片,这显然不同于设备出厂或系统预置时用于训练字典的样本图像。 |
|
技术特征C: 至少部分地基于所确定的特征来将所述多个所存储图像中的每一个图像指派给多个群集中的群集; |
[0056] 分类部63基于人脸相似度计算部62计算出的相似度,创建相似度接近即各自相似的集合体(Group),并将各人脸矩形分类到这各个集合体(Group)中。 | 实质公开。D1通过比对特征量算出相似度,并将图像分配到相似度高的Group(等同于“群集/Cluster”)中。 |
|
技术特征D: 基于所述图像离对应于所述图像的最接近的群集中心的距离小于第一阈值...来向所述多个所存储图像中的图像指派标记; |
[0068] 人脸相似度计算部62...分别赋予预先准备好的Clustering ID进行分组。 [0071] 分类部63作为步骤S3的处理,判断相似度的平均值超过第一阈值的Group是否存在多个... [0074] ...分类部63针对该人脸矩形,分配所述平均值超过第一阈值的唯一的Clustering ID。 |
实质公开。D1中“相似度大于第一阈值”在数学和算法本质上等同于本专利中的“距离小于第一阈值”(距离与相似度成反比),且分配“Clustering ID”等同于“指派标记”。 |
|
技术特征E: 修改所指派的标记; |
[0062] 图11表示移动体终端的用户手动对图像文件进行分类情况下的...功能方框图。 [0064] 手动分类部71根据用户的指示,对图像文件进行分类。 [0066] ...图11中的手动分类还包括手动修正图9、图10中的分类结果的情况。 |
毫无异议公开。D1明确公开了用户可以根据指示手动修正(修改)系统原本自动分类/指派的分类结果(标记)。 |
|
技术特征F: 当所述所指派的标记被修改时用所述图像来重新训练所述第一预先训练的分类器; |
[0080] 如图11所示,当移动体终端的用户手动对图像文件(人脸矩形)进行分类时,该手动分类的人脸矩形所属的Group的前述平均值...会发生改变。...该手动分类的信息会在之后的自动分类时被反映进去... | 实质公开。D1中用户手动分类(修改标记)后,系统会更新群集的平均值特征等信息,将其“反映进去”以指导后续分类,这实质上就是一种分类器模型的重新训练/更新过程。 |
|
技术特征G: 以及至少部分地基于所述预先训练的分类器来对所述图像重新分类。 |
[0080] ...因此能够进行精度更高的自动分类。 | 实质公开。D1明确记载了将手动分类的信息反映到后续模型后,执行精度更高的自动分类。 |
在创造性分析中,对比文件1(D1:JP2011044044A)非常适合作为最接近的对比文件(CPA)。具体分析如下:
从所处的技术领域来看:
目标专利与D1均属于智能终端上的数字图像/照片管理与处理技术领域。两者都旨在解决随着设备中照片数量的增多,如何高效、自动地对照片进行归类的问题。
从整体解决的技术问题来看:
目标专利解决的技术问题是:常规的图像分拣需要耗费人工,通过引入神经网络自动分群集,并通过学习用户移动图片(修改标记)的行为来细调和重新训练分类器,从而实现符合用户个人偏好的图像自动化管理。
D1解决的技术问题是:同样是为了减轻用户在图像更新时逐一确认和分类的负担([0008]-[0010])。D1通过自动计算人脸特征相似度进行分组,同时允许用户手动修正分类结果,并把这种修正反馈到后续的分类计算中以提高精度。
两者试图解决的技术问题高度一致,即**“通过机器学习/聚类技术自动分类图像,并利用用户的交互反馈来迭代优化分类模型”**。
从实现的技术效果来看:
目标专利通过重新训练提取器/分类器,达到了“所学习的偏好被用于后续分类/重新分拣”的技术效果。
D1通过将用户手动修正的特征信息(如平均值)反映到基础数据库中,实现了“能够进行精度更高的自动分类”([0080])的技术效果。
结论:
对比文件D1不仅在技术领域和要解决的技术问题上与目标专利高度一致,而且实质公开了目标专利权利要求1的绝大部分核心技术特征(包括特征提取、计算相似度/距离聚类、分配分类ID、手动修改分类、依据修改结果更新模型特征以进行后续高精度分类)。
因此,在评价权利要求1的创造性时,D1不仅适合,而且是极具杀伤力的最接近的对比文件。目标专利权利要求1相对于D1的区别技术特征可能仅仅局限于具体的算法名词选择(如“预先训练的深度卷积网络” vs “预先学习的人脸字典匹配”),而这在计算机视觉领域通常容易被认为是本领域的惯用技术手段替换。
这是一份针对目标专利说明书(CN106104577B)权利要求1与所提供对比文件的详细比对与创造性分析。
为便于比对,将权利要求1拆解为以下技术特征:
特征A:用第一预先训练的分类器来确定多个所存储图像的特征;
特征B:所述多个所存储图像的特征不同于用于训练所述第一预先训练的分类器的多个训练图像;
特征C:至少部分地基于所确定的特征来将所述多个所存储图像中的每一个图像指派给多个群集中的群集;
特征D:基于所述图像离对应于所述图像的最接近的群集中心的距离小于第一阈值、与所述最接近的群集中心相关联的预定义图像数目小于第二阈值、和/或与最接近的群集中心相关联的图像百分比小于第三阈值来向所述多个所存储图像中的图像指派标记;
特征E:修改所指派的标记;
特征F:当所述所指派的标记被修改时用所述图像来重新训练所述第一预先训练的分类器;
特征G:以及至少部分地基于所述预先训练的分类器来对所述图像重新分类。
结合目标专利说明书【0098】-【0114】段落的记载,权利要求1的核心逻辑是:特征提取 -> 无监督分群集 -> 基于距离/数目/比例阈值自动打标签 -> 接收用户修改(监督式) -> 重新训练分类器 -> 重新分类。
以下是各对比文件对上述特征的公开情况分析:
D5的主题是“照片管理系统中的用户定制技术”,与目标专利的应用场景和整体逻辑高度一致。
公开了特征A与B(实质公开):D5在段落 [0011] 和 [0036] 中公开了提取照片的质量特征( photometric features, saliency-based features等)和相似性特征。虽然D5没有明确使用“预先训练的分类器”这一具体词汇进行特征提取,但其段落 [0087] 明确指出权重是通过支持向量机(SVM)等机器学习技术从参考照片集合中学习得到的,这实质上等同于使用预先训练的模型对未参与训练的新图像(所存储图像)进行特征确定。
公开了特征C(毫无异议公开):D5在段落 [0005] 中明确记载了“使用层次聚类算法确定图像子集的多个群集(determining... a plurality of clusters for the subset of the plurality of photos using a hierarchical clustering algorithm)”。
未公开特征D:D5没有公开基于“距离小于第一阈值”、“预定义数目小于第二阈值”或“百分比小于第三阈值”来指派标记的具体量化规则。
公开了特征E(实质公开):目标专利中的“修改所指派的标记”在具体实施方式中体现为用户将图像从一个群集移动到另一个群集(见目标专利 [0111])。D5在段落 [0005] 和 [0082] 中明确公开了接收用户输入,该输入包括“将特定照片从其所在的群集移动到另一个群集(moving the second specific photo from the specific cluster to another one of the plurality of clusters)”,实质公开了修改标记。
公开了特征F与G(实质公开):D5在段落 [0005] 和 [0086] 中公开了当用户进行修改(如移动或删除照片)时,系统会调整质量度量和相似性矩阵(即重新训练模型),并使用调整后的模型选择新的照片子集并确定第二修改后的群集(即重新分类)。段落 [0087] 进一步指明了使用增量机器学习技术(incremental machine learning techniques for SVMs)来更新权重,这完美对应了“重新训练分类器”。
D2的主题是“用于重新训练分类器的特征选择”,侧重于底层机器学习机制。
公开了特征A与B:D2在段落 [0006]-[0007] 和 [0034] 中公开了使用深度卷积神经网络(DCN)和学习到的特征图(learned feature map)从输入数据(新图像)中提取特征,输入图像不同于训练集。
公开了特征D的部分概念(非完整公开):D2在段落 [0043]-[0046] 中公开了基于新样本与现有分类样本之间的距离(如冗余标准、最小距离、最大距离总和)来决定是否保留该样本。这与距离阈值相关,但并未公开权利要求中“结合距离、数目、百分比阈值来指派标记(聚类中心)”的完整逻辑。
公开了特征F(实质公开):D2在段落 [0029] 明确公开了选择特征和数据样本用于重新训练分类器。
未公开特征C、E、G:D2没有公开面向用户的聚类照片管理、用户修改标记并引发重新分类的交互流程。
D1的主题是“分类数据对象”,侧重于图像分类网络。
公开了特征A与B:D1在段落 [0022]-[0024] 中公开了使用初始数据对象分类系统(如深度卷积神经网络)处理输入图像以生成分类分数。
未公开特征C、D、E、F、G:D1提到了基于高维空间中距离阈值([0040] threshold distance)来选择标签,但未涉及无监督聚类(分群集)、用户修改标签以及通过修改触发重新训练的完整反馈闭环。
D3 涉及利用 SVM 检测电视广告视频片段(商业内容),主要处理音频、视觉和上下文特征的二元分类,未公开图像分群集和用户反馈重训练。
D4 涉及社交网络中电子邮件的单类分类(结合文本特征和社交网络特征),与图像特征聚类和重新分类技术无关。
| 权利要求1技术特征 | D1 (US2015178383A1) | D2 (US2016275414A1) | D3 (US7164798B2) | D4 (US8386574B2) | D5 (US8913152B1) |
| 特征A (使用预训练分类器确定特征) | √ | √ | × | × | √ (实质公开) |
| 特征B (存储图像不同于训练图像) | √ | √ | × | × | √ |
| 特征C (基于特征分群集) | × | × | × | × | √ |
| 特征D (基于距离/数目/比例阈值指派标记) | × | × (仅公开距离比对概念) | × | × | × |
| 特征E (修改所指派的标记) | × | × | × | × | √ (实质公开,跨群集移动) |
| 特征F (基于修改重训分类器) | × | √ | × | × | √ (实质公开,增量学习更新) |
| 特征G (基于重训分类器重新分类) | × | × | × | × | √ (实质公开,重新聚类) |
(注:√ 表示毫无异议公开或实质公开;× 表示未公开)
在进行创造性分析时,D5 (US8913152B1) 毫无疑问是最适合作为最接近的对比文件(CPA)。
1. 从整体解决的技术问题来看:
目标专利要解决的技术问题是:在照片管理中,传统的分类方式效率低下,需要一种能够基于照片特性自动分群集,并能够吸收用户的主观偏好反馈(修改标记/群集)来实时学习和重新分类的智能化管理系统。
D5 解决的技术问题是:自动生成的相册往往不能满足用户的个性化期望,需要提供一种照片管理系统,能够在自动聚类后接收用户的定制化操作(如移动、删除照片),并基于此调整底层的质量/相似性评估矩阵以重新聚类。
结论:两者处于完全相同的技术领域(照片管理应用),解决的技术问题高度一致(引入用户交互反馈以优化自动相册聚类)。
2. 从技术效果来看:
目标专利通过“特征提取 -> 聚类 -> 用户修改 -> 重训分类器 -> 重新分类”的闭环,实现了相册管理越用越符合用户个人偏好的技术效果。
D5 同样通过“特征评估 -> 层次聚类 -> 接收用户移动照片指令 -> 更新 SVM 权重 (增量学习) -> 重新选择与聚类”的闭环,实现了完全相同的技术效果。
3. 区别技术特征的确立:
如果以 D5 为最接近的对比文件,权利要求1与其唯一的区别技术特征在于特征D:即具体的自动化打标签规则(是否具体采用了群集中心距离<阈值1、群集图像数目<阈值2、以及百分比<阈值3这三个维度的数学逻辑)。
后续的创造性答辩或无效宣告逻辑可直接围绕“特征D的具体量化规则是否属于本领域公知常识”或“是否能与D2中的距离阈值概念结合”来展开。
次选 CPA 建议:
D2 (US2016275414A1) 可作为用于结合的次要对比文件。因为 D2 深入探讨了在机器学习中,如何基于“距离边界”和“相似度指标”来决定是否将新样本纳入训练集(对应特征D和特征F的底层逻辑)。但由于 D2 脱离了“照片分群集管理与用户交互”的顶层应用场景,不适合作为主 CPA。
您需要我基于 D5 结合公知常识,为您草拟一份无效宣告请求书(或审查意见答复)的创造性评述段落吗?
在处理复杂的无效宣告请求或侵权分析时,尤其是面对涉及底层图像处理算法、视频编码等硬核技术领域的专利,特征比对的颗粒度往往决定了案件的成败。这份目标专利(CN106104577B)的核心逻辑在于利用预先训练的模型进行特征提取、分群集打标,并通过用户反馈(修改标记)来重新训练模型。
对比文件D1(JP2011044044A)提供了一个非常贴近的应用场景(手机相册的相似人脸自动分类与手动修正)。以下是基于D1对权利要求1的详细拆解与比对。
| 权利要求技术特征 | D1(JP2011044044A)公开的对应技术内容 | 对应段落出处 | 定性评估 |
| A: 用第一预先训练的分类器来确定多个所存储图像的特征 | 预先利用大量人脸图像学习并生成面部检索用字典数据。面部特征检测部基于该数据和算法算出面部特征量(例如各像素的亮度值差异)。 | [0047]、[0048]、[0053] | 实质公开 |
| B: 所述多个所存储图像的特征不同于用于训练所述第一预先训练的分类器的多个训练图像 | D1的字典数据是预先用“多数的面部图像(多数の顔画像)”学习构成的,显然不同于用户手机中“新追加或更新的存储图片(未登録若しくは更新された画像ファイル)”。 | [0014]、[0047] | 毫无异议公开 |
| C: 至少部分地基于所确定的特征来将所述多个所存储图像中的每一个图像指派给多个群集中的群集 | 算出特征量后,与已分类到各组的其他人脸特征量进行比较算出相似度,根据相似度进行分类和管理。 | [0011]、[0055]、[0056] | 毫无异议公开 |
| D: 基于所述图像离对应于所述图像的最接近的群集中心的距离小于第一阈值...来向所述多个所存储图像中的图像指派标记 | 判定相似度的平均值是否超过第一阈值(第一の閾値を超える),若超过则为其分配唯一的群集ID(クラスタリングID)。这实质上等同于“距离小于第一阈值”并“指派标记”。 | [0068]、[0071]、[0074] | 实质公开 |
| E: 修改所指派的标记 | 移动体终端的用户可以手动对图像文件(面部矩形)进行分类(即修改分类群集/标记)。 | [0033]、[0062]-[0066]、[0080] | 毫无异议公开 |
| F: 当所述所指派的标记被修改时用所述图像来重新训练所述第一预先训练的分类器 | 手动分类的信息会在随后的自动分类中得到反映,使得自动分类精度提高(通过更新群集的平均值、最大值、最小值来作为后续分类的母体)。 | [0080]、[0149] | 未公开 / 存在极大隐患 |
| G: 以及至少部分地基于所述预先训练的分类器来对所述图像重新分类 | 手动分类修正后,利用反映了用户修正的分类群(母体)进行后续的分类计算。 | [0080]、[0149] | 实质公开(注:此处是对后续图像重分类,与目标专利的语境基本重合) |
上述比对中,技术特征F(用所述图像来重新训练所述第一预先训练的分类器)存在极大的未公开隐患,这也是本案在进行无效或新颖性/创造性抗辩时的核心壁垒。
深度分析:
目标专利的语境(特征F的真实含义): 结合目标专利CN106104577B说明书(如段落 [0109]、[0113])可知,其使用的“第一预先训练的分类器”是一个**深度卷积神经网络(DCN)或类似的多层感知器/SVM模型。当用户修改标记后,目标专利是去“实时训练/重新训练(retrain)”**这个神经网络模型的内部权重或分类边界。
D1的业务逻辑(D1到底做了什么): D1在段落 [0080] 和 [0149] 中确实提到了“用户的手动修正会反映到后续的自动分类中,从而提高精度”。但是,仔细研读D1的算法逻辑(图12流程图及段落 [0068]-[0078]),D1的“反映”仅仅是:把用户手动挪入某个组(群集)的照片,纳入该组相似度平均值(或最大/最小值)的重新计算中。
区别点的致命性: * D1更新的是群集的统计学参数(均值、极值)。它用于“特征提取”的最底层的那个“面部检索字典数据(顔検索用辞書データ53)”以及“特征算出逻辑(辉度值之差)”根本没有被重新训练或修改。
目标专利要求的是**“重新训练分类器本身”**(Updating model parameters vs. Updating cluster centroids)。
如果专利局审查员或合议组对机器学习底层原理有清晰认知,一定会认定D1仅公开了“K-Means等聚类算法中簇中心的更新”,而没有公开“神经网络分类器本身的重新训练(Backpropagation/Retraining)”。
单凭D1(JP2011044044A),我们可以打掉目标专利权利要求1的绝大部分业务逻辑(自动聚类、阈值判定、用户手动修改聚类),因为D1已经把产品层面的交互逻辑写得非常完备了。
但在应对特征F时,仅靠D1的“均值更新”来硬拗“重新训练”,逻辑链条较弱。为了稳妥起见,我们需要寻找一篇针对“模型反馈训练”的技术交底书作为D2来进行结合。
为了完善我们的应对策略,你希望我直接为你构建一份基于“D1 + 公知常识”的无效宣告理由框架,还是需要我补充搜索一篇明确公开“利用用户修改标签来重新训练底层神经网络分类器”的D2文献?
在进行新颖性和创造性评估时,说明书的具体实施方式对权利要求术语的边界界定至关重要。结合目标专利的说明书及对比文件的原文,对技术特征F的分析如下:
技术特征F:“当所述所指派的标记被修改时用所述图像来重新训练所述第一预先训练的分类器”
结合目标专利说明书(CN106104577B),该特征描述的是一个基于用户反馈的监督式机器学习微调(Fine-tuning)过程。具体而言:
说明书第[0108]-[0110]段记载:用户可以修改系统最初的聚类结果(例如将“人”的图像从“建筑物”群集移动到“人”的群集)。系统会捕获这一修改动作,并执行分类器(如支持向量机或多层感知器)对移动的图像进行重新标记,从而让深度卷积网络学习用户的偏好。
说明书第[0123]段及图5C记载了该动作的完整流程:“在框530,用户将图像从第一文件夹移至第二文件夹... 在框532,可基于被移动的图像和/或重新标记来更新第二文件夹中的图像的标记... 在框534,基于经更新的标记来重新训练经训练的分类器。”
实质含义:当系统自动分配的标记被用户手动修改(如移动图片、重命名文件夹)后,系统将这部分被修改的图像及其新标记作为真实的监督数据(Ground Truth),触发分类器的重新训练(Retrain)。
经过详细检索与比对,对比文件D1(EP3114611A1)单独毫无疑义地公开了该特征;对比文件D6(US2008103996A1)实质公开了该技术特征。其他对比文件未公开该特征。
分析结论:单独毫无疑义地公开了特征F。
事实依据:D1实际上是目标专利的同族专利(均要求了US 61/949,851的优先权),其说明书的实施例记载与目标专利高度一致。
D1说明书第[0078]段记载:“The user may determine that the image of the person should belong in the cluster for images of people and may subsequently move the image... based on the reclassification of the image, the deep convolutional network learns the user's preferences... a classifier... may be executed to re-label only the moved images.”(对应目标专利的修改标记与学习用户偏好)。
D1说明书第[0091]段及图5C明确记载了重新训练的触发条件:“at block 530, a user moves an image from a first folder to a second folder... at block 532, the labels for the images in the second folder may be updated... at block 534, the trained classifier is retrained based on the updated labels.”(在框534,基于更新的标记重新训练经训练的分类器)。
比对结果:D1的原文记载与特征F的字面限定完全契合。
分析结论:实质公开了特征F。
事实依据:D6公开了一种主动学习与监督学习结合的框架,专门用于利用用户重新标记的样本来重新训练分类器。
D6说明书第[0024]段记载:“previously labeled samples 7 are selected from training set 45 and submitted for confirmation/re-labeling”(选取先前已标记的样本供用户确认/重新标记)。
D6说明书第[0046]段记载了标记的修改过程:“Alternatively, the previously assigned classification label 8 for the training sample 7 could have been contradicted by user 57... the new label 88 assigned by user 57 replaces the previous label 8.”(用户否定之前分配的分类标记,并用新标记替换先前的标记)。
D6说明书第[0047]段记载了修改后的重新训练:“once the training set 45 has been updated, the classifier 3 is retrained using the modified training set 45”(一旦训练集更新,就使用修改后的训练集重新训练分类器3)。
比对结果:D6明确公开了在样本被用户修改标记后,利用这些被修改的数据来触发分类器的重新训练,其实质技术手段与解决的技术问题与特征F完全一致。
D2 (JP2011044044A):第[0080]段提到了用户可以“手动分类/修正”,且手动分类的信息会改变群集的平均值并反映在后续自动分类中。但D2采用的是基于特征距离平均值的聚类算法更新,并未公开机器学习模型意义上的“重新训练预先训练的分类器(Retrain)”,属于相关概念但未实质公开特征F。
D4 (JPH08227408A)、D7 (US2011119210A1) 等文件:主要涉及模型初始训练过程中的“错判样本自适应标记(Adaptive label)”或“增加错判类别”,属于算法层面的全自动迭代,并未涉及“系统已指派标记被(用户)修改后触发重新训练”这一应用层面的交互式闭环。
| 权利要求1技术特征 | 目标专利说明书解释 | 包含该特征的对比文件及原文出处 | 比对结论 |
| F: 当所述所指派的标记被修改时用所述图像来重新训练所述第一预先训练的分类器 |
当用户对系统自动分配的群集或标记进行修改(如移动图像所在的文件夹)时,系统利用带有新标记的图像作为监督数据,对原分类器进行重新训练(Retrain),以学习用户偏好。 (见说明书[0109]-[0110]、[0123]及图5C) |
D1 (EP3114611A1): 段落[0091]及图5C "at block 530, a user moves an image... at block 534, the trained classifier is retrained based on the updated labels." D6 (US2008103996A1): 段落[0046]-[0047] "the new label 88 assigned by user 57 replaces the previous label 8... the classifier 3 is retrained using the modified training set 45" |
被公开。 被D1单独毫无疑义地公开; 也被D6单独实质公开。 |
需要我进一步针对对比文件D1和D6,分析它们是否完整公开了权利要求1中的其他技术特征(A-E, G),以评估该权利要求整体的新颖性和创造性吗?
在进行新颖性和创造性评估时,说明书的具体实施方式对权利要求术语的边界界定至关重要。结合目标专利的说明书及对比文件的原文,对技术特征F的分析如下:
技术特征F:“当所述所指派的标记被修改时用所述图像来重新训练所述第一预先训练的分类器”
结合目标专利说明书(CN106104577B),该特征描述的是一个基于用户反馈的监督式机器学习微调(Fine-tuning)过程。具体而言:
说明书第[0108]-[0110]段记载:用户可以修改系统最初的聚类结果(例如将“人”的图像从“建筑物”群集移动到“人”的群集)。系统会捕获这一修改动作,并执行分类器(如支持向量机或多层感知器)对移动的图像进行重新标记,从而让深度卷积网络学习用户的偏好。
说明书第[0123]段及图5C记载了该动作的完整流程:“在框530,用户将图像从第一文件夹移至第二文件夹... 在框532,可基于被移动的图像和/或重新标记来更新第二文件夹中的图像的标记... 在框534,基于经更新的标记来重新训练经训练的分类器。”
实质含义:当系统自动分配的标记被用户手动修改(如移动图片、重命名文件夹)后,系统将这部分被修改的图像及其新标记作为真实的监督数据(Ground Truth),触发分类器的重新训练(Retrain)。
经过详细检索与比对,对比文件D1(EP3114611A1)单独毫无疑义地公开了该特征;对比文件D6(US2008103996A1)实质公开了该技术特征。其他对比文件未公开该特征。
分析结论:单独毫无疑义地公开了特征F。
事实依据:D1实际上是目标专利的同族专利(均要求了US 61/949,851的优先权),其说明书的实施例记载与目标专利高度一致。
D1说明书第[0078]段记载:“The user may determine that the image of the person should belong in the cluster for images of people and may subsequently move the image... based on the reclassification of the image, the deep convolutional network learns the user's preferences... a classifier... may be executed to re-label only the moved images.”(对应目标专利的修改标记与学习用户偏好)。
D1说明书第[0091]段及图5C明确记载了重新训练的触发条件:“at block 530, a user moves an image from a first folder to a second folder... at block 532, the labels for the images in the second folder may be updated... at block 534, the trained classifier is retrained based on the updated labels.”(在框534,基于更新的标记重新训练经训练的分类器)。
比对结果:D1的原文记载与特征F的字面限定完全契合。
分析结论:实质公开了特征F。
事实依据:D6公开了一种主动学习与监督学习结合的框架,专门用于利用用户重新标记的样本来重新训练分类器。
D6说明书第[0024]段记载:“previously labeled samples 7 are selected from training set 45 and submitted for confirmation/re-labeling”(选取先前已标记的样本供用户确认/重新标记)。
D6说明书第[0046]段记载了标记的修改过程:“Alternatively, the previously assigned classification label 8 for the training sample 7 could have been contradicted by user 57... the new label 88 assigned by user 57 replaces the previous label 8.”(用户否定之前分配的分类标记,并用新标记替换先前的标记)。
D6说明书第[0047]段记载了修改后的重新训练:“once the training set 45 has been updated, the classifier 3 is retrained using the modified training set 45”(一旦训练集更新,就使用修改后的训练集重新训练分类器3)。
比对结果:D6明确公开了在样本被用户修改标记后,利用这些被修改的数据来触发分类器的重新训练,其实质技术手段与解决的技术问题与特征F完全一致。
D2 (JP2011044044A):第[0080]段提到了用户可以“手动分类/修正”,且手动分类的信息会改变群集的平均值并反映在后续自动分类中。但D2采用的是基于特征距离平均值的聚类算法更新,并未公开机器学习模型意义上的“重新训练预先训练的分类器(Retrain)”,属于相关概念但未实质公开特征F。
D4 (JPH08227408A)、D7 (US2011119210A1) 等文件:主要涉及模型初始训练过程中的“错判样本自适应标记(Adaptive label)”或“增加错判类别”,属于算法层面的全自动迭代,并未涉及“系统已指派标记被(用户)修改后触发重新训练”这一应用层面的交互式闭环。
| 权利要求1技术特征 | 目标专利说明书解释 | 包含该特征的对比文件及原文出处 | 比对结论 |
| F: 当所述所指派的标记被修改时用所述图像来重新训练所述第一预先训练的分类器 |
当用户对系统自动分配的群集或标记进行修改(如移动图像所在的文件夹)时,系统利用带有新标记的图像作为监督数据,对原分类器进行重新训练(Retrain),以学习用户偏好。 (见说明书[0109]-[0110]、[0123]及图5C) |
D1 (EP3114611A1): 段落[0091]及图5C "at block 530, a user moves an image... at block 534, the trained classifier is retrained based on the updated labels." D6 (US2008103996A1): 段落[0046]-[0047] "the new label 88 assigned by user 57 replaces the previous label 8... the classifier 3 is retrained using the modified training set 45" |
被公开。 被D1单独毫无疑义地公开; 也被D6单独实质公开。 |
需要我进一步针对对比文件D1和D6,分析它们是否完整公开了权利要求1中的其他技术特征(A-E, G),以评估该权利要求整体的新颖性和创造性吗?
作为一名经验丰富的专利代理师,我将紧密结合目标专利(CN106104577B《照片管理》)的说明书及权利要求,对您提供的对比文件进行深入分析,以确定其是否单独或组合地公开了技术特征F。
技术特征F:“当所述所指派的标记被修改时用所述图像来重新训练所述第一预先训练的分类器”
结合目标专利说明书的语境分析:
根据目标专利说明书第[0108]-[0114]段及第[0123]段(对应图5C)的记载,该特征的应用场景为:系统自动将图像分群集并指派标记(如自动分类到“建筑物”文件夹)后,用户可能会根据个人偏好修改标记或改变图像所属的群集(例如,用户发现“建筑物”群集里有一张“人”的图像,将其移动到“人”的群集/文件夹中)。当发生这种标记修改(移动图像/重新标记)时,系统会基于被移动的图像和/或经更新的标记,对神经网络分类器进行实时重新训练(细调),从而让分类器学习用户的偏好,用于后续的分类。
通过对提供的8篇对比文件进行逐一排查,发现**对比文件D2(US2016140146A1)和对比文件D7(US8913152B1)**均对技术特征F构成了实质性公开。
公开号: US2016140146A1 (Systems and Methods of Building and Using an Image Catalog)
原文详细出处与技术比对:
关于“修改所指派的标记”: D2说明书第 [0137] 段记载:“The viewer application 102 allows the user to add manual tags to both individual and groups of images... Tags can also be removed from images, including automatically added tags, which can be useful when moving an image through a workflow or when correcting imprecise automatically added tags.”(查看器应用程序允许用户添加手动标签...也可以从图像中删除标签,包括自动添加的标签,这在移动图像或纠正不精确的自动添加标签时非常有用)。这实质公开了当系统自动指派的标记不准确时,用户可以进行修改/纠正。
关于“用所述图像来重新训练分类器”: D2说明书第 [0113] 段记载:“To further improve the quality of search results... The stored keyword sets and associated error metrics can then be used to train and improve the quality of the image analysis (506) process.”(为了进一步提高搜索结果的质量……存储的关键字集和相关的误差度量随后可用于训练和改进图像分析过程的质量)。
D2说明书第 [0115] 段记载:“The training set can be extended using manual facial identification... By identifying people in a few images, the facial recognition (512) process can do a significantly better job of finding those same people in other images.”(可以使用手动面部识别来扩展训练集……通过在几张图像中识别人物,面部识别过程在其他图像中寻找相同人物的工作可以做得更好)。
D2中的“Image analysis process (图像分析过程/面部识别过程)”本质上就是目标专利中的“分类器”。D2明确公开了利用用户手动修改/确认的图像来扩展训练集,并以此来重新训练/改进分类过程。
结论: 对比文件D2单独实质公开了技术特征F。
公开号: US8913152B1 (Techniques for user customization in a photo management system)
原文详细出处与技术比对:
关于“修改所指派的标记(移动图像)”:
D7说明书第 [0005] 和 [0083] 段记载了用户输入可以包括:“moving the second specific photo from the specific cluster to another one of the plurality of clusters”(将第二特定照片从特定群集移动到多个群集中的另一个群集)。在聚类/分类系统中,将照片从一个群集移动到另一个群集,等同于修改了该照片被指派的标记。
关于“用所述图像来重新训练分类器”:
D7说明书第 [0086] 和 [0087] 段记载:“...at least one of the quality metrics and the similarity matrix can be adjusted when the user input corresponds to at least one of adding the first specific photo... and deleting the second specific photo... the photo album adjustment module 324 may also perform incremental machine learning techniques for SVMs.”(当用户输入对应于添加或删除照片时,可以调整质量度量和相似度矩阵……相册调整模块324还可以对支持向量机(SVM)执行增量机器学习技术)。
D7中的SVM(支持向量机)即为分类器模型。当用户通过移动/添加/删除照片(修改标记)时,系统会针对SVM触发“增量机器学习(incremental machine learning)”,这与目标专利中“用所述图像来重新训练分类器”的技术手段和目的完全一致。
结论: 对比文件D7也单独实质公开了技术特征F。
以下为技术特征F与对比文件D2、D7的详细特征比对表:
| 目标专利权利要求1特征 | 对比文件 D2 (US2016140146A1) 对应公开内容 | 对比文件 D7 (US8913152B1) 对应公开内容 | 比对结果 |
|
技术特征E: 修改所指派的标记 |
[0137]段:公开了用户可以删除/修改自动添加的标签(correcting imprecise automatically added tags),以及在移动图像时修改标签。 | [0005]、[0083]段:公开了用户可以通过将照片从一个群集移动到另一个群集(moving the photo from the specific cluster to another)来进行自定义输入。 | 实质公开 |
|
技术特征F: 当所述所指派的标记被修改时,用所述图像来重新训练所述第一预先训练的分类器 |
[0113]、[0115]段:公开了通过手动识别(修改/确认标签)来扩展训练集(The training set can be extended using manual facial identification),并使用这些数据来训练和改进图像分析/识别过程(train and improve the quality of the image analysis process)。 | [0086]、[0087]段:公开了当用户通过输入(如移动群集中的照片)进行修改时,系统会对支持向量机(SVM)分类模型执行增量机器学习(perform incremental machine learning techniques for SVMs)。 | 实质公开 |
基于上述严密的对比分析,得出如下结论:
技术特征F已被对比文件D2(US2016140146A1)和对比文件D7(US8913152B1)分别单独、实质地公开。
两篇对比文件均属于图像/照片管理领域的现有技术,且都致力于解决同一个技术问题:即现有的自动图像分类/打标签技术不够准确,需要引入用户的交互(纠正标签/移动文件夹),并将用户的交互结果(修改后的图像标记)作为新的训练样本,通过增量学习或扩展训练集的方式,对底层的分类器(如D2中的深度卷积神经网络/面部识别模型,或D7中的SVM)进行重新训练,以不断优化系统的分类准确率和贴合用户偏好。
因此,在评价目标专利的创造性时,审查员极有可能引用D2或D7来论证技术特征F属于本领域的常规技术手段(即基于用户反馈的增量学习/主动学习机制),权利要求1在引入该特征后并不具备突出的实质性特点和显著的进步。建议在后续答辩或无效应对中,尽量寻找目标专利在“重新训练的触发条件”、“特征提取分类器与重新分类分类器的协同关系”上与D2/D7的微观区别,否则该权利要求的稳定性存在较大风险。
你好!这份无效分析请求非常有针对性。针对目标专利(CN106104577B)的权利要求1,我将结合说明书对其进行拆解解释,并紧密比对对比文件1(D1:JP2011044044A)和对比文件2(D2:US2008103996A1)的原文出处,最后从最接近的现有技术及结合启示的角度评估其创造性。
权利要求1主要保护一种基于机器学习和聚类算法的图像处理与管理方法。结合说明书,各核心特征的具体含义如下:
特征A与B(预训练与特征提取): 说明书[0098]-[0099]指出,使用预先训练的深度卷积网络(DCN)作为特征提取器。这里的“特征”是网络某一层输出的特征向量。用于提取特征的图像(存储图像)显然不同于初始训练DCN时的图像库。
特征C(图像聚类): 说明书[0100]明确提到使用k-means或g-means等系统将特征向量分群集(聚类)。
特征D(条件化标记指派): 说明书[0102]解释了标记的分配逻辑。在形成群集中心后,并非所有图像都被强制标记。只有距离群集中心在特定距离(第一阈值)内,或者占据群集特定百分比/数量(第二/第三阈值)的图像,才会被指派特定标记(即“强”标记)。
特征E、F与G(用户修正与重训练闭环): 说明书[0109]-[0111]描述了用户可以手动修改图像的所属文件夹(即修改标记)。系统捕捉到这一重分类行为后,会利用修改后的数据实时重新训练分类器(如多层感知器或SVM),并基于更新后的模型对图像进行重新分拣。
下表概括了D1与D2对权利要求1各技术特征的公开情况:
| 技术特征 | D1 (JP2011044044A) 公开情况 | D2 (US2008103996A1) 公开情况 |
| A: 用第一预先训练分类器确定特征 | 实质公开 (利用字典数据匹配提取人脸特征) | 公开 (使用机器学习分类器分类样本) |
| B: 存储图像特征不同于训练图像 | 公开 (处理新增/更新的图像文件) | 公开 (处理未标记的新样本) |
| C: 基于特征将图像指派给群集 | 公开 (根据特征类似度将脸部分类至组/Group) | 未公开 (直接分类,未提及特征聚类) |
| D: 基于距离/数量/百分比阈值指派标记 | 未公开 (仅基于平均类似度比较,无距离/数量双重逻辑) | 未公开 (无聚类及基于聚类中心的阈值判断) |
| E: 修改所指派的标记 | 公开 (用户手动修改/重分类) | 公开 (用户确认或重新提供标签) |
| F: 标记修改时重训练分类器 | 实质公开 (手动作业后更新组平均值/特征信息) | 公开 (利用修改后的训练集重训练分类器) |
| G: 基于预先训练分类器重新分类 | 公开 (将手动分类信息反映于后续自动分类) | 公开 (使用重训练的分类器重新处理样本) |
特征A与B: D1段落[0048]-[0053]记载了“脸矩形检测部21参照预先利用大量脸图像学习的脸检索用字典数据53...检测脸的区域”。段落[0044]记载了检测“新追加”的图像文件。这实质公开了利用预先训练的模型提取非训练集图像的特征。
特征C: D1段落[0055]-[0056]记载了“算出该脸矩形具有的特征量...比较算出类似度...按各集合体(各组)对各脸矩形进行分类”。毫无异议地公开了聚类操作。
特征E: D1段落[0063]-[0064]及[0080]记载了“移动体终端的用户手动对图像文件进行分类”,明确公开了用户修改标记的行为。
特征F与G: D1段落[0080]记载了“手动分类后...关于该手动分类的脸矩形所属的组,所述平均值等也会改变...该手动分类的信息在之后的自动分类时被反映”,实质公开了模型基准的更新(重训练)及重新分类应用。
特征A与B: D2段落[0017]-[0018]记载了“未标记样本2输入到自动分类器3...通过训练模块5使用训练样本7及标签8设定分类器参数”。
特征E: D2段落[0045]-[0046]记载了用户确认或反驳先前分配的分类标签(重新标记/re-labeling)。
特征F与G: D2段落[0047]明确记载了“一旦训练集45被更新,就使用修改后的训练集45重新训练分类器3...并使用重训练的分类器3重新处理标记的训练样本”。
在创造性评价中,D1更适合作为最接近的现有技术。
技术领域与整体解决的技术问题: 目标专利与D1均处于“移动终端中的照片/图像分类与管理”领域。目标专利旨在解决大量图像自动分拣并在用户手动调整后学习偏好的问题;D1的段落[0008]-[0009]及[0014]明确指出,其解决的问题是减轻用户在图像更新时手动分类的负担,通过自动脸部分组并允许用户确认/修正来实现。两者高度一致。
技术效果: 两者均实现了初始自动聚类分组,以及通过用户的手动干预来细调未来的自动分类准确性,实现智能相册管理。
反观D2: D2属于通用机器学习领域的“主动学习(Active Learning)”算法改进,解决的是如何挑选最合适的样本让用户重新打标签以提升模型训练效率的问题,脱离了图像聚类相册管理的具体应用场景。
结论:对比文件D1与D2的组合不能毫无异议地无效权利要求1。
分析理由:
即使将D1作为最接近的现有技术,权利要求1相对于D1仍存在关键区别特征,即特征D:“基于所述图像离对应于所述图像的最接近的群集中心的距离小于第一阈值、与所述最接近的群集中心相关联的预定义图像数目小于第二阈值、和/或与最接近的群集中心相关联的图像百分比小于第三阈值来向所述多个所存储图像中的图像指派标记”。
D1未公开此特征: D1的分类逻辑(段落[0071]-[0074])是基于类似度平均值是否超过特定阈值来进行组别合并或分配,它并未公开建立一个具体的“聚类中心”,也没有运用“距离限制 + 图像数目限制 + 图像百分比限制”这种多维度的条件化标记策略。
D2未提供结合启示: D2探讨的是通过算法(如置信度预测、多样性分析)挑选出模型容易分错的样本(边界样本)交给人工重新打标签。D2完全没有涉及任何“无监督聚类(Clustering)”的机制,更没有提及基于群集中心距离或群集内样本数量分布来进行初始自动打标的算法逻辑。
无显而易见性: 特征D在目标专利中的技术效果是筛选出最具代表性的“强标记”样本用于监督分类器训练(见说明书[0107])。本领域技术人员在面对D1中基于人脸类似度平均值的简单分组策略时,无法从通用主动学习文献D2中获得引入“群集中心距离与数量分布阈值结合”的具体算法启示。
因此,该特征D使得权利要求1具备了突出的实质性特点和显著的进步,现有对比文件的组合难以直接撼动其创造性。
需要我为您进一步撰写针对该专利其他从属权利要求的防卫性或进攻性分析策略吗?
你好!作为一名经验丰富的专利代理师,我将为您对目标专利的技术特征D与提供的六篇对比文件(D1-D6)进行深入的对比分析。
在进行对比之前,我们首先需要紧密结合目标专利说明书,准确理解技术特征D的内涵:
技术特征D原文:“基于所述图像离对应于所述图像的最接近的群集中心的距离小于第一阈值、与所述最接近的群集中心相关联的预定义图像数目小于第二阈值、和/或与最接近的群集中心相关联的图像百分比小于第三阈值来向所述多个所存储图像中的图像指派标记”
说明书支撑: 根据目标专利说明书[0102]段、[0107]段以及[0120]段的记载,该特征的核心在于监督式分群集中的“强”标记(Strong labels)生成机制。在形成群集(例如k-means分群集)之后,并非对群集中的所有图像都进行标记,而是仅对满足以下三个条件之一的图像指派特定标记,用于后续训练分类器:
距离条件(距离d):离群集中心在特定距离(d)内。
数目条件(数目n):仅前 n 个最接近群集中心的图像。
百分比条件(百分比p%):仅前 p% 的最接近群集中心的图像。
以下为各对比文件(D1-D6)针对技术特征D的公开情况分析:
分析: 经查阅,D1的说明书内容与目标专利说明书高度一致,实际上是目标专利的英文对应文件。
对应出处:
段落 [0070] 明确公开了:“Furthermore, a label is assigned for each image based on the distance of the feature vectors to the center of the cluster... images within a certain distance from a cluster center may be given a specific label... Alternatively, or in addition to, a specific percentage of images associated with the cluster may be assigned a specific label. That is, a number of images up to a threshold, such as a specific percent, may be assigned a specific label.”(基于特征向量与群集中心的距离指派标记...特定距离内...特定百分比...或特定数目的阈值)。
段落 [0075] 进一步明确公开了:“Rather, only images within a specified distance d, or only the n closest or only the p percent closest are labeled. These images are then used for supervised classifier training. Such images may be referred to as "strong" labels.”(仅标记指定距离d内的图像,或仅n个最接近,或仅p%最接近的图像)。
结论: D1单独、毫无疑义且完整地公开了技术特征D。
分析: D2涉及通过计算脸部特征量(如辉度值差)的“类似度”(Similarity)来对图像进行分组(Clustering)。在段落[0070]-[0077]及图12中,公开了计算特征量并与已有组的特征量进行比较,当“类似度的平均值大于第一阈值”时,将其分配给该群集ID。
区别: D2公开了基于相似度阈值将图像分配到某个组(对应技术特征C),但未公开在分配到群集后,利用“离群集中心的距离”、“预定义图像数目(前n个)”或“图像百分比(前p%)”来筛选出部分图像并指派标记用于重新训练。D2中只要超过阈值就归为一类,不存在对群集中心距离、数量或百分比的标记筛选机制。
结论: D2未公开技术特征D。
分析: D3涉及文本中的实体对(Entity pairs)提取,使用最大熵原理(ME)和Spy算法生成正例和负例集合。
区别: 属于完全不同的技术领域(自然语言处理文本特征,而非图像群集处理),没有任何关于图像群集中心、距离阈值或百分比标记的公开。
结论: D3未公开技术特征D。
分析: D4涉及使用支持向量机(SVM)在虚拟结肠镜检查(CT)中区分息肉和健康组织。使用随机正交形状截面(ROSS)提取特征并生成特征向量直方图(段落[0045]-[0047])。
区别: 虽然D4涉及特征提取、k-means聚类(段落[0046]用于确定直方图bin中心)和分类器,但并未公开根据离群集中心的距离<第一阈值、数目<第二阈值或百分比<第三阈值来对存储的图像指派标记以用于分类器训练的技术手段。
结论: D4未公开技术特征D。
分析: D5涉及判断测试图像是清晰还是模糊。其提取图像的纹理区域特征(高通和带通图像特征),并使用预先训练的清晰度分类器(如LDA或SVM)进行判断。
区别: 该文件关注的是模糊与清晰特征的分类,并未公开先将图像分配给群集,然后再基于离群集中心的距离、数目或百分比等三个阈值条件来指派标记的步骤。
结论: D5未公开技术特征D。
分析: D6是模糊逻辑(Fuzzy Logic)和Z-numbers(Zadeh提出)的基础理论及应用专利,主要处理自然语言中的不确定性和模糊推理。
区别: 属于数学模型、语义计算和模糊控制领域,未涉及具体的图像群集管理,完全没有公开技术特征D。
结论: D6未公开技术特征D。
以下为技术特征D与各对比文件的详细特征比对表:
| 权利要求1 技术特征 | 目标专利说明书出处 (CN106104577B) | D1 (EP3114611A1) | D2 (JP2011044044A) | D3-D6 |
|
技术特征D: 基于所述图像离对应于所述图像的最接近的群集中心的距离小于第一阈值、与所述最接近的群集中心相关联的预定义图像数目小于第二阈值、和/或与最接近的群集中心相关联的图像百分比小于第三阈值来向所述多个所存储图像中的图像指派标记 |
段落 [0102]: 基于特性向量与群集中心的距离来将标记指派给每个图像...离群集中心在特定距离内的图像可被给予特定标记...与群集相关联的图像的特定百分比可被指派特定标记...多达一阈值(诸如,特定百分比)的图像数目可被指派特定标记。 段落 [0107]: 仅标记指定距离d内的图像、或者仅n个最接近的图像或仅p%的最接近图像。这些图像随后被用于监督式分类器训练。 |
完全公开。 段落 [0070]: 明确公开了基于离聚类中心的距离(distance)、特定距离阈值(within a certain distance)、特定百分比(specific percentage)、特定数目(number of images up to a threshold)分配标签。 段落 [0075]: 原文重现了 "only images within a specified distance d, or only the n closest or only the p percent closest are labeled." |
未公开。 D2公开了计算类似度,并通过类似度平均值是否大于第一阈值来决定是否分配同一个Cluster ID(段落 区别: D2没有群集中心距离的概念,也没有为了后续重训练而根据距离、数量(n)或百分比(p%)进行部分“指派标记”的筛选机制。 |
未公开。 D3为文本NLP特征提取; D4为3D医疗影像SVM分类,其k-means仅用于确定直方图中心; D5为图像清晰度评价; D6为模糊逻辑控制理论。 均未公开上述特征。 |
经过详细比对,对比文件D1(EP3114611A1)单独且毫无疑义地实质公开了目标专利的“技术特征D”。D1实际上是目标专利的英文同族/同源申请,其说明书段落[0070]和[0075]的英文表述与目标专利说明书对技术特征D的解释形成了完美的字面对应。
对比文件D2虽然涉及图像的分群集(Clustering),但采用的是基于相似度平均值的整体阈值判定,缺乏特征D中基于群集中心“距离”、“数量”或“百分比”进行部分标记(Strong labels)的核心机制。对比文件D3-D6则与特征D的技术手段相去甚远。
因此,无需采用组合手段,仅D1一篇文件即可破坏包含技术特征D的权利要求的创造性(或新颖性,视优先权及公开日而定)。
经过对目标专利说明书以及所提供的六篇对比文件(D1至D6)的详细阅读和深度比对,针对技术特征D的分析意见如下:
对比文件D1至D6(单独或其任何组合)均没有毫无疑义的公开、也未实质公开技术特征D。
结合目标专利说明书(如译文段落 [0101] 至 [0102])可知,目标专利在将图像分群集(聚类)后,并非简单地为群集内的所有图像无差别地指派标记(标签)。相反,指派标记的过程受到严格的阈值条件限制:
距离条件:图像距离最接近的群集中心的距离必须小于“第一阈值”。
数量/百分比条件:与该群集中心相关联的图像数目小于“第二阈值”,或图像百分比小于“第三阈值”。
这意味着系统仅对最靠近群集中心的一定数量或比例的核心图像进行标记,从而提高标记的准确性或满足特定的监督式分群集训练需求(如说明书 [0107] 段落所述的生成“强”标记)。
| 目标专利技术特征 | 最相关的对比文件原文及详细出处 | 比对分析结果 |
|
技术特征D: 基于所述图像离对应于所述图像的最接近的群集中心的距离小于第一阈值、与所述最接近的群集中心相关联的预定义图像数目小于第二阈值、和/或与最接近的群集中心相关联的图像百分比小于第三阈值来向所述多个所存储图像中的图像指派标记。 |
D1 (US2015178383A1):
D2 (US2016217349A1):
D6 (US8913152B1):
|
未公开。 分析: 1. D1 公开的是在由于高维空间中,当词语的表示与输入数据对象的聚合表示(aggregate representation)之间的距离小于一个阈值距离时,将其作为标签。这属于特征空间中的标签匹配,而非图像聚类后的“群集中心”距离,更未涉及图像数目或百分比阈值。 2. D2 公开的是基于相似度值是否大于统计阈值来为图像关联标签,不涉及聚类中心的计算及群集图像数量/百分比。 3. D6 虽然公开了利用分层聚类算法(hierarchical clustering algorithm)对照片进行聚类,但完全没有公开针对聚类后的图像,基于“距离群集中心的距离”、“预定义图像数目”或“图像百分比”等阈值条件来指派标记(Label/Tag)。 |
针对图像聚类与指派标记的逻辑(与D6、D3的对比):
对比文件 D6 (US8913152B1) 确实涉及照片管理以及使用分层聚类算法(Hierarchical Clustering Algorithm)对图像进行聚类并分组(参考 D6 说明书 [0078] 至 [0080])。然而,D6 的目的是将照片划分为不重叠的事件或相册,并未涉及对群集内的图像进行“打标签/指派标记(Assigning tags/labels)”的动作,更未公开基于距离群集中心的距离以及群集内图像数量比例进行选择性标记。
对比文件 D3 (US2016275414A1) 提到了数据点构成的“圆形群集(circular cluster)”以及点到群集中心的距离(参考 D3 说明书 [0047])。但其目的是为了计算“边缘点”以决定是否将新样本加入分类器的重训练集中(特征选择),完全没有公开“指派标记”这一技术动作及对应的阈值判断。
针对阈值判断与指派标记的逻辑(与D1、D2的对比):
对比文件 D1 (US2015178383A1) 和 D2 (US2016217349A1) 涉及为图像或数据对象分配标签(Label)。D1 是基于词汇表示与数据对象聚合表示的距离小于阈值([0040]),D2 是基于相似度大于某个统计阈值([0089])。两者的阈值判定均是用于“分类器/特征匹配”的直接结果,且判定对象是“单个数据对象与模型/标签表示之间的距离”,而非技术特征D中所限定的**“图像与图像群集中心(Cluster Center)的距离”。此外,D1和D2均未公开使用“群集中图像的数目小于第二阈值”或“图像的百分比小于第三阈值”**作为指派标记的联合条件。
对比文件的组合:
即使尝试将 D6(公开了图像聚类)与 D1/D2(公开了利用距离/相似度阈值指派标签)进行组合,本领域技术人员也无法显而易见地得出技术特征D。因为没有任何一篇对比文件给出了技术启示:在聚类完成后,为了获取最核心或最具代表性的图像标记(例如目标专利中的“强”标记),去设立一个基于“预定义图像数目(第二阈值)”或“图像百分比(第三阈值)”的截断机制。
综上所述,对比文件D1至D6无论单独还是结合,均未公开“基于离群集中心的距离阈值,结合群集内图像数量阈值或百分比阈值来指派标记”的完整技术方案,技术特征D具备新颖性和创造性空间。
如权利要求1所述的方法,其特征在于,所述第一预先训练的分类器是支持向量机器(SVM)、逻辑回归、最接近的邻居、或多层感知器(MLP)。
如权利要求1所述的方法,其特征在于,进一步包括,至少部分地基于对应的标记来将所述多个所存储图像中的图像分类到群中。
如权利要求3所述的方法,其特征在于,进一步包括,至少部分地基于对应的群来将所述多个所存储图像中的每个图像放置到文件夹中。
如权利要求4所述的方法,其特征在于,进一步包括,使用非特定名称来命名所述文件夹。
如权利要求4所述的方法,其特征在于,进一步包括,使用第二预先训练的分类器来确定特定文件夹名称。
如权利要求6所述的方法,其特征在于,进一步包括,使用所述第二预先训练的分类器、至少部分地基于与相关联的群的标记相关联的群集中心的分类来确定所述特定文件夹名称。
如权利要求7所述的方法,其特征在于,所述特定文件夹名称进一步至少部分地基于关于给定文件夹的所标记图像的多数裁定规则来确定。
如权利要求4所述的方法,其特征在于,进一步包括,接收修改特定文件夹名称或指派新的特定文件夹名称的用户输入。
如权利要求9所述的方法,其特征在于,进一步包括,至少部分地基于群集中心或者至少一个所标记的图像特征向量来重新训练第二预先训练的分类器以包括经修改的特定文件夹名称或所述新的特定文件夹名称。
如权利要求4所述的方法,其特征在于,进一步包括,至少部分地基于确定新图像的特征向量和应用所述分类器以确定所述新图像的群来将所述新图像放置在文件夹中。
如权利要求3所述的方法,其特征在于,进一步包括,接收修改所述所指派的标记的用户输入。
如权利要求12所述的方法,其特征在于,至少部分地基于将所述图像从第一文件夹移至第二文件夹的用户输入来修改所述所指派的标记。
如权利要求1所述的方法,其特征在于,进一步包括,与第二用户共享至少一个分类器或群集中心列表。
如权利要求14所述的方法,其特征在于,所共享的群集中心列表与所述第二用户的群集中心列表相组合以创建用于所述第二用户的图像的标记并且更新用于所述第二用户的分类器。
如权利要求14所述的方法,其特征在于,进一步包括,与所述第二用户共享用户为类别或群集定义的种类。
一种用于图像处理的装置,所述装置包括: 存储器单元;以及 耦合至所述存储器单元的至少一个处理器,所述至少一个处理器被配置成:用第一预先训练的分类器来确定多个所存储图像的特征,所述多个所存储图像的特征不同于用于训练所述第一预先训练的分类器的多个训练图像; 至少部分地基于所确定的特征来将所述多个所存储图像中的每一个图像指派给多个群集中的群集; 基于所述图像离对应于所述图像的最接近的群集中心的距离小于第一阈值、与所述最接近的群集中心相关联的预定义图像数目小于第二阈值、和/或与最接近的群集中心相关联的图像百分比小于第三阈值来向所述多个所存储图像中的图像指派标记; 修改所指派的标记; 当所述所指派的标记被修改时用所述图像来重新训练所述第一预先训练的分类器;以及至少部分地基于所述预先训练的分类器来对所述图像重新分类。
如权利要求17所述的装置,其特征在于,所述第一预先训练的分类器是支持向量机器(SVM)、逻辑回归、最接近的邻居、或多层感知器(MLP)。
如权利要求17所述的装置,其特征在于,所述至少一个处理器被配置成至少部分地基于对应的标记来将所述多个所存储图像分类到群中。
如权利要求19所述的装置,其特征在于,所述至少一个处理器被配置成至少部分地基于对应的群来将所述多个所存储图像中的每个图像放置到文件夹中。
如权利要求20所述的装置,其特征在于,所述至少一个处理器被配置成使用非特定名称来命名所述文件夹。
如权利要求20所述的装置,其特征在于,所述至少一个处理器被配置成使用第二预先训练的分类器来确定特定文件夹名称。
如权利要求22所述的装置,其特征在于,所述第二预先训练的分类器被配置成至少部分地基于与相关联的群的标记相关联的群集中心的分类来确定所述特定文件夹名称。
如权利要求23所述的装置,其特征在于,所述至少一个处理器被配置成至少部分地基于关于给定文件夹的所标记图像的多数裁定规则来确定所述特定文件夹名称。
如权利要求20所述的装置,其特征在于,所述至少一个处理器被进一步配置成接收修改特定文件夹名称或指派新的特定文件夹名称的用户输入。
如权利要求25所述的装置,其特征在于,所述至少一个处理器被配置成至少部分地基于群集中心或者至少一个所标记的图像特征向量来重新训练第二预先训练的分类器以包括经修改的特定文件夹名称或所述新的特定文件夹名称。
如权利要求20所述的装置,其特征在于,所述至少一个处理器被进一步配置成至少部分地基于确定新图像的特征向量和应用所述分类器以确定所述新图像的群来将所述新图像放置在文件夹中。
如权利要求19所述的装置,其特征在于,所述至少一个处理器被进一步配置成接收修改所述所指派的标记的用户输入。
如权利要求28所述的装置,其特征在于,至少部分地基于将所述图像从第一文件夹移至第二文件夹的用户输入来修改所述所指派的标记。
如权利要求17所述的装置,其特征在于,所述至少一个处理器被进一步配置成与第二用户共享至少一个分类器或群集中心列表。
如权利要求30所述的装置,其特征在于,所述至少一个处理器被进一步配置成与所述第二用户共享用户为类别或群集定义的种类。
一种用于图像处理的其上记录有程序代码的非瞬态计算机可读介质,所述程序代码由处理器执行以:用第一预先训练的分类器来确定多个所存储图像的特征,所述多个所存储图像的特征不同于用于训练所述第一预先训练的分类器的多个训练图像; 至少部分地基于所确定的特征来将所述多个所存储图像中的每一个图像指派给多个群集中的群集; 基于所述图像离对应于所述图像的最接近的群集中心的距离小于第一阈值、与所述最接近的群集中心相关联的预定义图像数目小于第二阈值、和/或与最接近的群集中心相关联的图像百分比小于第三阈值来向所述多个所存储图像中的图像指派标记; 修改所指派的标记; 当所述所指派的标记被修改时用所述图像来重新训练所述第一预先训练的分类器;以及至少部分地基于所述预先训练的分类器来对所述图像重新分类。
一种用于图像处理的设备,所述设备包括: 用于用第一预先训练的分类器来确定多个所存储图像的特征的装置,所述多个所存储图像的特征不同于用于训练所述第一预先训练的分类器的多个训练图像; 用于至少部分地基于所确定的特征来将所述多个所存储图像中的每一个图像指派给多个群集中的群集的装置; 用于基于所述图像离对应于所述图像的最接近的群集中心的距离小于第一阈值、与所述最接近的群集中心相关联的预定义图像数目小于第二阈值、和/或与最接近的群集中心相关联的图像百分比小于第三阈值来向所述多个所存储图像中的图像指派标记的装置; 用于修改所指派的标记的装置; 用于当所述所指派的标记被修改时用所述图像来重新训练所述第一预先训练的分类器的装置;以及用于至少部分地基于所述预先训练的分类器来对所述图像重新分类的装置。