首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种标注图片的方法和装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司

摘要:本发明公开了一种标注图片的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取与待标注图片的时间戳差值小于阈值并且时间戳早于所述待标注图片的至少两张已标注图片,根据所述多张已标注图片上的对象框的位置变化,确定所述待标注图片上的待标注对象框的方向性;根据所述待标注对象框的方向性,确定所述待标注对象框的位置数据;根据对象检测算法和所述待标注对象框的位置数据,在所述待标注图片上标注所述待标注对象框。该实施方式能够解决标注工作存在大量重复性劳动的问题。

主权项:1.一种标注图片的方法,其特征在于,包括:获取与待标注图片的时间戳差值小于阈值并且时间戳早于所述待标注图片的至少两张已标注图片,根据所述至少两张已标注图片上的对象框的位置变化,确定所述待标注图片上的待标注对象框的方向性;根据所述待标注对象框的方向性,确定所述待标注对象框在所述待标注图片上的位置数据;根据对象检测算法和所述待标注对象框的位置数据,在所述待标注图片上标注所述待标注对象框;根据所述至少两张已标注图片上的对象框的位置变化,确定所述待标注图片上的待标注对象框的方向性,包括:获取所述至少两张已标注图片上的对象框的位置数据;根据所述位置数据的变化,计算所述待标注图片上的待标注对象框在不同方向上的权重,以确定所述待标注对象框的方向性;根据所述待标注对象框的方向性,确定所述待标注对象框在所述待标注图片上的位置数据,包括:根据所述待标注对象框在不同方向上的权重,以及,与所述待标注图片的时间戳差值小于阈值并且时间戳早于所述待标注图片的已标注图片上的对象框的位置数据,计算所述待标注对象框在所述待标注图片上的位置数据;或者,对与所述待标注图片的时间戳差值小于阈值并且时间戳早于所述待标注图片的一张已标注图片上的对象框的位置数据增加空白数据,并根据所述待标注对象框在不同方向上的权重,计算所述待标注对象框在所述待标注图片上的位置数据;其中,所述一张已标注图片的时间戳与所述待标注图片的时间戳最接近。

全文数据:一种标注图片的方法和装置技术领域本发明涉及计算机技术领域,尤其涉及一种标注图片的方法和装置。背景技术在机器学习领域内,数据集的大小以及数据集标注质量的好坏,对一个机器学习算法的输出结果有着至关重要的影响。以图片数据集为例,采用现有的标注工具进行标注的基本步骤是:针对每一张图片进行人工标注,或者,先从视频中获取帧图片,然后针对每一张图片进行人工标注。在实现本发明过程中,发明人发现现有技术中至少存在如下问题:具有时空相似性的图片存在很大的相似性,导致标注工作存在大量重复性劳动,标注工作的效率低,成本高。发明内容有鉴于此,本发明实施例提供一种标注图片的方法和装置,以解决标注工作存在大量重复性劳动的技术问题。为实现上述目的,根据本发明实施例的一个方面,提供了一种标注图片方法,包括:获取与待标注图片的时间戳差值小于阈值并且时间戳早于所述待标注图片的至少两张已标注图片,根据所述至少两张已标注图片上的对象框的位置变化,确定所述待标注图片上的待标注对象框的方向性;根据所述待标注对象框的方向性,确定所述待标注对象框在所述待标注图片上的位置数据;根据对象检测算法和所述待标注对象框的位置数据,在所述待标注图片上标注所述待标注对象框。可选地,根据所述至少两张已标注图片上的对象框的位置变化,确定所述待标注图片上的待标注对象框的方向性,包括:获取所述至少两张已标注图片上的对象框的位置数据;根据所述位置数据的变化,计算所述待标注图片上的待标注对象框在不同方向上的权重,以确定所述待标注对象框的方向性。可选地,根据所述至少两张已标注图片上的对象框的位置变化,确定所述待标注图片上的待标注对象框的方向性,包括:获取所述至少两张已标注图片上的对象框的位置数据,所述位置数据包括坐标数据、宽度和高度;根据所述对象框的位置数据,确定不同图片上的属于同一对象的对象框;根据所述属于同一对象的对象框在不同图片上的位置数据的变化,计算所述待标注图片上的待标注对象框在不同方向上的权重,以确定所述待标注对象框的方向性。可选地,根据所述待标注对象框的方向性,确定所述待标注对象框在所述待标注图片上的位置数据,包括:根据所述待标注对象框在不同方向上的权重,以及,与所述待标注图片的时间戳差值小于阈值并且时间戳早于所述待标注图片的已标注图片上的对象框的位置数据,计算所述待标注对象框在所述待标注图片上的位置数据。可选地,根据所述待标注对象框的方向性,确定所述待标注对象框在所述待标注图片上的位置数据,包括:对与所述待标注图片的时间戳差值小于阈值并且时间戳早于所述待标注图片的一张已标注图片上的对象框的位置数据增加空白数据,并根据所述待标注对象框在不同方向上的权重,计算所述待标注对象框在所述待标注图片上的位置数据。可选地,根据对象检测算法和所述待标注对象框的位置数据,在所述待标注图片上标注所述待标注对象框,包括:将所述待标注对象框的位置数据输入对象检测算法中,所述对象检测算法通过训练和预测回归,筛选出存在有对象的待标注对象框的位置数据;将所述存在有对象的待标注对象框的位置数据映射到待标注图片的坐标上,以在所述待标注图片上标注所述待标注对象框。另外,根据本发明实施例的另一个方面,提供了一种标注图片的装置,包括:方向计算模块,用于获取与待标注图片的时间戳差值小于阈值且时间戳早于所述待标注图片的至少两张已标注图片,根据所述至少两张已标注图片上的对象框的位置变化,确定所述待标注图片上的待标注对象框的方向性;位置计算模块,用于根据所述待标注对象框的方向性,确定所述待标注对象框在所述待标注图片上的位置数据;标注模块,用于根据对象检测算法和所述待标注对象框的位置数据,在所述待标注图片上标注所述待标注对象框。可选地,根据所述至少两张已标注图片上的对象框的位置变化,确定待标注对象框的方向性,包括:获取所述至少两张已标注图片上的对象框的位置数据;根据所述位置数据的变化,计算所述待标注图片上的待标注对象框在不同方向上的权重,以确定所述待标注对象框的方向性。可选地,根据所述至少两张已标注图片上的对象框的位置变化,确定待标注对象框的方向性,包括:获取所述至少两张已标注图片上的对象框的位置数据,所述位置数据包括坐标数据、宽度和高度;根据所述对象框的位置数据,确定不同图片上的属于同一对象的对象框;根据所述属于同一对象的对象框在不同图片上的位置数据的变化,计算所述待标注图片上的待标注对象框在不同方向上的权重,以确定所述待标注对象框的方向性。可选地,所述位置计算模块,用于:根据所述待标注对象框在不同方向上的权重,以及,与所述待标注图片的时间戳差值小于阈值并且时间戳早于所述待标注图片的已标注图片上的对象框的位置数据,计算所述待标注对象框在所述待标注图片上的位置数据。可选地,所述位置计算模块,用于:对与所述待标注图片的时间戳差值小于阈值并且时间戳早于所述待标注图片的一张已标注图片上的对象框的位置数据增加空白数据,并根据所述待标注对象框在不同方向上的权重,计算所述待标注对象框在所述待标注图片上的位置数据。可选地,所述标注模块,用于:将所述待标注对象框的位置数据输入对象检测算法中,所述对象检测算法通过训练和预测回归,筛选出存在有对象的待标注对象框的位置数据;将所述存在有对象的待标注对象框的位置数据映射到待标注图片的坐标上,从而在所述待标注图片上标注所述待标注对象框。根据本发明实施例的另一个方面,还提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任一实施例所述的方法。根据本发明实施例的另一个方面,还提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任一实施例所述的方法。上述发明中的一个实施例具有如下优点或有益效果:因为采用根据至少两张已标注图片上的对象框的位置变化,确定待标注对象框的方向性,从而确定待标注对象框的位置数据的技术手段,所以克服了标注工作存在大量重复性劳动的技术问题,基于至少两张图片的时空相似性,根据至少两张已标注图片上的对象框的位置变化,确定待标注对象框的方向性,以确定待标注对象框的位置数据,继而根据对象检测算法和待标注对象框的位置数据,在待标记图片上标记对象框,从而减少重复性劳动,提高标注工作的效率和质量,降低标注的成本。上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。附图说明附图用于更好地理解本发明,不构成对本发明的不当限定。其中:图1是根据本发明实施例的标注图片的方法的主要流程的示意图;图2是根据本发明实施例的对象框在不同图片上的坐标数据的变化的示意图;图3是根据本发明一个可参考实施例的标注图片的方法的主要流程的示意图;图4是根据本发明实施例的标注图片的装置的主要模块的示意图;图5是本发明实施例可以应用于其中的示例性系统架构图;图6是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。具体实施方式以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。为了减少标注重复性工作,目前的标注过程只是从图片的截取、标注文字的便捷输入等方面考虑,并没有考虑通过提取至少两张图片之间的相关性来减少人工标注图片的工作量。而本发明实施例提供的方法包括:获取与待标注图片的时间戳差值小于阈值的至少两张已标注图片,根据所述至少两张已标注图片上的对象框的位置变化,确定所述待标注图片上的待标注对象框的方向性。因此,该方法基于至少两张图片之间的时空相似性,预测待标注对象框的标注位置,从而减少人工标注图片的工作量,避免对相似性大的图片进行重复性的标注工作。图1是根据本发明实施例的标注图片的方法的主要流程的示意图。作为本发明的一个实施例,如图1所示,所述标注图片的方法可以包括:步骤101,获取与待标注图片的时间戳差值小于阈值并且时间戳早于所述待标注图片的至少两张已标注图片,根据所述至少两张已标注图片上的对象框的位置变化,确定所述待标注图片上的待标注对象框的方向性。在该步骤中,获取与待标注图片在时间上最接近并且早于所述待标注图片的至少两张已标注图片,根据所述至少两张已标注图片上的每个对象框在不同图片上的位置变化,确定每个待标注对象框的行进方向。比如,根据时间上相邻的两张图片上的某一个对象框的位置变化,确定待标注对象框的行进方向为左上;或者,根据时间上相邻的三张图片上的某一个对象框的位置变化,确定待标注对象框的行进方向为右下。因此,基于具有时空相似性的至少两张图片,可以确定待标注图片上的待标注对象框的方向性。需要说明的是,阈值的大小根据需要进行设置,阈值不同,获取的已标图片的张数就会不同。具体地,分别计算每张已标注图片与待标注图片的时间戳差值,分别判断各个时间戳差值是否小于阈值,从而获取到与待标注图片的时间戳差值小于阈值的至少两张已标注图片。作为本发明的又一个实施例,所述根据所述至少两张已标注图片上的对象框的位置变化,确定所述待标注图片上的待标注对象框的方向性,包括:获取所述至少两张已标注图片上的对象框的位置数据;根据所述位置数据的变化,计算所述待标注图片上的待标注对象框在不同方向上的权重,以确定所述待标注对象框的方向性。具体地,可以将每张已标注图片都映射到同一坐标上,获取已标注图片上的对象框的位置数据,根据对象框在不同图片上的位置数据的变化,计算待标注对象框在不同方向上的权重,从而确定待标注对象框的方向性。在该实施例中,每张图片上只有一个对象,因此不需要判断各张图片上的多个对象是否属于同一对象,也不需要判断各张图片上的对象属于哪一个对象。以下以视频帧图片为例,进行详细说明。首先,获取视频数据,挑选有代表性的时间段客流量较大进行批量抽帧,获取大量的帧图片,这些图片都带有时间戳信息;然后,将这些帧图片按照时间的先后顺序进行排序,选取距离待标注图片的时间戳最接近的K张图片,采用标注工具对K张图片进行人工标注;接着,将K张图片都映射到同一坐标上,通过对象框在不同图片上的位置数据,计算待标注对象框在不同方向上的权重,从而确定所述对象框的方向性。需要指出的是,K的选择越大,需要人工标注的图片张数越多,则对待标注对象框的行进方向的预测越准确,但是相应的标注工作量和计算量会越大。举例来说,获取5张帧图片按照时间戳从前往后依次为图片A、图片B、图片C、图片D、图片E,若K=2,则待标记的图片为3张图片C、图片D、图片E,包括以下步骤:1获取两张时间最靠前且时间上连续的帧图片例如图片A和图片B,采用标注工具在这两张图片上标注对象框例如行人框,将标注有对象框的两张图片都映射到同一坐标上,读取每张图片上的每个行人框的位置数据,例如,位置数据X、Y、W、H的结果如下:上述字段从左到右依次表示各个对象框左上角的X坐标、Y坐标,以及对象框的宽度、高度。其中,令X方向为宽度方向,Y方向为高度方向。2根据所述对象框的宽度、高度,确定不同图片上的属于同一对象的对象框。具体地,根据对象框的宽度、高度,并采用IOU两个矩形的交并比算法计算不同图片上的对象框的面积重合区域,当面积重合区域大于阈值时,则确定不同图片上的对象框属于同一对象。例如,A图片上的对象框A1与B图片上的对象框B1的面积重合区域为78.27%大于阈值75%,则确定对象框A1与对象框B1属于同一对象。3根据所述属于同一对象的对象框在不同图片上的位置数据的变化,计算待标注对象框在不同方向上的权重,从而确定所述待标注对象框的方向性,以确定所述待标注对象框的方向性。举例来说,如图2所示,对象框A1的位置数据为X=145,Y=237,W=220,H=354,对象框B1的位置数据为X=142,Y=269,W=266,H=442,计算待标注对象框在不同方向上的权重:左方行进的权重142-145145≈-0.02下方行进的权重269-237237≈0.14宽度变化的权重266-220220≈0.21高度变化的权重442-354354≈0.25可见,待标注对象框在左方行进的权重偏差较小,在下方行进的权重偏差较大,因此预测待标注对象框朝着左下方行进。需要指出的是,根据图2的坐标,在该实施例中,-0.02中的负号表示左方,正好表示右方,0.14中的正好表示下方,负号表示上方。负号和正号代表的方向与建立的坐标方向有关,本发明实施例仅仅是示例性地建立如图2所示的坐标方向。另外,0.21中的正号表示对象框的宽度变大,负号表示对象框的宽度变小,0.25中的正号表示对象框的高度变大,负号表示对象框的高度变小。实际上,视频中抽取的图片和独立的图片是有很大区别的,视频中的图片不但在时间上具有相关性,还在空间上具有相关性。如果采用独立的图片进行标注,则需要预先确定各种图片中有相同的固定点,以基于同一坐标进行标注和计算,从而保证图片在空间上的相关性。而视频帧图片本身就具有时空相关性,因此本发明实施例提供的方法更加能够提高视频帧图片的标注准确性。步骤102,根据所述待标注对象框的方向性,确定所述待标注对象框在所述待标注图片上的位置数据。在该步骤中,可以根据步骤101计算得到的待标注对象框在不同方向上的权重,计算待标注对象在所述待标注图片上的位置数据。作为本发明的另一个实施例,所述步骤102可以包括:根据所述待标注对象框在不同方向上的权重,以及,与所述待标注图片的时间戳差值小于阈值并且时间戳早于所述待标注图片的已标注图片上的对象框的位置数据,计算所述待标注对象框在所述待标注图片上的位置数据。具体地,首先获取与待标注图片的时间戳最接近的图片上的对象框的位置数据,可以是对象框B1,然后根据待标注对象框在不同方向上的权重,计算得到待标注对象框的位置数据。举例来说,令上下左右的权重初始值WX,WY,WW,WH均为1,以步骤101计算得到的权重-0.02,0.14,0.21,0.25和对象框B1的位置数据X=142,Y=269,W=266,H=442为例,则待标注对象框的位置数据包括:X’=X×WX-0.02=142×1-0.02=139.16Y’=Y×WY+0.14=269×1+0.14=306.66W’=W×WW+0.21=266×1+0.21=321.86H’=H×WH+0.25=442×1+0.25=552.5由此得到待标注对象框的位置数据139.16,306.66,321.86,552.5。作为本发明的再一个实施例,所述步骤102可以包括:对与所述待标注图片的时间戳差值小于阈值并且时间戳早于所述待标注图片的一张已标注图片上的对象框的位置数据增加空白数据,并根据所述待标注对象框在不同方向上的权重,计算所述待标注对象框在所述待标注图片上的位置数据。在该实施例中,通过对与待标记图片的时间戳最接近的图片上的对象框的位置数据增加空白数据P,来增加待标注对象框各个方向上的空白区域,以抵消视频时间差异带来的预测空间差异。可选地,空白数据P的大小可以根据视频时间差异带来的预测空间差异来确定,也可以根据经验确定,例如20、25、30、50、75等。以空白数据P的经验初始值为20为例,待标注对象框的位置数据包括:X’=X-P×WX-0.02=142-20×1-0.02=119.56Y’=Y-P×WY+0.14=269-20×1+0.14=283.86W’=W+2P×WW+0.21=266+40×1+0.21=370.26H’=H+2P×WH+0.25=442+40×1+0.25=602.5由此得到待标注对象框的位置数据119.56,283.86,370.26,602.5。步骤103,根据对象检测算法和所述待标注对象框的位置数据,在所述待标注图片上标注所述待标注对象框。在该步骤中,将经过步骤102计算得到的待标注对象框的位置数据输入对象检测算法中,基于对象检测算法筛选出存在有对象的待标注对象框的位置数据,以在待标注图片上标注所述待标注对象框。作为本发明的再一个实施例,所述步骤103可以包括:首先,将所述待标注对象框的位置数据输入对象检测算法中,所述对象检测算法通过训练和预测回归,筛选出存在有对象的待标注对象框的位置数据;然后,将所述存在有对象的待标注对象框的位置数据映射到待标注图片的坐标上,从而在所述待标注图片上标注所述待标注对象框。其中,所述对象检测算法可以是行人检测算法,例如YOLO-V2算法,该检测算法使用端到端的训练和预测回归,经过一次计算就可以得到结果。具体地,YOLO将整张图片分成SXS的Grid进行目标检测,对象例如行人的中心区域所在的Grid负责该对象的检测,检测区域最终通过NMS来进行区域合并,微调后输出预测结果。因此,通过对象检测算法,能够输出待标记图片的若干待标记对象框的位置数据,输出的数据格式如下:[0.9028096199035645,840.4544677734375,258.7015380859375,133.60772705078125,345.61395263671875,0.8951594233512878,531.0243530273438,412.25616455078125,240.8721160888672,419.3092346191406,0.8737973570823669,273.46173095703125,390.53289794921875,193.24966430664062,404.64691162109375,0.8556963801383972,960.7030029296875,366.8395080566406,139.21823120117188,450.0631408691406]|以第一行数据为例,数据代表的含义表示:对象检测的可信度,X,Y,W,H。其中,X,Y表示待标记对象框的左上角坐标,W和H表示待标记对象框的宽度和高度。接着,对象检测算法输出的数据映射到待标注图片的全局坐标上,标注工具加载这些数据,从而在所述待标注图片上标注所述待标注对象框。最后,可以通过人工微调的方式进一步调整待标注图片上标注的所述待标注对象框,并保存微调后的对象框的位置数据。由于输入对象检测算法的图片小即待标注对象框所对应的图片大小,像素点少,只是整个图片的一部分,因此对象检测算法运算量小,并且由于增加了时空的空白数据,能够提高标注的准确度。在标注工具场景中,对象检测算法可以实时返回结果,有很好的实际应用效果。根据上面所述的各种实施例,可以看出本发明通过采用根据至少两张已标注图片上的对象框的位置变化,确定待标注对象框的方向性,从而确定待标注对象框的位置数据的技术手段,从而解决了标注工作存在大量重复性劳动的问题。也就是说,现有技术是对具有时空相似性的图片进行重复性标注。而本发明是基于至少两张图片的时空相似性,根据至少两张已标注图片上的对象框的位置变化,确定待标注对象框的方向性,以确定待标注对象框的位置数据,继而根据对象检测算法和待标注对象框的位置数据,在待标记图片上标记对象框,从而减少重复性劳动,提高标注工作的效率和质量,降低标注的成本。而且,本发明进一步结合对象检测算法,将对象框的位置数据输入到对象检测算法,预测的只是整个图片的一部分,图片的减小也减少了对象检测算法的运行量,加快了检测算法的运算效率和实时性。图3是根据本发明另一个可参考实施例的标注图片的方法的主要流程的示意图,所述标注图片的方法可以包括:步骤301,获取视频数据,对其进行批量抽帧;步骤302,将这些帧图片按照时间的先后顺序进行排序,选取距离待标注图片的时间戳最接近的K张图片,采用标注工具对K张图片进行标注;步骤303,将K张图片都映射到同一坐标上,获取K张已标注图片上的对象框的位置数据;步骤304,根据对象框在不同图片上的位置数据的变化,计算待标注对象框在不同方向上的权重;步骤305,对与待标注图片的时间戳最接近的一张图片上的对象框的位置数据增加空白数据,并根据所述待标注对象框在不同方向上的权重,计算所述待标注对象框的位置数据;步骤306,将所述待标注对象框的位置数据输入对象检测算法中,所述对象检测算法通过训练和预测回归,筛选出存在有对象的待标注对象框的位置数据;步骤307,将所述存在有对象的待标注对象框的位置数据映射到待标注图片的坐标上,从而在待标注图片上标注所述待标注对象框。本发明实施例提供的方法通过采用根据至少两张已标注图片上的对象框的位置变化,确定待标注对象框的方向性,从而确定待标注对象框的位置数据的技术手段,从而解决了标注工作存在大量重复性劳动的问题。也就是说,现有技术是对具有时空相似性的图片进行重复性标注。而本发明是基于至少两张图片的时空相似性,根据至少两张已标注图片上的对象框的位置变化,确定待标注对象框的方向性,以确定待标注对象框的位置数据,继而根据对象检测算法和待标注对象框的位置数据,在待标记图片上标记对象框,从而减少重复性劳动,提高标注工作的效率和质量,降低标注的成本。另外,在本发明一个可参考实施例中标注图片的方法的具体实施内容,在上面所述标注图片的方法中已经详细说明了,故在此重复内容不再说明。图4是根据本发明实施例的标注图片的装置的主要模块的示意图,如图4所示,所述标注图片的装置包括方向计算模块401、位置计算模块402和标注模块403。其中,所述方向计算模块401获取与待标注图片的时间戳差值小于阈值且时间戳早于所述待标注图片的至少两张已标注图片,根据所述至少两张已标注图片上的对象框的位置变化,确定所述待标注图片上的待标注对象框的方向性;所述位置计算模块402根据所述待标注对象框的方向性,确定所述待标注对象框在所述待标注图片上的位置数据;所述标注模块403根据对象检测算法和所述待标注对象框的位置数据,在所述待标注图片上标注所述待标注对象框。可选地,根据所述至少两张已标注图片上的对象框的位置变化,确定待标注对象框的方向性,包括:获取所述至少两张已标注图片上的对象框的位置数据;根据所述位置数据的变化,计算所述待标注图片上的待标注对象框在不同方向上的权重,以确定所述待标注对象框的方向性。具体地,可以将每张已标注图片都映射到同一坐标上,获取已标注图片上的对象框的位置数据,根据对象框在不同图片上的位置数据的变化,计算待标注对象框在不同方向上的权重,从而确定待标注对象框的方向性。可选地,根据所述至少两张已标注图片上的对象框的位置变化,确定待标注对象框的方向性,包括:获取所述至少两张已标注图片上的对象框的位置数据,所述位置数据包括坐标数据、宽度和高度;根据所述对象框的位置数据,确定不同图片上的属于同一对象的对象框;根据所述属于同一对象的对象框在不同图片上的位置数据的变化,计算所述待标注图片上的待标注对象框在不同方向上的权重,以确定所述待标注对象框的方向性。所述位置计算模块402可以根据方向计算模块401计算得到的待标注对象框在不同方向上的权重,计算待标注对象的位置数据。可选地,所述位置计算模块402根据所述待标注对象框在不同方向上的权重,以及,与所述待标注图片的时间戳差值小于阈值并且时间戳早于所述待标注图片的已标注图片上的对象框的位置数据,计算所述待标注对象框在所述待标注图片上的位置数据。可选地,所述位置计算模块402对与所述待标注图片的时间戳差值小于阈值并且时间戳早于所述待标注图片的一张已标注图片上的对象框的位置数据增加空白数据,并根据所述待标注对象框在不同方向上的权重,计算所述待标注对象框在所述待标注图片上的位置数据。在该实施例中,通过对与待标记图片的时间戳最接近的图片上的对象框的位置数据增加空白数据P,来增加待标注对象框各个方向上的空白区域,以抵消视频时间差异带来的预测空间差异。可选地,空白数据P的大小可以根据视频时间差异带来的预测空间差异来确定,也可以根据经验确定。所述标注模块403将位置计算模块402计算得到的待标注对象框的位置数据输入对象检测算法中,基于对象检测算法筛选出存在有对象的待标注对象框的位置数据,以在待标注图片上标注所述待标注对象框。可选地,所述标注模块403首先将所述待标注对象框的位置数据输入对象检测算法中,所述对象检测算法通过训练和预测回归,筛选出存在有对象的待标注对象框的位置数据;然后将所述存在有对象的待标注对象框的位置数据映射到待标注图片的坐标上,从而在所述待标注图片上标注所述待标注对象框。其中,所述对象检测算法可以是行人检测算法,例如YOLO-V2算法,该检测算法使用端到端的训练和预测回归,经过一次计算就可以得到结果。根据上面所述的各种实施例,可以看出本发明通过采用根据至少两张已标注图片上的对象框的位置变化,确定待标注对象框的方向性,从而确定待标注对象框的位置数据的技术手段,从而解决了标注工作存在大量重复性劳动的问题。也就是说,现有技术是对具有时空相似性的图片进行重复性标注。而本发明是基于至少两张图片的时空相似性,根据至少两张已标注图片上的对象框的位置变化,确定待标注对象框的方向性,以确定待标注对象框的位置数据,继而根据对象检测算法和待标注对象框的位置数据,在待标记图片上标记对象框,从而减少重复性劳动,提高标注工作的效率和质量,降低标注的成本。需要说明的是,在本发明所述标注图片的装置的具体实施内容,在上面所述标注图片的方法中已经详细说明了,故在此重复内容不再说明。图5示出了可以应用本发明实施例的处理超时任务的方法或处理超时任务的装置的示例性系统架构500。如图5所示,系统架构500可以包括终端设备501、502、503,网络404和服务器405。网络504用以在终端设备501、502、503和服务器505之间提供通信链路的介质。网络504可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。用户可以使用终端设备501、502、503通过网络504与服务器505交互,以接收或发送消息等。终端设备501、502、503上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等仅为示例。终端设备501、502、503可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。服务器505可以是提供各种服务的服务器,例如对用户利用终端设备501、502、503所浏览的购物类网站提供支持的后台管理服务器仅为示例。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果例如目标推送信息、产品信息——仅为示例反馈给终端设备。需要说明的是,本发明实施例所提供的标注图片的方法一般在公共场所的终端设备501、502、503上执行,也可以由服务器505执行,相应地,所述标注图片的装置一般设置在公共场所的终端设备501、502、503上,也可以设置在服务器505中。应该理解,图5中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。下面参考图6,其示出了适于用来实现本发明实施例的终端设备的计算机系统600的结构示意图。图6示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。如图6所示,计算机系统600包括中央处理单元CPU601,其可以根据存储在只读存储器ROM602中的程序或者从存储部分608加载到随机访问存储器RAM603中的程序而执行各种适当的动作和处理。在RAM603中,还存储有系统600操作所需的各种程序和数据。CPU601、ROM602以及RAM603通过总线604彼此相连。输入输出IO接口605也连接至总线604。以下部件连接至IO接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管CRT、液晶显示器LCD等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至IO接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和或从可拆卸介质611被安装。在该计算机程序被中央处理单元CPU601执行时,执行本发明的系统中限定的上述功能。需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器RAM、只读存储器ROM、可擦式可编程只读存储器EPROM或闪存、光纤、便携式紧凑磁盘只读存储器CD-ROM、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括方向计算模块、位置计算模块、标注模块,其中,这些模块的名称在某种情况下并不构成对该模块本身的限定。作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:获取与待标注图片的时间戳差值小于阈值并且时间戳早于所述待标注图片的至少两张已标注图片,根据所述至少两张已标注图片上的对象框的位置变化,确定所述待标注图片上的待标注对象框的方向性;根据所述待标注对象框的方向性,确定所述待标注对象框在所述待标注图片上的位置数据;根据对象检测算法和所述待标注对象框的位置数据,在所述待标注图片上标注所述待标注对象框。根据本发明实施例的技术方案,因为采用根据至少两张已标注图片上的对象框的位置变化,确定待标注对象框的方向性,从而确定待标注对象框的位置数据的技术手段,所以克服了标注工作存在大量重复性劳动的技术问题,基于至少两张图片的时空相似性,根据至少两张已标注图片上的对象框的位置变化,确定待标注对象框的方向性,以确定待标注对象框的位置数据,继而根据对象检测算法和待标注对象框的位置数据,在待标记图片上标记对象框,从而减少重复性劳动,提高标注工作的效率和质量,降低标注的成本。上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

权利要求:1.一种标注图片的方法,其特征在于,包括:获取与待标注图片的时间戳差值小于阈值并且时间戳早于所述待标注图片的至少两张已标注图片,根据所述至少两张已标注图片上的对象框的位置变化,确定所述待标注图片上的待标注对象框的方向性;根据所述待标注对象框的方向性,确定所述待标注对象框在所述待标注图片上的位置数据;根据对象检测算法和所述待标注对象框的位置数据,在所述待标注图片上标注所述待标注对象框。2.根据权利要求1所述的方法,其特征在于,根据所述至少两张已标注图片上的对象框的位置变化,确定所述待标注图片上的待标注对象框的方向性,包括:获取所述至少两张已标注图片上的对象框的位置数据;根据所述位置数据的变化,计算所述待标注图片上的待标注对象框在不同方向上的权重,以确定所述待标注对象框的方向性。3.根据权利要求1所述的方法,其特征在于,根据所述至少两张已标注图片上的对象框的位置变化,确定所述待标注图片上的待标注对象框的方向性,包括:获取所述至少两张已标注图片上的对象框的位置数据,所述位置数据包括坐标数据、宽度和高度;根据所述对象框的位置数据,确定不同图片上的属于同一对象的对象框;根据所述属于同一对象的对象框在不同图片上的位置数据的变化,计算所述待标注图片上的待标注对象框在不同方向上的权重,以确定所述待标注对象框的方向性。4.根据权利要求2所述的方法,其特征在于,根据所述待标注对象框的方向性,确定所述待标注对象框在所述待标注图片上的位置数据,包括:根据所述待标注对象框在不同方向上的权重,以及,与所述待标注图片的时间戳差值小于阈值并且时间戳早于所述待标注图片的已标注图片上的对象框的位置数据,计算所述待标注对象框在所述待标注图片上的位置数据。5.根据权利要求2所述的方法,其特征在于,根据所述待标注对象框的方向性,确定所述待标注对象框在所述待标注图片上的位置数据,包括:对与所述待标注图片的时间戳差值小于阈值并且时间戳早于所述待标注图片的一张已标注图片上的对象框的位置数据增加空白数据,并根据所述待标注对象框在不同方向上的权重,计算所述待标注对象框在所述待标注图片上的位置数据。6.根据权利要求1所述的方法,其特征在于,根据对象检测算法和所述待标注对象框的位置数据,在所述待标注图片上标注所述待标注对象框,包括:将所述待标注对象框的位置数据输入对象检测算法中,所述对象检测算法通过训练和预测回归,筛选出存在有对象的待标注对象框的位置数据;将所述存在有对象的待标注对象框的位置数据映射到待标注图片的坐标上,以在所述待标注图片上标注所述待标注对象框。7.一种标注图片的装置,其特征在于,包括:方向计算模块,用于获取与待标注图片的时间戳差值小于阈值且时间戳早于所述待标注图片的至少两张已标注图片,根据所述至少两张已标注图片上的对象框的位置变化,确定所述待标注图片上的待标注对象框的方向性;位置计算模块,用于根据所述待标注对象框的方向性,确定所述待标注对象框在所述待标注图片上的位置数据;标注模块,用于根据对象检测算法和所述待标注对象框的位置数据,在所述待标注图片上标注所述待标注对象框。8.根据权利要求7所述的装置,其特征在于,根据所述至少两张已标注图片上的对象框的位置变化,确定待标注对象框的方向性,包括:获取所述至少两张已标注图片上的对象框的位置数据;根据所述位置数据的变化,计算所述待标注图片上的待标注对象框在不同方向上的权重,以确定所述待标注对象框的方向性。9.根据权利要求7所述的装置,其特征在于,根据所述至少两张已标注图片上的对象框的位置变化,确定待标注对象框的方向性,包括:获取所述至少两张已标注图片上的对象框的位置数据,所述位置数据包括坐标数据、宽度和高度;根据所述对象框的位置数据,确定不同图片上的属于同一对象的对象框;根据所述属于同一对象的对象框在不同图片上的位置数据的变化,计算所述待标注图片上的待标注对象框在不同方向上的权重,以确定所述待标注对象框的方向性。10.根据权利要求8所述的装置,其特征在于,所述位置计算模块,用于:根据所述待标注对象框在不同方向上的权重,以及,与所述待标注图片的时间戳差值小于阈值并且时间戳早于所述待标注图片的已标注图片上的对象框的位置数据,计算所述待标注对象框在所述待标注图片上的位置数据。11.根据权利要求8所述的装置,其特征在于,所述位置计算模块,用于:对与所述待标注图片的时间戳差值小于阈值并且时间戳早于所述待标注图片的一张已标注图片上的对象框的位置数据增加空白数据,并根据所述待标注对象框在不同方向上的权重,计算所述待标注对象框在所述待标注图片上的位置数据。12.根据权利要求7所述的装置,其特征在于,所述标注模块,用于:将所述待标注对象框的位置数据输入对象检测算法中,所述对象检测算法通过训练和预测回归,筛选出存在有对象的待标注对象框的位置数据;将所述存在有对象的待标注对象框的位置数据映射到待标注图片的坐标上,以在所述待标注图片上标注所述待标注对象框。13.一种电子设备,其特征在于,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的方法。14.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-6中任一所述的方法。

百度查询: 北京京东尚科信息技术有限公司 北京京东世纪贸易有限公司 一种标注图片的方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。