CN113129362B - 一种三维坐标数据的获取方法及装置 - Google Patents
一种三维坐标数据的获取方法及装置 Download PDFInfo
- Publication number
- CN113129362B CN113129362B CN202110441111.6A CN202110441111A CN113129362B CN 113129362 B CN113129362 B CN 113129362B CN 202110441111 A CN202110441111 A CN 202110441111A CN 113129362 B CN113129362 B CN 113129362B
- Authority
- CN
- China
- Prior art keywords
- pixel
- pixel point
- semantic
- dimensional
- sampling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000005070 sampling Methods 0.000 claims abstract description 98
- 238000004590 computer program Methods 0.000 claims description 9
- 238000013506 data mapping Methods 0.000 claims description 7
- 239000003086 colorant Substances 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 12
- 230000008901 benefit Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000013507 mapping Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 244000309466 calf Species 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 230000011514 reflex Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 210000000689 upper leg Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/50—Depth or shape recovery
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2200/00—Indexing scheme for image data processing or generation, in general
- G06T2200/04—Indexing scheme for image data processing or generation, in general involving 3D image data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10028—Range image; Depth image; 3D point clouds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Generation (AREA)
Abstract
公开了一种三维坐标数据的获取方法、装置、计算机可读存储介质及电子设备,该方法包括:确定待标注图像中的至少一个第一语义区域;基于各个所述第一语义区域对应的第一事件信息,确定第二语义区域内的多个第一采样像素点以及所述第二语义区域对应的参考三维模型的至少一个纹理贴图,所述第二语义区域为所述至少一个第一语义区域中的任意一个;基于所述第二语义区域对应的第二事件信息,获取第二采样像素点,所述第二采样像素点为所述多个第一采样像素点中的任意一个;基于所述至少一个纹理贴图对应的第三事件信息,获取所述第二采样像素点对应在所述参考三维模型表面上的第一三维坐标。本公开的技术方案可获取二维图像对应的三维坐标数据。
Description
技术领域
本申请涉及图像处理技术领域,且更具体地,涉及一种三维坐标数据的获取方法及装置。
背景技术
在计算机视觉领域,对二维图像进行三维建模成为研究重点,而三维建模需要根据二维图像的三维坐标数据,这些三维坐标数据可以帮助改进和优化三维模型。因此,如何生成二维图像对应的三维坐标数据则成为亟待解决的问题。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种三维坐标数据的获取方法、装置、计算机可读存储介质及电子设备,可获取二维图像对应的三维坐标数据。
根据本申请的一个方面,提供了一种三维坐标数据的获取方法,包括:
确定待标注图像中的至少一个第一语义区域;
基于各个所述第一语义区域对应的第一事件信息,确定第二语义区域内的多个第一采样像素点以及所述第二语义区域对应的参考三维模型的至少一个纹理贴图,所述第二语义区域为所述至少一个第一语义区域中的任意一个;
基于所述第二语义区域对应的第二事件信息,获取第二采样像素点,所述第二采样像素点为所述多个第一采样像素点中的任意一个;
基于所述至少一个纹理贴图对应的第三事件信息,获取所述第二采样像素点对应在所述参考三维模型表面上的第一三维坐标。
根据本申请的第二方面,提供了一种三维坐标数据的获取装置,包括:
第一区域确定模块,用于确定待标注图像中的至少一个第一语义区域;
第二区域确定模块,用于基于各个所述第一语义区域对应的第一事件信息,确定第二语义区域内的多个第一采样像素点以及所述第二语义区域对应的参考三维模型的至少一个纹理贴图,所述第二语义区域为任意一个所述第一语义区域;
像素点确定模块,用于基于所述第二语义区域对应的第二事件信息,获取第二采样像素点,所述第二采样像素点为所述第二语义区域内的任意一个所述第一采样像素点;
坐标确定模块,用于基于所述至少一个纹理贴图对应的第三事件信息,获取所述第二采样像素点对应在所述参考三维模型表面上的第一三维坐标。
根据本申请的第三方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述的三维坐标数据的获取方法。
根据本申请的第四方面,提供了一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述的三维坐标数据的获取方法。
本申请提供的一种三维坐标数据的获取方法、装置、计算机可读存储介质及电子设备,通过二维图像中的语义区域对应的若干个纹理贴图,实现了二维图像对应的三维坐标数据的获取,从而建立从二维图像到三维模型的密集对应关系,解决二维图像与三维模型之间的关联问题。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1是本申请一示例性实施例所适用的待标注图像以及第二语义区域的场景图。
图2A是图1中第二语义区域对应的后视纹理贴图的场景图。
图2B是图1中第二语义区域对应的前视纹理贴图的场景图。
图2C是图1中第二语义区域对应的右视纹理贴图的场景图。
图2D是图1中第二语义区域对应的左视纹理贴图的场景图。
图2E是图1中第二语义区域对应的俯视纹理贴图的场景图。
图3是本申请一示例性实施例提供的三维坐标数据的获取方法的流程示意图。
图4是本申请一示例性实施例提供的三维坐标数据的获取方法中步骤32的流程示意图。
图5是本申请一示例性实施例提供的三维坐标数据的获取方法中步骤34的流程示意图。
图6是本申请一示例性实施例提供的三维坐标数据的获取方法中步骤341的流程示意图。
图7是本申请一示例性实施例提供的三维坐标数据的获取装置的结构示意图一。
图8是本申请一示例性实施例提供的三维坐标数据的获取装置的结构示意图二。
图9是本申请一示例性实施例提供的三维坐标数据的获取装置的结构示意图二中第三坐标确定单元741的结构示意图。
图10是本申请一示例性实施例提供的电子设备的结构图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
申请概述
在计算机视觉领域,对二维图像进行三维建模成为研究重点,而三维建模需要根据准确的三维坐标数据,这些三维坐标数据可以帮助改进和优化三维模型。因此,如何生成二维图像对应的三维坐标数据则成为亟待解决的问题。
本公开则通过考虑二维图像中的语义区域对应的纹理贴图,实现了二维图像对应的三维坐标数据的获取,从而建立二维图像和三维模型的密集对应关系,进而解决二维图像与三维模型之间的关联问题。
示例性方法
图3是本申请一示例性实施例提供的三维坐标数据的获取方法的流程示意图。
本实施例可应用在电子设备上,具体可以应用于各种个人计算机或服务器。如图3所示,本申请一示例性实施例提供的三维坐标数据的获取方法至少包括如下步骤:
步骤31,确定待标注图像中的至少一个第一语义区域。
在一实施例中,待标注图像可以理解为二维图像,二维图像中包含二维目标对象。其中,二维目标对象可以是人物、建筑物或风景等,此处不做限定,对应的,待标注图像可以是人物图像、建筑物图像或风景图等,具体可以结合实际场景确定,优选人物图像。这里,待标注图像包括若干个第一语义区域,这里,可以通过图像处理软件工具得到待标注图像,在一个示例中,待标注图像如图1所示。
在一实施例中,第一语义区域可以理解为三维目标对象对应的二维区域,这里,三维目标对象可以是二维目标对象的部分,同时,第一语义区域可以是不同角度的三维目标对象,在一个示例中,二维目标对象为女人,则三维目标对象可以是女性脸部,此时,第一语义区域可以是女性侧脸或正脸等。为了区分若干个第一语义区域的不同语义,第一语义区域携带语义标签,语义标签用于说明第一语义区域对应的三维目标对象。此处对第一语义区域的数量不做限定,同时,考虑到二维图像指示了不同视角下的三维目标对象的投影,因此,若干个第一语义区域通常对应二维目标对象的若干个部分,具体需要结合实际场景确定。在一个示例中,二维目标对象为人物,则若干个第一语义区域包括人脸区域、手区域、脚区域、胳膊区域、大腿区域、小腿区域、后背区域、前胸区域等。
步骤32,基于各个所述第一语义区域对应的第一事件信息,确定第二语义区域内的多个第一采样像素点以及所述第二语义区域对应的参考三维模型的至少一个纹理贴图,所述第二语义区域为所述至少一个第一语义区域中的任意一个。
在一实施例中,第一事件信息可以理解为外部输入信息,具体指的是外部输入设备在某一第一语义区域内的点击位置,这里的外部输入设备可以是鼠标。
在一实施例中,第二语义区域为任意一个第一语义区域,即从若干个第一语义区域中选择一个作为第二语义区域。
在一实施例中,第二语义区域内的多个第一采样像素点可以理解为从第二语义区域内的多个像素点中选择出的关键点,关键点可以理解为构建第二语义区域对应的三维目标对象的表面点的投影点。多个第一采样像素点均位于第二语义区域内,本申请实施例未对第一采样像素点的数量进行任何限定,具体需要结合实际场景确定,比如,利用现有技术中的人体实时姿势识别系统(DensePose)生成人体三维模型时,则需要336个关键点(24个部位,每个部位14个点),这里的关键点即为第一采样像素点。
在一实施例中,参考三维模型可以理解为第二语义区域对应的三维目标对象的凸多边形表示,即由大量凸多边形组成的一个物体,上述凸多边形可以为三角形或四边形,通常为四边形,其中,凸多边形具体指的是没有一个内角是优角(大于180度小于360度的角)的多边形。
在一实施例中,纹理贴图可以理解为视角纹理贴图,视角纹理贴图可以理解为以某一视角将参考三维模型投影到二维纹理坐标后,将参考三维模型对应的贴图填充到对应的纹理坐标域后得到的二维色彩图像。其中,贴图可以理解为参考三维模型的表面色彩图像。二维纹理坐标系可表示像素点的纹理坐标,纹理坐标域可以理解为四个纹理坐标形成的坐标区域,其中,纹理坐标一般以字母表示为(u,v),也称为实际纹理坐标,其中,u表示水平方向,即纹理的宽度,v表示垂直方向,即纹理的高度。
在一实施例中,参考三维模型基于第二语义区域携带的语义标签确定,相同语义标签对应相同参考三维模型,从而节约电子设备的内存,提高数据处理效率。
在一实施例中,若干个纹理贴图包括参考三维模型的左视纹理贴图、右视纹理贴图、前视纹理贴图、后视纹理贴图、俯视纹理贴图及仰视纹理贴图中的任意一项或多项,其中,前视纹理贴图可以理解为从前方将参考三维模型投影到二维纹理坐标系后,将参考三维模型对应的贴图填充到对应的纹理坐标域后得到的色彩图像,其他纹理贴图类似,这里不做过多说明。举例来说,语义标签为男性头部,则参考三维模型为男性头部,若干个纹理贴图可以是男性头部的左视纹理贴图、右视纹理贴图、前视纹理贴图、后视纹理贴图、俯视纹理贴图,具体可以参考图2A至图2E。
在一实施例中,第二语义区域为放大图,从而便于观察第二语义区域。这里,可以通过显示颜色、编号等方式区分不同的第一采样像素点,即第一采样像素点的显示颜色不同,或者,第一采样采样点的编号不同,应当理解的,区分不同第一采样像素点的方式不限于上述显示颜色以及编号的方式。
举例来说,请参考图1,待标注图像为人物背面图像,待标注图像中的区域1和区域2均表示第一语义区域,通过鼠标在区域1内的任意位置进行点击,即可得到第二语义区域,由A、B、C、D、E、F、G、H、I、J、K、L、M、N、O、P表示的16个第一采样像素点,以及图2A示出的后视纹理视图、图2B示出的前视纹理视图、图2C示出的右视纹理视图、图2D示出的左视纹理视图以及图2E示出的俯视纹理视图,这里,第二语义区域为放大后的区域1,上述16个字母是为了区分不同的第一采样像素点的一种表现方式,也可以利用数字编号区分,也可以利用显示颜色不同区分,本申请实施例对第一采样像素点的区分方法不做任何限定。
步骤33,基于所述第二语义区域对应的第二事件信息,获取第二采样像素点,所述第二采样像素点为所述多个第一采样像素点中的任意一个。
在一实施例中,第二事件信息可以理解为外部输入信息,具体指的是外部输入设备在第二语义区域内的点击位置,点击位置可以理解为选择的第一采样像素点的屏幕位置,这里,外部输入设备可以是鼠标。
在一实施例中,第二采样像素点为任意一个第一采样像素点,即从若干个第一采样像素点中选择任意一个作为第二采样像素点。请参考图1,第一采样像素点J处于被选中的状态,则J为第二采样像素点。
步骤34,基于所述至少一个纹理贴图对应的第三事件信息,获取所述第二采样像素点对应在所述参考三维模型表面上的第一三维坐标。
在一实施例中,第三事件信息可以理解为外部输入信息,具体指的是外部输入设备在纹理贴图上的点击位置,这里,外部输入设备可以是鼠标。
基于对纹理贴图的操作,从而获取待标注图像对应的第一三维坐标,进而建立二维图像和参考三维模型之间的密集对应关系。其中,第一三维坐标可以理解为三维纹理坐标,三维纹理坐标一般以字母表示为(u,v,w)表示,w表示竖直方向,即纹理的深度。密集对应关系可以理解为二维图像中的像素点和三维模型的表面点之间的对应关系,具体指的是待标注图像中语义区域内的像素点和参考三维模型的表面点之间的对应关系。之后,即可利用确定出的语义区域的多个三维坐标进行语义区域的三维建模。
本实施例通过语义区域内的多个采样像素点以及对应的参考三维模型的若干个纹理贴图,对于任意一个被选择的采样像素点,基于若干个纹理贴图的事件信息,确定出采样像素点的三维坐标,从而建立从二维图像到三维模型的密集对应关系,基于该对应关系即可确定语义区域内的像素点在三维模型上的位置,实现二维图像和三维模型之间的关联,进而解决二维图像与三维模型之间的关联问题。
图4示出了如图3所示的实施例中确定第二语义区域内的多个第一采样像素点步骤的流程示意图。
如图4所示,在上述图3所示实施例的基础上,本申请一个示例性实施例中,步骤32所示确定第二语义区域内的多个第一采样像素点步骤,具体可以包括如下步骤:
步骤321,获取第二语义区域的闭合线上的多个像素点分别对应的第二像素坐标。
在一实施例中,第二语义区域可以理解为由闭合曲线组成的区域,闭合线由多个像素点之间的连线形成。
在一实施例中,闭合线上的多个像素点可以理解为组成闭合线的全部像素点,从而确保多个像素点分别对应的第二像素坐标能够较为准确的反映出第二语义区域的位置。
在一个示例中,请参考图1,第二语义区域由闭合线形成,闭合线由至少由7个像素点之间的连线形成,图1中并没有示出闭合线上的像素点,但是可以从线段和线段之间的交点推断出像素点的数量最少为7个。这里,像素点的第二像素坐标可以理解为像素点在待标注图像中的位置。
步骤322,基于所述闭合线上的多个像素点分别对应的第二像素坐标,确定所述闭合线内的多个第三像素坐标。
具体地,确定了闭合线上的多个像素点分别对应的第二像素坐标,即确定了二维坐标空间,在二维坐标空间内进行坐标点采样,采样方式不限,从而确定出多个第三像素坐标。在一个示例中,图1中第二语义区域内的16个第一采样像素点分别对应在待标注图像中的像素坐标即为第三像素坐标。
步骤323,基于所述多个第三像素坐标,确定多个第一采样像素点。
每个第三像素坐标对应的像素点即为第一采样像素点,第一采样像素点均在闭合线内。在一个示例中,第一采样像素点均匀分布在第二语义区域内。
该实施例中通过闭合线上的多个像素点的像素坐标,对闭合线内的多个像素点进行采样,从而确定出多个第一采样像素点,进而得到用于三维建模的关键点,通过采样像素点实现对语义区域的表征,无需确定语义区域中每个像素点在三维模型上的位置,以快速建立语义区域和三维模型之间的关联。
图5示出了如图3所示的实施例中基于所述至少一个纹理贴图对应的第三事件信息,获取所述第二采样像素点对应在所述参考三维模型表面上的第一三维坐标步骤的流程示意图。
如图5所示,在上述图3所示实施例的基础上,本申请一个示例性实施例中,步骤34所示基于所述至少一个纹理贴图对应的第三事件信息,获取所述第二采样像素点对应在所述参考三维模型表面上的第一三维坐标步骤,具体可以包括如下步骤:
步骤341,基于所述至少一个纹理贴图对应的第三事件信息,获取所述第二采样像素点对应的至少一个目标像素点的第一像素坐标,每个所述目标像素点所在的所述纹理贴图不同。
在一实施例中,目标像素点可以理解为第二采样像素点对应在纹理贴图上的像素点,一个目标像素点在一个纹理贴图上,不同目标像素点在不同的纹理贴图上。这里,目标像素点的第一像素坐标可以理解为目标像素点在纹理贴图上的二维纹理坐标。
具体地,通过观察第二采样像素点和若干个纹理贴图,确定出第二采样像素点所在的一个或多个纹理贴图,并在这些纹理贴图上进行点击操作,得到第二采样像素点对应的若干个像素点,如果像素点位置不合适,则可对这些像素点进行移动,将移动后的像素点确定为目标像素点,从而确定出若干个目标像素点,这里,若干个目标像素点对应在参考三维模型上的表面点可能不同。
步骤342,基于所述至少一个目标像素点的第一像素坐标以及所述至少一个纹理贴图中的像素点和所述参考三维模型的表面点之间的预设数据映射关系,确定所述至少一个目标像素点在所述参考三维模型表面上的第二三维坐标。
在一实施例中,预设数据映射关系可以理解为纹理贴图中的像素点和参考三维模型的表面点之间的映射关系,即参考三维模型的每个表面点的三维纹理坐标和纹理贴图中的二维纹理坐标一一对应,从而标明参考三维模型中每个表面点在纹理贴图中的位置,举例来说,当待标注图像为人物图像时,预设数据映射关系可以是现有技术中开源的DensePose-COCO(大型的对照标准数据集,可将RGB图像中的所有人类像素映射到人体的三维表面,这里的RGB图像可以理解为纹理贴图)。
在一实施例中,参考三维模型的表面点可以理解为参考三维模型上的凸多边形的顶点。
具体地,遍历预设数据映射关系中的二维纹理坐标和三维纹理坐标的对应关系,从而得到多个目标像素点在参考三维模型上的顶点的第二三维坐标。
在一些可行的实现方式中,确定多个目标像素点分别对应在参考三维模型上的顶点的三维坐标,对这些三维坐标对应在参考三维模型的表面区域内表面点进行采样,比如可以选择中心点,从而确定出第二三维坐标。
步骤343,将所述第二三维坐标作为所述第二采样像素点的第一三维坐标。
本实施例通过若干个纹理贴图的事件信息,从而确定出采样像素点对应的若干个目标像素点分别对应的像素坐标,基于若干个目标像素点分别对应的像素坐标以及二维纹理坐标和三维纹理坐标的预设数据映射关系,确定出采样像素点的三维坐标,从而建立从二维图像到三维模型的密集对应关系,基于该密集对应关系确定语义区域中的像素点在三维模型上的位置,实现语义区域和三维模型之间的关联。
图6示出了如图5所示的实施例中基于所述至少一个纹理贴图对应的第三事件信息,获取所述第二采样像素点对应的至少一个目标像素点的第一像素坐标步骤的流程示意图。
如图6所示,在上述图5所示实施例的基础上,本申请一个示例性实施例中,步骤341所示基于所述至少一个纹理贴图对应的第三事件信息,获取所述第二采样像素点对应的至少一个目标像素点的第一像素坐标步骤,具体可以包括如下步骤:
步骤3411,基于所述至少一个纹理贴图对应的第三事件信息,确定至少两个候选像素点,所述至少两个候选像素点分别对应在所述参考三维模型上的表面点相同,每个所述候选像素点所在的所述纹理贴图不同。
具体地,参考三维模型的表面点可能和不同的纹理贴图存在对应关系,这里,若干个候选像素点分别对应在参考三维模型上的表面点相同,每个候选像素点所在的纹理贴图不同,从而能够更为准确的确定出第二采样像素点对应的目标像素点。举例来说,图1中的第一采样像素点A对应的目标像素点或候选像素点为图2A中的像素点A,即第一采样像素点和其对应的目标像素点或候选像素点的字母相同,这里,图2A示出了图1中第一采样像素点A、B、C、D、E、F、G、H、I、J分别对应的目标像素点或候选像素点,假设在图2A中G对应的像素点位置进行鼠标点击操作,则可确定出的候选像素点有三个,分别是图2A中的候选像素点G、图2D中的候选像素点G以及图2E中的候选像素点G。
具体地,通过观察第二语义区域和若干个纹理贴图,确定出和第二语义区域最接近的纹理贴图,并在该纹理贴图上进行鼠标点击操作,鼠标点击的位置即为候选像素点所在的位置,同时在其他纹理贴图上显示出和候选像素点对应在参考三维模型上的表面点相同的其他候选像素点。
步骤3412,基于所述至少两个候选像素点对应的第四事件信息,获取至少一个目标像素点的第一像素坐标,两个或多个所述目标像素点对应在所述参考三维模型上的表面点相同。
在一实施例中,第四事件信息可以理解为外部输入信息,具体指的是外部输入设备对候选像素点进行移动后的位置信息,外部输入设备为键盘,具体地,利用键盘上的上下左右键进行候选像素点的移动,一次移动一个像素,从而更为准确的确定出第二采样像素点对应的若干个目标像素点。
在一实施例中,两个或多个目标像素点对应在参考三维模型上的表面点相同,从而可更为准确的反映出采样像素点对应在参考三维模型上的表面点的位置。
在一实施例中,候选像素点、目标像素点以及第二采样像素点的显示颜色相同,从而降低误操作的可能性。举例来说,在一个示例中,图1中第二语义区域内的第一采样像素点J,图2A中目标像素点J、图2D中目标像素点J以及图2E中目标像素点J的显示颜色相同。
需要说明的是,在对候选像素点进行移动的过程中,考虑到候选像素点的位置发生了变化,可能会使得候选像素点在参考三维模型上的表面点发生变化,从而可能使得候选像素点的数量发生改变,因此,候选像素点的数量和目标像素点的数量可能相同也可能不同。举例来说,当移动了图2A中的候选像素点G所在位置,假设移动后的候选像素点G对应在参考三维模型的表面点仅仅对应在图2A中,则图2D中的候选像素点G以及图2E中的候选像素点G均消失。
本实施例通过对采样像素点对应在纹理贴图上的多个候选像素点的移动操作,从而确定出更为准确的采样像素点对应在纹理贴图上的若干个目标像素点的第一像素坐标,基于第一像素坐标可更为准确的确定语义区域中的像素点在三维模型上的位置,从而可较为准确的建立语义区域中的像素点与三维模型之间的关联。
示例性装置
根据与本申请方法实施例相同的构思,本申请实施例还提供了三维坐标数据的获取装置。
图7示出了本申请一示例性实施例提供的三维坐标数据的获取装置的结构示意图一。
如图7所示,本申请一示例性实施例提供的三维坐标数据的获取装置,包括:
第一区域确定模块71,用于确定待标注图像中的至少一个第一语义区域;
第二区域确定模块72,用于基于各个所述第一语义区域对应的第一事件信息,确定第二语义区域内的多个第一采样像素点以及所述第二语义区域对应的参考三维模型的至少一个纹理贴图,所述第二语义区域为任意一个所述第一语义区域;
像素点确定模块73,用于基于所述第二语义区域对应的第二事件信息,获取第二采样像素点,所述第二采样像素点为所述第二语义区域内的任意一个所述第一采样像素点;
坐标确定模块74,用于基于所述至少一个纹理贴图对应的第三事件信息,获取所述第二采样像素点对应在所述参考三维模型表面上的第一三维坐标。
图8是本申请一示例性实施例提供的三维坐标数据的获取装置的结构示意图二。
如图8所示,在一个示例性实施例中,所述第二区域确定模块72包括:
第一坐标确定单元721,用于获取第二语义区域的闭合线上的多个像素点分别对应的第二像素坐标;
第二坐标确定单元722,用于基于所述闭合线上的多个像素点分别对应的第二像素坐标,确定所述闭合线内的多个第三像素坐标;
像素点确定单元723,用于基于所述多个第三像素坐标,确定多个第一采样像素点。
如图8所示,在一个示例性实施例中,所述坐标确定模块74包括:
第三坐标确定单元741,用于基于所述至少一个纹理贴图对应的第三事件信息,获取所述第二采样像素点对应的至少一个目标像素点的第一像素坐标,每个所述目标像素点所在的所述纹理贴图不同;
第四坐标确定单元742,用于基于所述至少一个目标像素点的第一像素坐标以及所述至少一个纹理贴图中的像素点和所述参考三维模型的表面点之间的预设数据映射关系,确定所述至少一个目标像素点在所述参考三维模型表面上的第二三维坐标;
第五坐标确定单元743,用于将所述第二三维坐标作为所述第二采样像素点的第一三维坐标。
图9是本申请一示例性实施例提供的三维坐标数据的获取装置的结构示意图二中第三坐标确定单元741的结构示意图。
如图9所示,在一个示例性实施例中,所述第三坐标确定单元741包括:
像素点确定子单元7411,用于基于所述至少一个纹理贴图对应的第三事件信息,确定至少两个候选像素点,所述至少两个候选像素点分别对应在所述参考三维模型上的表面点相同,每个所述候选像素点所在的所述纹理贴图不同;
坐标确定子单元7412,用于基于所述至少两个候选像素点对应的第四事件信息,获取至少一个目标像素点的第一像素坐标,两个或多个所述目标像素点对应在所述参考三维模型上的表面点相同。
示例性电子设备
图10图示了根据本申请实施例的电子设备的框图。
如图10所示,电子设备100包括一个或多个处理器101和存储器102。
处理器101可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备100中的其他组件以执行期望的功能。
存储器102可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器101可以运行所述程序指令,以实现上文所述的本申请的各个实施例的三维坐标数据的获取方法以及/或者其他期望的功能。
在一个示例中,电子设备100还可以包括:输入装置103和输出装置104,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
当然,为了简化,图10中仅示出了该电子设备100中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备100还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的三维坐标数据的获取方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的三维坐标数据的获取方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
Claims (9)
1.一种三维坐标数据的获取方法,包括:
确定待标注图像中的至少一个第一语义区域;
基于各个所述第一语义区域对应的第一事件信息,确定第二语义区域内的多个第一采样像素点以及所述第二语义区域对应的参考三维模型的至少一个纹理贴图,所述第二语义区域为所述至少一个第一语义区域中的任意一个;
基于所述第二语义区域对应的第二事件信息,获取第二采样像素点,所述第二采样像素点为所述多个第一采样像素点中的任意一个;
基于所述至少一个纹理贴图对应的第三事件信息,获取所述第二采样像素点对应在所述参考三维模型表面上的第一三维坐标;
其中,所述确定第二语义区域内的多个第一采样像素点,包括:
获取第二语义区域的闭合线上的多个像素点分别对应的第二像素坐标;
基于所述闭合线上的多个像素点分别对应的第二像素坐标,确定所述闭合线内的多个第三像素坐标;
基于所述多个第三像素坐标,确定多个第一采样像素点。
2.根据权利要求1所述的方法,其中,所述基于所述至少一个纹理贴图对应的第三事件信息,获取所述第二采样像素点对应在所述参考三维模型表面上的第一三维坐标,包括:
基于所述至少一个纹理贴图对应的第三事件信息,获取所述第二采样像素点对应的至少一个目标像素点的第一像素坐标,每个所述目标像素点所在的所述纹理贴图不同;
基于所述至少一个目标像素点的第一像素坐标以及所述至少一个纹理贴图中的像素点和所述参考三维模型的表面点之间的预设数据映射关系,确定所述至少一个目标像素点在所述参考三维模型表面上的第二三维坐标;
将所述第二三维坐标作为所述第二采样像素点的第一三维坐标。
3.根据权利要求2所述的方法,其中,所述基于所述至少一个纹理贴图对应的第三事件信息,获取所述第二采样像素点对应的至少一个目标像素点的第一像素坐标,包括:
基于所述至少一个纹理贴图对应的第三事件信息,确定至少两个候选像素点,所述至少两个候选像素点分别对应在所述参考三维模型上的表面点相同,每个所述候选像素点所在的所述纹理贴图不同;
基于所述至少两个候选像素点对应的第四事件信息,获取至少一个目标像素点的第一像素坐标,两个或多个所述目标像素点对应在所述参考三维模型上的表面点相同。
4.根据权利要求3所述的方法,其中,所述候选像素点、所述目标像素点和所述第二采样像素点的显示颜色相同。
5.根据权利要求1所述的方法,其中,所述第一采样像素点均匀分布在所述第二语义区域内;
所述第二语义区域内的多个所述第一采样像素点分别对应的显示颜色不同。
6.根据权利要求1至5中任一所述的方法,其中,所述第二语义区域为放大图;
所述至少一个纹理贴图包括所述参考三维模型的左视纹理贴图、右视纹理贴图、前视纹理贴图、后视纹理贴图、俯视纹理贴图及仰视纹理贴图中的任意一项或多项;
所述参考三维模型基于所述第二语义区域携带的语义标签确定,相同语义标签对应相同参考三维模型。
7.一种训练数据获取装置,包括:
第一区域确定模块,用于确定待标注图像中的至少一个第一语义区域;
第二区域确定模块,用于基于各个所述第一语义区域对应的第一事件信息,确定第二语义区域内的多个第一采样像素点以及所述第二语义区域对应的参考三维模型的至少一个纹理贴图,所述第二语义区域为任意一个所述第一语义区域;
像素点确定模块,用于基于所述第二语义区域对应的第二事件信息,获取第二采样像素点,所述第二采样像素点为所述第二语义区域内的任意一个所述第一采样像素点;
坐标确定模块,用于基于所述至少一个纹理贴图对应的第三事件信息,获取所述第二采样像素点对应在所述参考三维模型表面上的第一三维坐标;
所述第二区域确定模块包括:第一坐标确定单元、第二坐标确定单元和像素点确定单元;
所述第一坐标确定单元用于:获取第二语义区域的闭合线上的多个像素点分别对应的第二像素坐标;
所述第二坐标确定单元用于:基于所述闭合线上的多个像素点分别对应的第二像素坐标,确定所述闭合线内的多个第三像素坐标;
所述像素点确定单元用于:基于所述多个第三像素坐标,确定多个第一采样像素点。
8.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于被处理器执行以实现上述权利要求1-6任一所述的三维坐标数据的获取方法。
9.一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-6任一所述的三维坐标数据的获取方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110441111.6A CN113129362B (zh) | 2021-04-23 | 2021-04-23 | 一种三维坐标数据的获取方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110441111.6A CN113129362B (zh) | 2021-04-23 | 2021-04-23 | 一种三维坐标数据的获取方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113129362A CN113129362A (zh) | 2021-07-16 |
CN113129362B true CN113129362B (zh) | 2024-05-10 |
Family
ID=76779267
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110441111.6A Active CN113129362B (zh) | 2021-04-23 | 2021-04-23 | 一种三维坐标数据的获取方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113129362B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114827711B (zh) * | 2022-06-24 | 2022-09-20 | 如你所视(北京)科技有限公司 | 图像信息显示方法和装置 |
CN115049532B (zh) * | 2022-08-15 | 2022-11-22 | 南京砺算科技有限公司 | 图形处理器、纹理坐标采样方法、编译方法及装置、介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101452582A (zh) * | 2008-12-18 | 2009-06-10 | 北京中星微电子有限公司 | 一种实现三维视频特效的方法和装置 |
CN109767487A (zh) * | 2019-01-04 | 2019-05-17 | 北京达佳互联信息技术有限公司 | 人脸三维重建方法、装置、电子设备及存储介质 |
CN112132739A (zh) * | 2019-06-24 | 2020-12-25 | 北京眼神智能科技有限公司 | 3d重建以及人脸姿态归一化方法、装置、存储介质及设备 |
CN112287820A (zh) * | 2020-10-28 | 2021-01-29 | 广州虎牙科技有限公司 | 人脸检测神经网络及训练方法、人脸检测方法、存储介质 |
-
2021
- 2021-04-23 CN CN202110441111.6A patent/CN113129362B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101452582A (zh) * | 2008-12-18 | 2009-06-10 | 北京中星微电子有限公司 | 一种实现三维视频特效的方法和装置 |
CN109767487A (zh) * | 2019-01-04 | 2019-05-17 | 北京达佳互联信息技术有限公司 | 人脸三维重建方法、装置、电子设备及存储介质 |
CN112132739A (zh) * | 2019-06-24 | 2020-12-25 | 北京眼神智能科技有限公司 | 3d重建以及人脸姿态归一化方法、装置、存储介质及设备 |
CN112287820A (zh) * | 2020-10-28 | 2021-01-29 | 广州虎牙科技有限公司 | 人脸检测神经网络及训练方法、人脸检测方法、存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113129362A (zh) | 2021-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6333749B1 (en) | Method and apparatus for image assisted modeling of three-dimensional scenes | |
JP7337104B2 (ja) | 拡張現実によるモデル動画多平面インタラクション方法、装置、デバイス及び記憶媒体 | |
US7193633B1 (en) | Method and apparatus for image assisted modeling of three-dimensional scenes | |
US9495802B2 (en) | Position identification method and system | |
CA2040273C (en) | Image displaying system | |
CN110956695B (zh) | 信息处理装置、信息处理方法和存储介质 | |
US8793108B2 (en) | Three-dimensional model determination from two-dimensional sketch with two-dimensional refinement | |
CN113129362B (zh) | 一种三维坐标数据的获取方法及装置 | |
US11989900B2 (en) | Object recognition neural network for amodal center prediction | |
CN112766027A (zh) | 图像处理方法、装置、设备及存储介质 | |
US9892485B2 (en) | System and method for mesh distance based geometry deformation | |
CN110428504B (zh) | 文本图像合成方法、装置、计算机设备和存储介质 | |
EP4086853A2 (en) | Method and apparatus for generating object model, electronic device and storage medium | |
US11074747B2 (en) | Computer-aided techniques for designing detailed three-dimensional objects | |
JP2023527438A (ja) | リアルタイム深度マップを用いたジオメトリ認識拡張現実効果 | |
CN114820980A (zh) | 三维重建方法、装置、电子设备和可读存储介质 | |
US9734616B1 (en) | Tetrahedral volumes from segmented bounding boxes of a subdivision | |
JP2021039563A (ja) | 教師データとしてのデプス画像にラベルを付与するプログラム、装置及び方法 | |
CN116647657A (zh) | 响应式视频画布生成 | |
JP6564259B2 (ja) | 画像処理装置、画像処理方法 | |
US20220284667A1 (en) | Image processing method and image processing device for generating 3d content by means of 2d images | |
EP3779878A1 (en) | Method and device for combining a texture with an artificial object | |
KR20210023663A (ko) | 2d 이미지를 활용하여 3d 컨텐츠를 생성하는 영상 처리 방법 및 영상 처리 장치 | |
JP7584262B2 (ja) | 3dシーンにおける3dオブジェクトの位置決めを支援するためのコンピュータで実施される方法 | |
CN117456550B (zh) | 基于mr的cad文件查看方法、装置、介质和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |