CN113934297A - 一种基于增强现实的交互方法、装置、电子设备及介质 - Google Patents
一种基于增强现实的交互方法、装置、电子设备及介质 Download PDFInfo
- Publication number
- CN113934297A CN113934297A CN202111193452.2A CN202111193452A CN113934297A CN 113934297 A CN113934297 A CN 113934297A CN 202111193452 A CN202111193452 A CN 202111193452A CN 113934297 A CN113934297 A CN 113934297A
- Authority
- CN
- China
- Prior art keywords
- recognized
- image
- dimensional model
- target
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000003993 interaction Effects 0.000 title claims abstract description 43
- 238000000034 method Methods 0.000 title claims abstract description 37
- 230000003190 augmentative effect Effects 0.000 title claims abstract description 30
- 239000007787 solid Substances 0.000 claims abstract description 25
- 238000000605 extraction Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 230000008447 perception Effects 0.000 abstract description 4
- 238000003062 neural network model Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000002452 interceptive effect Effects 0.000 description 3
- NIXOWILDQLNWCW-UHFFFAOYSA-N acrylic acid group Chemical group C(C=C)(=O)O NIXOWILDQLNWCW-UHFFFAOYSA-N 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 241000086550 Dinosauria Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- -1 magnet Substances 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T19/00—Manipulating 3D models or images for computer graphics
- G06T19/006—Mixed reality
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Computer Graphics (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Processing Or Creating Images (AREA)
Abstract
本发明实施例公开了一种基于增强现实的交互方法、装置、电子设备及介质。其中,该方法包括:通过终端上的图像采集设备从几何实体的任一平面上获取待识别图像,基于预先训练的物体识别模型,确定所述待识别图像上的待识别物体;根据预设的物体与三维模型的关联关系,确定所述待识别物体的目标三维模型;将所述目标三维模型作为虚拟形象显示在终端屏幕中的待识别物体位置处。实现通过几何实体进行增强现实技术的模型展示,让用户通过实体感知进行与虚拟物体的交互,确保虚拟的三维模型与几何实体上的图片相互对应,提高模型展示精度,提升用户体验。
Description
技术领域
本发明实施例涉及增强现实技术,尤其涉及一种基于增强现实的交互方法、装置、电子设备及介质。
背景技术
增强现实(AR,Augmented Reality)技术是一种利用计算机仿真信息增加用户对现实世界感知的技术。它将计算机生成的模拟三维模型、场景和系统信息叠加在真实场景中,通过多元信息融合,使用户对现实世界的感知得以增强。
当前的增强现实技术中,在生成虚拟物体的形象时,难以快速查找出正确的虚拟物体形象,虚拟物体的展示精度和效率较低,且用户与虚拟物体的交互依赖于用户在触摸屏上的操作,影响用户的AR体验。
发明内容
本发明实施例提供一种基于增强现实的交互方法、装置、电子设备及介质,以提高AR技术的交互效率,提升用户的AR交互体验。
第一方面,本发明实施例提供了一种基于增强现实的交互方法,该方法包括:
通过终端上的图像采集设备从几何实体的任一平面上获取待识别图像,基于预先训练的物体识别模型,确定所述待识别图像上的待识别物体;
根据预设的物体与三维模型的关联关系,确定所述待识别物体的目标三维模型;
将所述目标三维模型作为虚拟形象显示在终端屏幕中的待识别物体位置处。
第二方面,本发明实施例还提供了一种基于增强现实的交互装置,该装置包括:
物体确定模块,用于通过终端上的图像采集设备从几何实体的任一平面上获取待识别图像,基于预先训练的物体识别模型,确定所述待识别图像上的待识别物体;
模型确定模块,用于根据预设的物体与三维模型的关联关系,确定所述待识别物体的目标三维模型;
模型展示模块,用于将所述目标三维模型作为虚拟形象显示在终端屏幕中的待识别图像物体处。
第三方面,本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明任意实施例所述的基于增强现实的交互方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本发明任意实施例所述的基于增强现实的交互方法。
本发明实施例通过终端上安装的图像采集设备对几何实体上的图片进行采集,得到待识别图像。根据预先训练的神经网络模型对待识别图像进行特征提取,确定待识别物体。根据预先存储的物体与三维模型的关联关系,确定目标三维模型。将目标三维模型进行展示,目标三维模型是AR的虚拟形象,且展示位置与屏幕中待识别物体的位置一致。通过预设的神经网络模型解决了现有技术中目标三维模型查找不及时和不精确的问题,提高AR交互的效率和精度。用户可以通过几何实体与虚拟物体进行交互,调整虚拟的目标三维模型的展示位置,提升用户的交互体验。
附图说明
图1是本发明实施例一中的一种基于增强现实的交互方法的流程示意图;
图2是本发明实施例二中的一种基于增强现实的交互方法的流程示意图;
图3是本发明实施例三中的一种基于增强现实的交互装置的结构框图;
图4是本发明实施例四中的一种基于增强现实的交互设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一所提供的一种基于增强现实的交互方法的流程示意图,本实施例可适用于通过AR技术与虚拟物体进行交互的情况,该方法可以由一种基于增强现实的交互装置来执行。如图1所示,该方法具体包括如下步骤:
步骤110、通过终端上的图像采集设备从几何实体的任一平面上获取待识别图像,基于预先训练的物体识别模型,确定待识别图像上的待识别物体。
其中,终端可以是手机或电脑等移动终端,终端上安装有图像采集设备,例如,可以安装摄像头。几何实体可以是由平面组成的几何结构,例如,可以是四面体或方块等,几何实体的每一个平面上都可以设置有一张待识别物体的图片,各平面图片中的待识别物体可以不同。例如,图片中的待识别物体可以是动物、植物、桌子或椅子等。本实施例中,对几何实体的材质不进行具体限定,例如,几何实体的材质可以是木头、磁铁、塑料或亚克力等,几何实体可以是实心或空心。对含有待识别物体的图片的材质不进行具体限定,例如,图片的材质可以是纸质、磁铁、塑料或亚克力等,图片可以粘贴或印刷在平面上,也可以通过插卡或磁吸设置在平面上。
终端上的图像采集设备可以对外界环境进行拍摄或扫描,用户可以手持几何实体,将几何实体任一平面上的图片朝向终端,图像采集设备采集平面上的图片,得到待识别图像。待识别图像中可以包括几何实体平面中的图片和几何实体所在的环境,几何实体与终端之间的角度不同,待识别图像的内容不同。用户可以手持几何实体和终端进行对准,使几何实体平面上的图片在待识别图像中所占范围较大,有利于对图片上待识别物体的识别。在获取到待识别图像后,将待识别图像输入至预先训练的物体识别模型中,确定待识别图像上的待识别物体。物体识别模型可以是神经网络模型,用于识别图像中的物体。例如,将一张小狗的图片输入至物体识别模型,输出得到图片中的内容为小狗。
本实施例中,可选的,基于预先训练的物体识别模型,确定待识别图像上的待识别物体,包括:根据预先训练的物体识别模型,对待识别图像进行待识别物体特征的提取;根据待识别物体特征,输出待识别图像上的待识别物体的类别。
具体的,物体识别模型可以是预先训练的神经网络模型,在训练物体识别模型时,可以预先采集多张待训练图片作为图片集,对于每一种物体,都可以采集多种角度下的图片。将待训练图片输入至构建的物体识别模型中,通过卷积和池化等特征提取过程,确定待训练图片中的物体特征。根据物体特征,输出物体的类别概率,选择概率大的类别为图片中的物体类别。将输出得到的物体类别与预先确定的正确的物体类别进行比较,确定输出结果是否正确。若正确,则模型训练完成;若不正确,则根据预设的损失函数继续进行训练,直至训练完成。在物体识别模型训练完成后,将待识别图像输入至物体识别模型中,对待识别图像中的待识别物体进行特征提取,得到待识别物体特征,待识别物体是几何实体平面的图片中的物体。根据待识别物体特征,确定待识别物体属于各个物体类别的概率,将概率最大的类别作为待识别物体的类别,即确定待识别物体。这样设置的有益效果在于,预先训练神经网络模型,可以对待识别物体进行特征提取,不限制终端对几何实体平面上的图片的扫描角度,只要能识别到图片上的物体特征即可,提高物体识别精度,进而提高虚拟形象的展示精度。
步骤120、根据预设的物体与三维模型的关联关系,确定待识别物体的目标三维模型。
其中,预先存储不同物体与三维模型之间的关联关系,三维模型是用于AR显示的虚拟形象,可以对物体进行立体展示,用户可以通过虚拟的三维模型对物体的实体形象进行360°的查看。例如,三维模型可以是一只恐龙的虚拟立体模型。在确定待识别物体后,根据物体与三维模型的关联关系,确定待识别物体的目标三维模型。例如,可以存储桌子与桌子的三维模型的关联关系,当确定待识别物体为桌子时,则根据预设的关联关系,从预先存储的多个三维模型中查找桌子的三维模型,作为目标三维模型。
步骤130、将目标三维模型作为虚拟形象显示在终端屏幕中的待识别物体位置处。
其中,在确定目标三维模型后,将目标三维模型作为待识别物体的虚拟形象展示在终端的屏幕中,目标三维模型在屏幕中的展示位置可以与屏幕中待识别物体的图片的位置一致。例如,可以将目标三维模型展示在屏幕中待识别物体的图片上方,即,使目标三维模型立在待识别物体的图片上,提升用户的观看体验。
本实施例中,可选的,将目标三维模型作为虚拟形象显示在终端屏幕中的待识别物体位置处,包括:确定终端屏幕中待识别物体的当前角度;将目标三维模型作为虚拟形象,以当前角度显示在终端屏幕中的待识别物体位置处。
具体的,在对目标三维模型进行AR展示时,可以确定终端屏幕中待识别物体的当前角度,当前角度可以是图像采集设备所扫描到的几何实体的平面与图像采集设备之间的相对角度,即,当前角度为所扫描的平面上的图片与图像采集设备之间的相对角度。例如,图片中的待识别物体的当前角度为正立着面向图像采集设备,即用户手持几何实体,使几何实体的平面为垂直地面的方向,用户手持终端,使终端也处于垂直地面的角度,则待识别物体的当前角度为面向图像采集设备,并可以使图片中的待识别物体为正向站立的方向。若用户手持终端或几何实体进行倾斜,则当前角度可以随之改变。在确定当前角度后,将目标三维模型以当前角度进行展示,例如,可以将目标三维模型正向站立在待识别物体的图片上,面向图像采集设备。若图片中的待识别图片上下颠倒,则可以将目标三维模型倒放进行展示。这样设置的有益效果在于,可以根据用户对几何实体的手持操作,确定虚拟形象的展示角度,使虚拟形象按照用户需要的角度进行展示,提升用户体验。在AR展示过程中,用户可以手持几何实体进行角度的旋转或倾斜,改变当前角度。实时确定待识别物体的当前角度,根据当前角度可以实时改变虚拟形象的显示角度,例如,用户手持几何实体,使图片上的待识别物体进行旋转,则目标三维模型的虚拟形象也随之进行旋转。用户不需要在终端上进行操作,就可以全面地查看目标三维模型,解决了用户与虚拟物体的交互依赖于用户在触摸屏上的操作的问题,实现了用户通过实体的感知进行与虚拟物体的交互,确保虚拟的三维模型与几何实体上的图片相互对应,提高AR模型的展示精度。
本实施例中,可选的,在将目标三维模型作为虚拟形象显示在终端屏幕中的待识别物体位置处之后,还包括:响应于用户在终端屏幕上发出的三维模型调整指令,确定目标三维模型的虚拟形象的目标角度和目标大小;根据目标角度和目标大小调整目标三维模型的虚拟形象,将虚拟形象显示在终端屏幕中的待识别物体位置处。
具体的,用户可以通过调整几何实体来调整虚拟形象的展示角度,也可以对终端屏幕进行操作,进行虚拟形象的调整。用户可以在终端屏幕上发出三维模型调整指令,三维模型调整指令可以包括旋转、放大、缩小和查看信息等指令,例如,用户可以通过手指滑动在屏幕上进行缩放操作。响应到用户发出的三维模型调整指令,对目标三维模型的虚拟形象进行调整,确定虚拟形象的目标角度和目标大小。例如,用户对虚拟形象进行缩放,则将缩放后的大小作为目标大小。或者,在屏幕上对虚拟形象进行旋转,则旋转后的角度为目标角度。根据目标角度和目标大小对虚拟形象进行调整,将调整后的虚拟形象显示在屏幕上,调整后的虚拟形象的位置仍然可以与图片中待识别物体在屏幕中的位置对应。即,终端交互界面可以产生操作数据的信息,如按钮点按、3D模型放大、缩小、旋转、移动以及菜单栏交互等,并根据用户的操作和摄像头感应对场景进行实时更新渲染。这样设置的有益效果在于,用户可以通过几何实体和终端对AR模型进行调整,提高AR交互的灵活性和交互的实时性,便于用户对模型的查看,提升用户的交互体验。
本实施例的技术方案,通过终端上安装的图像采集设备对几何实体上的图片进行采集,得到待识别图像。根据预先训练的神经网络模型对待识别图片进行特征提取,确定待识别物体。根据预先存储的物体与三维模型的关联关系,确定目标三维模型。将目标三维模型进行展示,目标三维模型是AR的虚拟形象,且展示位置与屏幕中待识别物体的位置一致。通过预设的神经网络模型解决了现有技术中目标三维模型查找不及时和不精确的问题,提高AR交互的效率和精度。用户可以通过几何实体与虚拟物体进行交互,调整虚拟的目标三维模型的展示位置,提升用户的交互体验。
实施例二
图2为本发明实施例二所提供的一种基于增强现实的交互方法的流程示意图,本实施例以上述实施例为基础进行进一步的优化,该方法可以由一种基于增强现实的交互装置来执行。如图2所示,该方法具体包括如下步骤:
步骤210、通过终端上的图像采集设备从几何实体的任一平面上获取待识别图像。
步骤220、判断待识别图像是否存在于预设的候选图像中,若是,则根据预设的候选图像与三维模型的关联关系,确定待识别图像的目标三维模型。
其中,获取待识别图像,待识别图像中的内容可以含有待识别物体。要对待识别物体进行AR的虚拟显示,就需要查找与待识别物体对应的虚拟的三维模型。预先存储不同候选图像与三维模型的关联关系,在得到待识别图像后,在候选图像中查找是否存在该待识别图像。例如,待识别图像中的内容为一只小狗的正面图,候选图像中也有这只小狗的正面图,则确定待识别图像存在于预设的候选图像中。
本实施例不需要通过特征提取的神经网络模型对待识别图像的内容进行特征提取,只需查找是否存在与待识别图像一致的候选图像即可。若存在,则将对应的候选图像的三维模型确定为目标三维模型。若不存在,则无法进行待识别物体的虚拟显示。在通过图像采集设备获取待识别图像时,用户可以手持终端正向面对几何实体的平面,确保图像采集设备可以准确采集到几何实体平面上的图片,避免角度倾斜无法查找出对应的候选图像,提高目标三维模型的确定精度。在确定目标三维模型后,用户可以再旋转或倾斜几何实体,进行虚拟形象的调整。
步骤230、将目标三维模型作为虚拟形象显示在终端屏幕中的待识别物体位置处。
本发明实施例通过终端上安装的图像采集设备对几何实体上的图片进行采集,得到待识别图像。根据预先存储的候选图像与三维模型的关联关系,确定目标三维模型,提高目标三维模型的确定效率。将目标三维模型进行展示,目标三维模型是AR的虚拟形象,且展示位置与屏幕中待识别物体的位置一致。通过将待识别物体的图片设置在几何实体上,提高AR显示的趣味性和便捷性,用户可以通过几何实体与虚拟物体进行交互,调整虚拟的目标三维模型的展示位置,提升用户的交互体验。
实施例三
图3为本发明实施例三所提供的一种基于增强现实的交互装置的结构框图,可执行本发明任意实施例所提供的一种基于增强现实的交互方法,具备执行方法相应的功能模块和有益效果。如图3所示,该装置具体包括:
物体确定模块301,用于通过终端上的图像采集设备从几何实体的任一平面上获取待识别图像,基于预先训练的物体识别模型,确定所述待识别图像上的待识别物体;
模型确定模块302,用于根据预设的物体与三维模型的关联关系,确定所述待识别物体的目标三维模型;
模型展示模块303,用于将所述目标三维模型作为虚拟形象显示在终端屏幕中的待识别物体位置处。
可选的,物体确定模块301,包括:
特征提取单元,用于根据预先训练的物体识别模型,对所述待识别图像进行待识别物体特征的提取;
物体类别确定单元,用于根据所述待识别物体特征,输出所述待识别图像上的待识别物体的类别。
可选的,几何实体是由平面组成的几何结构,所述平面上设置有待识别物体的图片。
可选的,该装置还包括:
图片判断模块,用于在通过终端上的图像采集设备从几何实体的任一平面上获取待识别图像之后,判断所述待识别图像是否存在于预设的候选图像中;
模型查找模块,用于若是,则根据预设的候选图像与三维模型的关联关系,确定所述待识别图像的目标三维模型。
可选的,模型展示模块303,具体用于:
确定终端屏幕中所述待识别物体的当前角度;
将所述目标三维模型作为虚拟形象,以所述当前角度显示在终端屏幕中的待识别物体位置处。
可选的,该装置还包括:
模型调整确定模块,用于在将所述目标三维模型作为虚拟形象显示在终端屏幕中的待识别物体位置处之后,响应于用户在终端屏幕上发出的三维模型调整指令,确定所述目标三维模型的虚拟形象的目标角度和目标大小;
模型调整显示模块,用于根据所述目标角度和目标大小调整所述目标三维模型的虚拟形象,将所述虚拟形象显示在终端屏幕中的待识别物体位置处。
本发明实施例通过终端上安装的图像采集设备对几何实体上的图片进行采集,得到待识别图像。根据预先训练的神经网络模型对待识别图片进行特征提取,确定待识别物体。根据预先存储的物体与三维模型的关联关系,确定目标三维模型。将目标三维模型进行展示,目标三维模型是AR的虚拟形象,且展示位置与屏幕中待识别物体的位置一致。通过预设的神经网络模型解决了现有技术中目标三维模型查找不及时和不精确的问题,提高AR交互的效率和精度。用户可以通过几何实体与虚拟物体进行交互,调整虚拟的目标三维模型的展示位置,提升用户的交互体验。
实施例四
图4是本发明实施例四提供的一种基于增强现实的交互设备的结构示意图。基于增强现实的交互设备是一种电子设备,图4示出了适于用来实现本发明实施方式的示例性电子设备400的框图。图4显示的电子设备400仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,电子设备400以通用计算设备的形式表现。电子设备400的组件可以包括但不限于:一个或者多个处理器或者处理单元401,系统存储器402,连接不同系统组件(包括系统存储器402和处理单元401)的总线403。
总线403表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
电子设备400典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备400访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器402可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)404和/或高速缓存存储器405。电子设备400可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统406可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线403相连。存储器402可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块407的程序/实用工具408,可以存储在例如存储器402中,这样的程序模块407包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块407通常执行本发明所描述的实施例中的功能和/或方法。
电子设备400也可以与一个或多个外部设备409(例如键盘、指向设备、显示器410等)通信,还可与一个或者多个使得用户能与该电子设备400交互的设备通信,和/或与使得该电子设备400能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口411进行。并且,电子设备400还可以通过网络适配器412与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图4所示,网络适配器412通过总线403与电子设备400的其它模块通信。应当明白,尽管图4中未示出,可以结合电子设备400使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元401通过运行存储在系统存储器402中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的一种基于增强现实的交互方法,包括:
通过终端上的图像采集设备从几何实体的任一平面上获取待识别图像,基于预先训练的物体识别模型,确定所述待识别图像上的待识别物体;
根据预设的物体与三维模型的关联关系,确定所述待识别物体的目标三维模型;
将所述目标三维模型作为虚拟形象显示在终端屏幕中的待识别物体位置处。
实施例五
本发明实施例五还提供一种包含计算机可执行指令的存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例所提供的一种基于增强现实的交互方法,包括:
通过终端上的图像采集设备从几何实体的任一平面上获取待识别图像,基于预先训练的物体识别模型,确定所述待识别图像上的待识别物体;
根据预设的物体与三维模型的关联关系,确定所述待识别物体的目标三维模型;
将所述目标三维模型作为虚拟形象显示在终端屏幕中的待识别物体位置处。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种基于增强现实的交互方法,其特征在于,包括:
通过终端上的图像采集设备从几何实体的任一平面上获取待识别图像,基于预先训练的物体识别模型,确定所述待识别图像上的待识别物体;
根据预设的物体与三维模型的关联关系,确定所述待识别物体的目标三维模型;
将所述目标三维模型作为虚拟形象显示在终端屏幕中的待识别物体位置处。
2.根据权利要求1所述的方法,其特征在于,基于预先训练的物体识别模型,确定所述待识别图像上的待识别物体,包括:
根据预先训练的物体识别模型,对所述待识别图像进行待识别物体特征的提取;
根据所述待识别物体特征,输出所述待识别图像上的待识别物体的类别。
3.根据权利要求1所述的方法,其特征在于,所述几何实体是由平面组成的几何结构,所述平面上设置有待识别物体的图片。
4.根据权利要求1所述的方法,其特征在于,在通过终端上的图像采集设备从几何实体的任一平面上获取待识别图像之后,还包括:
判断所述待识别图像是否存在于预设的候选图像中;
若是,则根据预设的候选图像与三维模型的关联关系,确定所述待识别图像的目标三维模型。
5.根据权利要求1所述的方法,其特征在于,将所述目标三维模型作为虚拟形象显示在终端屏幕中的待识别物体位置处,包括:
确定终端屏幕中所述待识别物体的当前角度;
将所述目标三维模型作为虚拟形象,以所述当前角度显示在终端屏幕中的待识别物体位置处。
6.根据权利要求1所述的方法,其特征在于,在将所述目标三维模型作为虚拟形象显示在终端屏幕中的待识别物体位置处之后,还包括:
响应于用户在终端屏幕上发出的三维模型调整指令,确定所述目标三维模型的虚拟形象的目标角度和目标大小;
根据所述目标角度和目标大小调整所述目标三维模型的虚拟形象,将所述虚拟形象显示在终端屏幕中的待识别物体位置处。
7.一种基于增强现实的交互装置,其特征在于,包括:
物体确定模块,用于通过终端上的图像采集设备从几何实体的任一平面上获取待识别图像,基于预先训练的物体识别模型,确定所述待识别图像上的待识别物体;
模型确定模块,用于根据预设的物体与三维模型的关联关系,确定所述待识别物体的目标三维模型;
模型展示模块,用于将所述目标三维模型作为虚拟形象显示在终端屏幕中的待识别物体位置处。
8.根据权利要求7所述的装置,其特征在于,所述物体确定模块,包括:
特征提取单元,用于根据预先训练的物体识别模型,对所述待识别图像进行待识别物体特征的提取;
类别输出单元,用于根据所述待识别物体特征,输出所述待识别图像上的待识别物体的类别。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-6中任一所述的基于增强现实的交互方法。
10.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-6中任一所述的基于增强现实的交互方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111193452.2A CN113934297B (zh) | 2021-10-13 | 2021-10-13 | 一种基于增强现实的交互方法、装置、电子设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111193452.2A CN113934297B (zh) | 2021-10-13 | 2021-10-13 | 一种基于增强现实的交互方法、装置、电子设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113934297A true CN113934297A (zh) | 2022-01-14 |
CN113934297B CN113934297B (zh) | 2024-05-31 |
Family
ID=79278753
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111193452.2A Active CN113934297B (zh) | 2021-10-13 | 2021-10-13 | 一种基于增强现实的交互方法、装置、电子设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113934297B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117149015A (zh) * | 2023-09-26 | 2023-12-01 | 深圳市慕尚视觉科技有限公司 | 基于三维模型的产品展示方法及装置 |
WO2023246189A1 (zh) * | 2022-06-24 | 2023-12-28 | 如你所视(北京)科技有限公司 | 图像信息显示方法和装置 |
CN117412019A (zh) * | 2023-12-14 | 2024-01-16 | 深圳市欧冠微电子科技有限公司 | 空中成像及虚拟现实动态背光确定方法、装置及电子设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105701863A (zh) * | 2016-01-11 | 2016-06-22 | 华为技术有限公司 | 图像处理的方法和装置 |
CN109685905A (zh) * | 2017-10-18 | 2019-04-26 | 深圳市掌网科技股份有限公司 | 基于增强现实的小区规划方法和系统 |
US20190340649A1 (en) * | 2018-05-07 | 2019-11-07 | Adobe Inc. | Generating and providing augmented reality representations of recommended products based on style compatibility in relation to real-world surroundings |
CN111626183A (zh) * | 2020-05-25 | 2020-09-04 | 深圳市商汤科技有限公司 | 一种目标对象展示方法及装置、电子设备和存储介质 |
CN111640200A (zh) * | 2020-06-10 | 2020-09-08 | 浙江商汤科技开发有限公司 | 一种ar场景特效生成的方法及装置 |
CN111680570A (zh) * | 2020-05-13 | 2020-09-18 | 珠海格力电器股份有限公司 | 增强现实图像数据处理方法、装置、设备和存储介质 |
CN111970557A (zh) * | 2020-09-01 | 2020-11-20 | 深圳市慧鲤科技有限公司 | 图像显示方法、装置、电子设备及存储介质 |
US20210286502A1 (en) * | 2020-03-16 | 2021-09-16 | Apple Inc. | Devices, Methods, and Graphical User Interfaces for Providing Computer-Generated Experiences |
-
2021
- 2021-10-13 CN CN202111193452.2A patent/CN113934297B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105701863A (zh) * | 2016-01-11 | 2016-06-22 | 华为技术有限公司 | 图像处理的方法和装置 |
CN109685905A (zh) * | 2017-10-18 | 2019-04-26 | 深圳市掌网科技股份有限公司 | 基于增强现实的小区规划方法和系统 |
US20190340649A1 (en) * | 2018-05-07 | 2019-11-07 | Adobe Inc. | Generating and providing augmented reality representations of recommended products based on style compatibility in relation to real-world surroundings |
US20210286502A1 (en) * | 2020-03-16 | 2021-09-16 | Apple Inc. | Devices, Methods, and Graphical User Interfaces for Providing Computer-Generated Experiences |
CN111680570A (zh) * | 2020-05-13 | 2020-09-18 | 珠海格力电器股份有限公司 | 增强现实图像数据处理方法、装置、设备和存储介质 |
CN111626183A (zh) * | 2020-05-25 | 2020-09-04 | 深圳市商汤科技有限公司 | 一种目标对象展示方法及装置、电子设备和存储介质 |
CN111640200A (zh) * | 2020-06-10 | 2020-09-08 | 浙江商汤科技开发有限公司 | 一种ar场景特效生成的方法及装置 |
CN111970557A (zh) * | 2020-09-01 | 2020-11-20 | 深圳市慧鲤科技有限公司 | 图像显示方法、装置、电子设备及存储介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023246189A1 (zh) * | 2022-06-24 | 2023-12-28 | 如你所视(北京)科技有限公司 | 图像信息显示方法和装置 |
CN117149015A (zh) * | 2023-09-26 | 2023-12-01 | 深圳市慕尚视觉科技有限公司 | 基于三维模型的产品展示方法及装置 |
CN117412019A (zh) * | 2023-12-14 | 2024-01-16 | 深圳市欧冠微电子科技有限公司 | 空中成像及虚拟现实动态背光确定方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN113934297B (zh) | 2024-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11947729B2 (en) | Gesture recognition method and device, gesture control method and device and virtual reality apparatus | |
CN105981368B (zh) | 在成像装置中的照片构图和位置引导 | |
CN113934297B (zh) | 一种基于增强现实的交互方法、装置、电子设备及介质 | |
CN108895981B (zh) | 一种三维测量方法、装置、服务器和存储介质 | |
US11893702B2 (en) | Virtual object processing method and apparatus, and storage medium and electronic device | |
US10249089B2 (en) | System and method for representing remote participants to a meeting | |
EP2972950B1 (en) | Segmentation of content delivery | |
US20140002443A1 (en) | Augmented reality interface | |
CN107656962B (zh) | 电子地图中的全景显示方法、服务器及计算机可读介质 | |
CN111882634A (zh) | 一种图像渲染方法、装置、设备及存储介质 | |
CN111340960B (zh) | 图像的建模方法、装置、存储介质和电子设备 | |
US11922568B2 (en) | Finite aperture omni-directional stereo light transport | |
CN112766027A (zh) | 图像处理方法、装置、设备及存储介质 | |
US11556605B2 (en) | Search method, device and storage medium | |
CN108597034B (zh) | 用于生成信息的方法和装置 | |
WO2020034981A1 (zh) | 编码信息的生成方法和识别方法 | |
US20200226833A1 (en) | A method and system for providing a user interface for a 3d environment | |
CN106919260B (zh) | 网页操作方法和装置 | |
CN113867875A (zh) | 标记对象的编辑及显示方法、装置、设备、存储介质 | |
CN108920598B (zh) | 全景图浏览方法、装置、终端设备、服务器及存储介质 | |
CN108874141B (zh) | 一种体感浏览方法和装置 | |
CN112465692A (zh) | 图像处理方法、装置、设备及存储介质 | |
CN109461203B (zh) | 手势三维图像生成方法、装置、计算机设备及存储介质 | |
CN108536830B (zh) | 图片动态搜索方法、装置、设备、服务器和存储介质 | |
CN114089836B (zh) | 标注方法、终端、服务器和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |