CN113377976B - 资源搜索方法、装置、计算机设备及存储介质 - Google Patents
资源搜索方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN113377976B CN113377976B CN202110936767.5A CN202110936767A CN113377976B CN 113377976 B CN113377976 B CN 113377976B CN 202110936767 A CN202110936767 A CN 202110936767A CN 113377976 B CN113377976 B CN 113377976B
- Authority
- CN
- China
- Prior art keywords
- multimedia resource
- resource
- multimedia
- search
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/48—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开关于一种资源搜索方法、装置、计算机设备及存储介质,属于多媒体技术领域。该方法包括:响应于搜索请求,确定该搜索请求对应的搜索词和第一多媒体资源;获取该搜索词的搜索词特征和该第一多媒体资源的第一资源特征;基于该搜索词特征、该第一资源特征以及多个候选多媒体资源的第二资源特征,从该多个候选多媒体资源中确定至少一个第二多媒体资源;发送该至少一个第二多媒体资源。本公开避免了与搜索词关联但与第一多媒体资源无关的这一类多媒体资源出现在搜索结果,从而获取到了更加准确的搜索结果,提高了搜索行为的搜索准确度。
Description
技术领域
本公开涉及多媒体技术领域,特别涉及一种资源搜索方法、装置、计算机设备及存储介质。
背景技术
随着多媒体技术的发展和搜索功能的多样化,用户能够通过终端上的应用程序随时随地浏览多媒体资源,通常该应用程序还提供针对多媒体资源的搜索功能,也即,用户在应用程序中输入感兴趣的搜索词,以便于查看与这一搜索词相关的各个多媒体资源。
在上述搜索过程中,针对同一搜索词,与该搜索词相关的多媒体资源却可能是多种多样的,例如,针对搜索词“崂山”,相关的多媒体资源包括:崂山的山景、爬崂山的自拍照片、崂山啤酒、青岛海景等,而针对与搜索词相关的多种不同类型的多媒体资源,如何获取更加准确的搜索结果成为一个亟需改善的问题。
发明内容
本公开提供一种资源搜索方法、装置、计算机设备及存储介质,以针对多媒体资源搜索行为获取更加准确的搜索结果。
根据本公开实施例的一方面,提供一种资源搜索方法,包括:
响应于搜索请求,确定所述搜索请求对应的搜索词和第一多媒体资源,所述第一多媒体资源与所述搜索词关联;
获取所述搜索词的搜索词特征和所述第一多媒体资源的第一资源特征;
基于所述搜索词特征、所述第一资源特征以及多个候选多媒体资源的第二资源特征,从所述多个候选多媒体资源中确定至少一个第二多媒体资源,所述第二多媒体资源与所述搜索词和所述第一多媒体资源均关联;
发送所述至少一个第二多媒体资源。
在一种可能实施方式中,所述响应于搜索请求,确定所述搜索请求对应的搜索词和第一多媒体资源包括:
若所述搜索请求为第一搜索请求,从所述第一搜索请求中获取所述搜索词和所述第一多媒体资源的资源标识,所述第一搜索请求基于对所述第一多媒体资源的播放界面上的内容标签的触发操作生成,且所述第一搜索请求将所述内容标签作为所述搜索词。
在一种可能实施方式中,所述响应于搜索请求,确定所述搜索请求对应的搜索词和第一多媒体资源包括:
若所述搜索请求为第二搜索请求,获取所述搜索请求携带的所述搜索词,所述第二搜索请求基于在搜索输入框中的输入操作生成;
从历史浏览记录中,选择与所述搜索词关联的多媒体资源为所述第一多媒体资源。
在一种可能实施方式中,所述从历史浏览记录中,选择与所述搜索词关联的多媒体资源为所述第一多媒体资源包括:
从所述历史浏览记录中,选择内容标签包括所述搜索词且时间戳最新的多媒体资源为所述第一多媒体资源。
在一种可能实施方式中,所述从历史浏览记录中,选择与所述搜索词关联的多媒体资源为所述第一多媒体资源包括:
从所述历史浏览记录中,选择与所述搜索词之间相似度最高的多媒体资源为所述第一多媒体资源。
在一种可能实施方式中,所述基于所述搜索词特征、所述第一资源特征以及多个候选多媒体资源的第二资源特征,从所述多个候选多媒体资源中确定至少一个第二多媒体资源包括:
基于所述搜索词特征、所述第一资源特征和所述多个候选多媒体资源的第二资源特征,从所述多个候选多媒体资源中确定至少一个第三多媒体资源,所述第三多媒体资源与所述搜索词和所述第一多媒体资源之间的相似度符合第一目标条件;
获取所述至少一个第三多媒体资源的目标行为参数,所述目标行为参数用于表征账号对所述第三多媒体资源发生目标行为的可能性;
从所述至少一个第三多媒体资源中,获取目标行为参数符合第二目标条件的第三多媒体资源为所述至少一个第二多媒体资源。
在一种可能实施方式中,所述基于所述搜索词特征、所述第一资源特征和所述多个候选多媒体资源的第二资源特征,从所述多个候选多媒体资源中确定至少一个第三多媒体资源包括:
对所述多个候选多媒体资源中的任一候选多媒体资源,获取所述搜索词特征与所述候选多媒体资源的第二资源特征之间的第一相似度;
获取所述第一资源特征和所述候选多媒体资源的第二资源特征之间的第二相似度;
对所述第一相似度和所述第二相似度进行加权,得到第三相似度;
在所述第三相似度符合所述第一目标条件的情况下,确定所述候选多媒体资源为第三多媒体资源。
在一种可能实施方式中,所述在所述第三相似度符合所述第一目标条件的情况下,确定所述候选多媒体资源为第三多媒体资源包括:
基于第三相似度从大到小的顺序对所述多个候选多媒体资源进行排序;
若所述候选多媒体资源在所述排序中位于前第一目标位,确定所述候选多媒体资源为第三多媒体资源。
在一种可能实施方式中,所述在所述第三相似度符合所述第一目标条件的情况下,确定所述候选多媒体资源为第三多媒体资源包括:
若所述第三相似度大于相似阈值,确定所述候选多媒体资源为第三多媒体资源。
在一种可能实施方式中,所述获取所述至少一个第三多媒体资源的目标行为参数包括:
对所述至少一个第三多媒体资源中的任一第三多媒体资源,将所述搜索词特征、所述第一资源特征和所述第三多媒体资源的第二资源特征输入目标行为模型,所述目标行为模型用于获取输入多媒体资源的目标行为参数;
通过所述目标行为模型对所述搜索词特征、所述第一资源特征和所述第三多媒体资源的第二资源特征进行加权,得到目标行为特征;
对所述目标行为特征进行指数归一化,得到所述目标行为参数。
在一种可能实施方式中,所述从所述至少一个第三多媒体资源中,获取目标行为参数符合第二目标条件的第三多媒体资源为所述至少一个第二多媒体资源包括:
基于目标行为参数从大到小的顺序对所述至少一个第三多媒体资源进行排序,选择排序位于前第二目标位的第三多媒体资源为所述至少一个第二多媒体资源。
在一种可能实施方式中,所述从所述至少一个第三多媒体资源中,获取目标行为参数符合第二目标条件的第三多媒体资源为所述至少一个第二多媒体资源包括:
从所述至少一个第三多媒体资源中,选择目标行为参数大于行为参数阈值的第三多媒体资源为所述至少一个第二多媒体资源。
在一种可能实施方式中,所述目标行为参数包括:点击行为参数、点赞行为参数、转发行为参数、评论行为参数或收藏行为参数中至少一项。
根据本公开实施例的另一方面,提供一种资源搜索方法,包括:
发送携带搜索词的搜索请求;
接收基于所述搜索请求返回的至少一个第二多媒体资源,所述第二多媒体资源与所述搜索词和第一多媒体资源均关联,所述第一多媒体资源与所述搜索词关联;
显示所述至少一个第二多媒体资源。
在一种可能实施方式中,所述发送携带搜索词的搜索请求包括:
在所述第一多媒体资源的播放界面中显示所述第一多媒体资源的多个内容标签;
响应于对所述多个内容标签中任一内容标签的触发操作,发送携带所述内容标签和所述第一多媒体资源的资源标识的所述搜索请求。
根据本公开实施例的另一方面,提供一种资源搜索装置,包括:
第一确定单元,被配置为执行响应于搜索请求,确定所述搜索请求对应的搜索词和第一多媒体资源,所述第一多媒体资源与所述搜索词关联;
获取单元,被配置为执行获取所述搜索词的搜索词特征和所述第一多媒体资源的第一资源特征;
第二确定单元,被配置为执行基于所述搜索词特征、所述第一资源特征以及多个候选多媒体资源的第二资源特征,从所述多个候选多媒体资源中确定至少一个第二多媒体资源,所述第二多媒体资源与所述搜索词和所述第一多媒体资源均关联;
发送单元,被配置为执行发送所述至少一个第二多媒体资源。
在一种可能实施方式中,所述第一确定单元被配置为执行:
若所述搜索请求为第一搜索请求,从所述第一搜索请求中获取所述搜索词和所述第一多媒体资源的资源标识,所述第一搜索请求基于对所述第一多媒体资源的播放界面上的内容标签的触发操作生成,且所述第一搜索请求将所述内容标签作为所述搜索词。
在一种可能实施方式中,所述第一确定单元包括:
第一获取子单元,被配置为执行若所述搜索请求为第二搜索请求,获取所述搜索请求携带的所述搜索词,所述第二搜索请求基于在搜索输入框中的输入操作生成;
选择子单元,被配置为执行从历史浏览记录中,选择与所述搜索词关联的多媒体资源为所述第一多媒体资源。
在一种可能实施方式中,所述选择子单元被配置为执行:
从所述历史浏览记录中,选择内容标签包括所述搜索词且时间戳最新的多媒体资源为所述第一多媒体资源。
在一种可能实施方式中,所述选择子单元被配置为执行:
从所述历史浏览记录中,选择与所述搜索词之间相似度最高的多媒体资源为所述第一多媒体资源。
在一种可能实施方式中,所述第二确定单元包括:
确定子单元,被配置为执行基于所述搜索词特征、所述第一资源特征和所述多个候选多媒体资源的第二资源特征,从所述多个候选多媒体资源中确定至少一个第三多媒体资源,所述第三多媒体资源与所述搜索词和所述第一多媒体资源之间的相似度符合第一目标条件;
第二获取子单元,被配置为执行获取所述至少一个第三多媒体资源的目标行为参数,所述目标行为参数用于表征账号对所述第三多媒体资源发生目标行为的可能性;
第三获取子单元,被配置为执行从所述至少一个第三多媒体资源中,获取目标行为参数符合第二目标条件的第三多媒体资源为所述至少一个第二多媒体资源。
在一种可能实施方式中,所述确定子单元包括:
获取子子单元,被配置为执行对所述多个候选多媒体资源中的任一候选多媒体资源,获取所述搜索词特征与所述候选多媒体资源的第二资源特征之间的第一相似度;
所述获取子子单元,还被配置为执行获取所述第一资源特征和所述候选多媒体资源的第二资源特征之间的第二相似度;
加权子子单元,被配置为执行对所述第一相似度和所述第二相似度进行加权,得到第三相似度;
确定子子单元,被配置为执行在所述第三相似度符合所述第一目标条件的情况下,确定所述候选多媒体资源为第三多媒体资源。
在一种可能实施方式中,所述确定子子单元被配置为执行:
基于第三相似度从大到小的顺序对所述多个候选多媒体资源进行排序;
若所述候选多媒体资源在所述排序中位于前第一目标位,确定所述候选多媒体资源为第三多媒体资源。
在一种可能实施方式中,所述确定子子单元被配置为执行:
若所述第三相似度大于相似阈值,确定所述候选多媒体资源为第三多媒体资源。
在一种可能实施方式中,所述第二获取子单元被配置为执行:
对所述至少一个第三多媒体资源中的任一第三多媒体资源,将所述搜索词特征、所述第一资源特征和所述第三多媒体资源的第二资源特征输入目标行为模型,所述目标行为模型用于获取输入多媒体资源的目标行为参数;
通过所述目标行为模型对所述搜索词特征、所述第一资源特征和所述第三多媒体资源的第二资源特征进行加权,得到目标行为特征;
对所述目标行为特征进行指数归一化,得到所述目标行为参数。
在一种可能实施方式中,所述第三获取子单元被配置为执行:
基于目标行为参数从大到小的顺序对所述至少一个第三多媒体资源进行排序,选择排序位于前第二目标位的第三多媒体资源为所述至少一个第二多媒体资源。
在一种可能实施方式中,所述第三获取子单元被配置为执行:
从所述至少一个第三多媒体资源中,选择目标行为参数大于行为参数阈值的第三多媒体资源为所述至少一个第二多媒体资源。
在一种可能实施方式中,所述目标行为参数包括:点击行为参数、点赞行为参数、转发行为参数、评论行为参数或收藏行为参数中至少一项。
根据本公开实施例的另一方面,提供一种资源搜索装置,包括:
发送单元,被配置为执行发送携带搜索词的搜索请求;
接收单元,被配置为执行接收基于所述搜索请求返回的至少一个第二多媒体资源,所述第二多媒体资源与所述搜索词和第一多媒体资源均关联,所述第一多媒体资源与所述搜索词关联;
显示单元,被配置为执行显示所述至少一个第二多媒体资源。
在一种可能实施方式中,所述发送单元被配置为执行:
在所述第一多媒体资源的播放界面中显示所述第一多媒体资源的多个内容标签;
响应于对所述多个内容标签中任一内容标签的触发操作,发送携带所述内容标签和所述第一多媒体资源的资源标识的所述搜索请求。
根据本公开实施例的另一方面,提供一种计算机设备,包括:
一个或多个处理器;
用于存储所述一个或多个处理器可执行指令的一个或多个存储器;
其中,所述一个或多个处理器被配置为执行上述一方面的任一种可能实施方式中的资源搜索方法。
根据本公开实施例的另一方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的至少一条指令由计算机设备的一个或多个处理器执行时,使得所述计算机设备能够执行上述一方面的任一种可能实施方式中的资源搜索方法。
根据本公开实施例的另一方面,提供一种计算机程序产品,包括一条或多条指令,所述一条或多条指令可以由计算机设备的一个或多个处理器执行,使得所述计算机设备能够执行上述一方面的任一种可能实施方式中的资源搜索方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
通过在接收到搜索请求时,确定与搜索词关联的第一多媒体资源,并将第一多媒体资源的第一资源特征引入到获取搜索结果的过程中,以保证作为搜索结果的各个第二多媒体资源不仅与搜索词关联,而且与第一多媒体资源也关联,避免了与搜索词关联但与第一多媒体资源无关的这一类多媒体资源出现在搜索结果,从而获取到了更加准确的搜索结果,提高了搜索行为的搜索准确度。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种资源搜索方法的实施环境示意图;
图2是根据一示例性实施例示出的一种资源搜索方法的流程图;
图3是根据一示例性实施例示出的一种资源搜索方法的交互流程图;
图4是本公开实施例提供的一种确定第二多媒体资源的流程图;
图5是本公开实施例提供的一种资源搜索方法的原理性示意图;
图6是根据一示例性实施例示出的一种资源搜索装置的逻辑结构框图;
图7是根据一示例性实施例示出的一种资源搜索装置的逻辑结构框图;
图8示出了本公开一个示例性实施例提供的一种终端的结构框图;
图9是本公开实施例提供的一种一种服务器的结构示意图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
本公开所涉及的用户信息可以为经用户授权或者经过各方充分授权的信息。
以下,对本公开实施例涉及的术语进行解释说明。
垂类搜索:也称为垂直搜索,简称垂搜。垂搜是当今的智能手机上移动端APP(Application,应用程序)中广泛存在的产品形态,如字面意思所示,表示查询某一垂直分类的搜索行为以及其对应的搜索结果页。示意性地,以短视频搜索场景为例,用户以某一短视频的内容标签作为搜索词,并发起垂搜,在结果页中将会展示与该内容标签即垂类相关的各个短视频(或称为作品),上述结果页也称为该垂类的详情页或者本次搜索行为的落地页。
与传统的搜索行为不同的是,用户发起的上述垂搜行为是携带有“逛一逛”的属性的,也即是说,用户可能只是出于好奇想查看一下和该垂类相关的短视频有哪些,但并不具有明确的搜索意图,因此垂搜的结果页中的各个短视频是应该携带有推荐属性的。通常来说,结果页内的各个短视频虽然都从属于该垂类,例如,在短视频平台上的内容垂类中的各个短视频,都是由视频发布者自身打上了对应的内容标签之后才会被垂搜算法召回,但由于存在“蹭热度”等行为,即视频发布者向自身上传的短视频打上毫不相关但具有高热度的内容标签,因此难以保证结果页中呈现的各个短视频是否真的与该垂类是相关的。
在一个示例性场景中,用户发起垂搜的入口是携带某一内容标签的短视频,例如,用户在浏览当前短视频的过程中,对该短视频携带的内容标签产生了好奇,用户点击了该内容标签,将会跳转至该内容标签的结果页,从而查看其它的同样携带该内容标签的短视频。
有鉴于此,本公开实施例提供一种资源搜索方法,能够将用户发生点击行为的多媒体资源(即第一多媒体资源)的特征引入到结果页的资源排序和召回算法中,也即假定用户对第一多媒体资源存在兴趣的前提下,促进结果页中与该第一多媒体资源相似度较高的第二多媒体资源增加曝光,使得用户能够在结果页中浏览到更多可能感兴趣的第二多媒体资源,从而提高了垂搜结果页中各个多媒体资源的搜索准确度,增加了用户对垂搜行为的消费和体验,其中,该第一多媒体资源也可以俗称为导流多媒体资源、导流作品等。
图1是根据一示例性实施例示出的一种资源搜索方法的实施环境示意图,参见图1,在该实施环境中可以包括至少一个终端101和服务器102,下面进行详述。
至少一个终端101用于浏览多媒体资源,在该至少一个终端101中每个终端上都可以安装有应用程序,该应用程序可以是任一能够提供多媒体资源浏览服务的客户端,用户可以通过启动该应用程序来浏览多媒体资源,该应用程序可以是短视频应用、音视频应用、购物应用、外卖应用、旅行应用、游戏应用或者社交应用中至少一项,该多媒体资源可以包括视频资源、音频资源、图片资源、文本资源或者网页资源中至少一项。
至少一个终端101可以通过有线或无线通信方式与服务器102进行直接或间接地连接,本公开实施例对此不进行限定。
服务器102也即是一种计算机设备,用于向该至少一个终端101提供多媒体资源搜索服务。服务器102可以包括一台服务器、多台服务器、云计算平台或者虚拟化中心中的至少一项。可选地,服务器102可以承担主要计算工作,该至少一个终端101可以承担次要计算工作;或者,服务器102可以承担次要计算工作,该至少一个终端101可以承担主要计算工作;或者,服务器102和该至少一个终端101之间采用分布式计算架构进行协同计算。
需要说明的是,该至少一个终端101中任一终端的设备类型可以包括:智能手机、平板电脑、电子书阅读器、MP3(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)播放器、MP4(Moving Picture Experts Group Audio LayerIV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机或者台式计算机中的至少一种。例如,该任一终端可以是智能手机,或者其他手持便携式电子设备。以下实施例,以终端包括智能手机来举例说明。
本领域技术人员可以知晓,上述终端的数量可以更多或更少。比如上述终端可以仅为一个,或者上述终端为几十个或几百个,或者更多数量。本公开实施例对终端的数量和设备类型不加以限定。
图2是根据一示例性实施例示出的一种资源搜索方法的流程图,参见图2,该资源搜索方法应用于计算机设备,下面以计算机设备为服务器为例进行说明。
在步骤201中,响应于搜索请求,确定该搜索请求对应的搜索词和第一多媒体资源,该第一多媒体资源与该搜索词关联。
在步骤202中,获取该搜索词的搜索词特征和该第一多媒体资源的第一资源特征。
在步骤203中,基于该搜索词特征、该第一资源特征以及多个候选多媒体资源的第二资源特征,从该多个候选多媒体资源中确定至少一个第二多媒体资源,该第二多媒体资源与该搜索词和该第一多媒体资源均关联。
在步骤204中,发送该至少一个第二多媒体资源。
本公开实施例提供的方法,通过在接收到搜索请求时,确定与搜索词关联的第一多媒体资源,并将第一多媒体资源的第一资源特征引入到获取搜索结果的过程中,以保证作为搜索结果的各个第二多媒体资源不仅与搜索词关联,而且与第一多媒体资源也关联,避免了与搜索词关联但与第一多媒体资源无关的这一类多媒体资源出现在搜索结果,从而获取到了更加准确的搜索结果,提高了搜索行为的搜索准确度。
在一种可能实施方式中,响应于搜索请求,确定该搜索请求对应的搜索词和第一多媒体资源包括:
若该搜索请求为第一搜索请求,从该第一搜索请求中获取该搜索词和该第一多媒体资源的资源标识,该第一搜索请求基于对该第一多媒体资源的播放界面上的内容标签的触发操作生成,且该第一搜索请求将该内容标签作为该搜索词。
在一种可能实施方式中,响应于搜索请求,确定该搜索请求对应的搜索词和第一多媒体资源包括:
若该搜索请求为第二搜索请求,获取该搜索请求携带的该搜索词,该第二搜索请求基于在搜索输入框中的输入操作生成;
从历史浏览记录中,选择与该搜索词关联的多媒体资源为该第一多媒体资源。
在一种可能实施方式中,从历史浏览记录中,选择与该搜索词关联的多媒体资源为该第一多媒体资源包括:
从该历史浏览记录中,选择内容标签包括该搜索词且时间戳最新的多媒体资源为该第一多媒体资源。
在一种可能实施方式中,从历史浏览记录中,选择与该搜索词关联的多媒体资源为该第一多媒体资源包括:
从该历史浏览记录中,选择与该搜索词之间相似度最高的多媒体资源为该第一多媒体资源。
在一种可能实施方式中,基于该搜索词特征、该第一资源特征以及多个候选多媒体资源的第二资源特征,从该多个候选多媒体资源中确定至少一个第二多媒体资源包括:
基于该搜索词特征、该第一资源特征和该多个候选多媒体资源的第二资源特征,从该多个候选多媒体资源中确定至少一个第三多媒体资源,该第三多媒体资源与该搜索词和该第一多媒体资源之间的相似度符合第一目标条件;
获取该至少一个第三多媒体资源的目标行为参数,该目标行为参数用于表征账号对该第三多媒体资源发生目标行为的可能性;
从该至少一个第三多媒体资源中,获取目标行为参数符合第二目标条件的第三多媒体资源为该至少一个第二多媒体资源。
在一种可能实施方式中,基于该搜索词特征、该第一资源特征和该多个候选多媒体资源的第二资源特征,从该多个候选多媒体资源中确定至少一个第三多媒体资源包括:
对该多个候选多媒体资源中的任一候选多媒体资源,获取该搜索词特征与该候选多媒体资源的第二资源特征之间的第一相似度;
获取该第一资源特征和该候选多媒体资源的第二资源特征之间的第二相似度;
对该第一相似度和该第二相似度进行加权,得到第三相似度;
在该第三相似度符合该第一目标条件的情况下,确定该候选多媒体资源为第三多媒体资源。
在一种可能实施方式中,在该第三相似度符合该第一目标条件的情况下,确定该候选多媒体资源为第三多媒体资源包括:
基于第三相似度从大到小的顺序对该多个候选多媒体资源进行排序;
若该候选多媒体资源在该排序中位于前第一目标位,确定该候选多媒体资源为第三多媒体资源。
在一种可能实施方式中,在该第三相似度符合该第一目标条件的情况下,确定该候选多媒体资源为第三多媒体资源包括:
若该第三相似度大于相似阈值,确定该候选多媒体资源为第三多媒体资源。
在一种可能实施方式中,获取该至少一个第三多媒体资源的目标行为参数包括:
对该至少一个第三多媒体资源中的任一第三多媒体资源,将该搜索词特征、该第一资源特征和该第三多媒体资源的第二资源特征输入目标行为模型,该目标行为模型用于获取输入多媒体资源的目标行为参数;
通过该目标行为模型对该搜索词特征、该第一资源特征和该第三多媒体资源的第二资源特征进行加权,得到目标行为特征;
对该目标行为特征进行指数归一化,得到该目标行为参数。
在一种可能实施方式中,从该至少一个第三多媒体资源中,获取目标行为参数符合第二目标条件的第三多媒体资源为该至少一个第二多媒体资源包括:
基于目标行为参数从大到小的顺序对该至少一个第三多媒体资源进行排序,选择排序位于前第二目标位的第三多媒体资源为该至少一个第二多媒体资源。
在一种可能实施方式中,从该至少一个第三多媒体资源中,获取目标行为参数符合第二目标条件的第三多媒体资源为该至少一个第二多媒体资源包括:
从该至少一个第三多媒体资源中,选择目标行为参数大于行为参数阈值的第三多媒体资源为该至少一个第二多媒体资源。
在一种可能实施方式中,该目标行为参数包括:点击行为参数、点赞行为参数、转发行为参数、评论行为参数或收藏行为参数中至少一项。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
图3是根据一示例性实施例示出的一种资源搜索方法的交互流程图,如图3所示,该资源搜索方法用于终端与服务器的交互过程中,该终端和该服务器均为计算机设备的示例性说明,该实施例包括以下步骤。
在步骤301中,终端向服务器发送携带搜索词的搜索请求。
终端上安装和运行有支持多媒体资源的应用程序,用户在该终端上启动该应用程序,并可以在该应用程序中浏览各个多媒体资源。可选地,用户当前浏览的多媒体资源称为第一多媒体资源,用户可以在浏览第一多媒体资源的过程中,通过第一多媒体资源的内容标签触发生成该搜索请求。可选地,用户也可以直接在该应用程序中点击搜索标签,触发显示搜索输入框和确认搜索选项,并直接在搜索输入框中输入搜索词,点击确认搜索选项,触发生成该搜索请求,本申请实施例不对搜索请求的触发方式进行具体限定。
在一些实施例中,按照搜索请求的触发方式的不同,该搜索请求可划分为第一搜索请求和第二搜索请求。其中,该第一搜索请求基于对第一多媒体资源的播放界面上的内容标签的触发操作而生成,该第二搜索请求基于用户在搜索输入框中的输入操作生成。
在一些实施例中,由于该第一搜索请求基于对第一多媒体资源的播放界面上的内容标签的触发操作而生成,意味着该第一搜索请求是由第一多媒体资源导流而形成的,用户在浏览第一多媒体资源的情况下,对该第一多媒体资源的内容标签执行触发操作,并由终端向服务器发送第一搜索请求。
在一些实施例中,终端在该第一多媒体资源的播放界面中显示该第一多媒体资源的多个内容标签;响应于用户对该多个内容标签中任一内容标签的触发操作,发送携带该内容标签和该第一多媒体资源的资源标识的搜索请求。其中,该内容标签即为搜索词,该搜索请求即为第一搜索请求。
可选地,该触发操作包括但不限于:点击操作、触摸操作、双击操作、长按操作、拖拽操作、语音指令、手势指令等,本公开实施例不对触发操作的操作方式进行具体限定。
在上述过程中,终端通过第一多媒体资源的内容标签触发生成搜索请求,从而将内容标签作为搜索词,并在搜索请求中直接添加该第一多媒体资源的资源标识,用于代表该内容标签与该第一多媒体资源是关联的,从而方便了服务器确定该搜索词和该第一多媒体资源,提高了服务器的计算效率。
在一些实施例中,由于该第二搜索请求基于用户在搜索输入框中的输入操作生成,意味着该第二搜索请求并非由某个确定的第一多媒体资源导流,而是用户主动自发地在搜索输入框中发起的搜索行为所触发,此时终端向服务器发送第二搜索请求。
在一些实施例中,终端在应用程序的主界面中显示搜索标签,用户可以通过对该搜索标签执行触发操作,以在该主界面中显示搜索输入框和确认搜索选项,接着,用户可以在搜索输入框中执行输入操作,并在输入完毕后对该确认搜索选项执行触发操作,终端获取该搜索输入框中已输入的信息为搜索词,并发送携带该搜索词的搜索请求,该搜索请求即为第二搜索请求。
可选地,该触发操作包括但不限于:点击操作、触摸操作、双击操作、长按操作、拖拽操作、语音指令、手势指令等,本公开实施例不对触发操作的操作方式进行具体限定。
可选地,该输入操作包括但不限于:通过输入法手动输入、通过自动语音识别技术以语音输入并转换为对应的文本信息等,本公开实施例不对输入操作的操作方式进行具体限定。
在上述过程中,终端通过在搜索输入框中的输入操作触发生成搜索请求,使得在不具有明确的导流多媒体资源的场景下,在这种情况下,服务器会根据登录终端的账号的历史浏览记录来选择第一多媒体资源,仍然能够利用本公开实施例提供的资源搜索方式来获取各个第二多媒体资源,从而提升搜索结果的准确度。
在步骤302中,服务器响应于该搜索请求,确定该搜索请求对应的搜索词和第一多媒体资源,该第一多媒体资源与该搜索词关联。
在一些实施例中,服务器在确定搜索词和第一多媒体资源时,可以根据搜索请求的类型不同而采用不同的确定方式。下面将针对第一搜索请求和第二搜索请求分别进行讨论。
在一些实施例中,若该搜索请求为第一搜索请求,服务器从该第一搜索请求中获取该搜索词和该第一多媒体资源的资源标识,该第一搜索请求基于对该第一多媒体资源的播放界面上的内容标签的触发操作生成,且该第一搜索请求将该内容标签作为该搜索词。例如,将该内容标签封装到第一搜索请求中的搜索词字段。
可选地,服务器接收该搜索请求,并解析该搜索请求中的头字段,若头字段中携带第一搜索请求的类型标识,确定该搜索请求为第一搜索请求,此时可以直接解析该第一搜索请求的搜索词字段,得到该搜索词,解析该第一搜索请求的资源标识字段,得到该资源标识,并该资源标识所指示的多媒体资源确定为该第一多媒体资源。
在上述过程中,服务器针对第一搜索请求可以直接解析得到搜索词和第一多媒体资源的资源标识,而无需进行额外的处理,因此节约了服务器的计算资源,提高了服务器的计算效率。
在一些实施例中,若该搜索请求为第二搜索请求,获取该搜索请求携带的该搜索词,该第二搜索请求基于在搜索输入框中的输入操作生成;从历史浏览记录中,选择与该搜索词关联的多媒体资源为该第一多媒体资源。
可选地,服务器接收该搜索请求,并解析该搜索请求中的头字段,若头字段中携带第二搜索请求的类型标识,确定该搜索请求为第二搜索请求,此时可以直接解析该第二搜索请求的搜索词字段,得到该搜索词,进一步地,解析该第二搜索请求的用户字段,得到登录该搜索请求所对应终端的账号的账号标识,接着,获取该账号标识所对应的历史浏览记录,从该历史浏览记录中查询得到与该搜索词关联的多媒体资源为该第一多媒体资源。
在上述过程中,服务器针对第二搜索请求,即使并没有携带明确的资源标识以指示对应的第一多媒体资源,仍然可以根据账号的历史浏览记录来配置对应的第一多媒体资源,能够增加本公开实施例提供的资源搜索方法的普适性,有利于整体提升各类场景下的搜索准确度。
在一些实施例中,服务器在从该历史浏览记录中选择第一多媒体资源时,可以从该历史浏览记录中,选择内容标签包括该搜索词且时间戳最新的多媒体资源为该第一多媒体资源。
可选地,服务器获取该历史浏览记录中所有多媒体资源所携带的所有内容标签构成的标签集合,并以该搜索词为索引,在该标签集合中查询该索引是否命中任一内容标签,如果该索引命中任一内容标签,代表该任一内容标签中包括该搜索词。重复执行上述过程,可确定出该索引所命中的一个或多个内容标签,此时从历史浏览记录中,获取携带该一个或多个内容标签的一个或多个多媒体资源,并选择该一个或多个多媒体资源中时间戳最新的多媒体资源为该第一多媒体资源。
可选地,上述时间戳最新的含义,可以是本账号最后一次浏览对应多媒体资源的时间戳最新,或者是视频发布者发布对应多媒体资源的时间戳最新,或者还可以是平台内任一账号评论对应多媒体资源的时间戳最新,本公开实施例对此不进行具体限定。
在上述过程中,针对搜索词与内容标签具有高度相关性的情况,服务器从账号的历史浏览记录中选择具有该内容标签且时间戳最新的多媒体资源作为第一多媒体资源,是为了能够提高搜索准确度,这是因为用户在搜索输入框中输入某一内容标签时,通常是由于曾经浏览过携带该内容标签的多媒体资源,并引发好奇想查看其它类似的多媒体资源,因此从历史浏览记录中确定第一多媒体资源,能够针对遗漏第一多媒体资源的场景进行信息补充。
在一些实施例中,如果在上述标签集合中该索引未命中所有的内容标签,那么在这种情况下,服务器可以从该历史浏览记录中,选择与该搜索词之间相似度最高的多媒体资源为该第一多媒体资源。
可选地,服务器可以先执行上述基于索引对标签集合进行匹配查询的操作,如果该索引能够命中任一内容标签,则选择具有该内容标签且时间戳最新的多媒体资源作为第一多媒体资源,如果该索引未能命中所有的内容标签,则还可以获取该搜索词与该历史浏览记录中每个多媒体资源之间的相似度,并选择相似度最高的多媒体资源作为该第一多媒体资源,从而能够提高第一多媒体资源与搜索词直接的关联度。
可选地,服务器也可以不执行上述基于索引对标签集合进行匹配查询的操作,而是直接获取该搜索词与该历史浏览记录中每个多媒体资源之间的相似度,并选择相似度最高的多媒体资源作为该第一多媒体资源,这样能够简化获取第一多媒体资源的处理流程。
可选地,服务器在获取该搜索词与该历史浏览记录中每个多媒体资源之间的相似度时,对于该历史浏览记录中的任一多媒体资源,服务器可以对该搜索词提取嵌入(Embedding)特征作为搜索词特征,对该多媒体资源的详情信息同样提取嵌入特征作为资源特征,接着,获取该搜索词特征和该资源特征之间的欧式距离,并基于该欧式距离获取该搜索词和该多媒体资源之间的相似度,其中该相似度与该欧式距离呈负相关。
可选地,服务器在获取该搜索词与该历史浏览记录中每个多媒体资源之间的相似度时,对于该历史浏览记录中的任一多媒体资源,服务器可以对该搜索词提取嵌入特征作为搜索词特征,对该多媒体资源的详情信息同样提取嵌入特征作为资源特征,接着,获取该搜索词特征和该资源特征之间的余弦距离作为该搜索词和该多媒体资源之间的相似度。
在一些实施例中,除了上述提取多媒体资源的详情信息的嵌入特征作为资源特征之外,还可以利用机器学习模型对该多媒体资源进行特征提取,得到该资源特征,该机器学习模型但不限于:卷积神经网络(Convolutional Neural Networks,CNN)、深度神经网络(Deep Neural Networks,DNN)、多层感知器(Multi-Layer Perceptron,MLP)等,本公开实施例对此不进行具体限定。
在上述过程中,针对搜索词与内容标签不具有高度相关性的情况,服务器从账号的历史浏览记录中选择与该搜索词之间相似度最高的多媒体资源为第一多媒体资源,是为了能够提高搜索准确度,这是因为用户在搜索输入框中输入某一搜索词时,可能是由于曾经浏览过与该搜索词相关的多媒体资源,并引发好奇想查看其它类似的多媒体资源,因此从历史浏览记录中确定第一多媒体资源,能够针对遗漏第一多媒体资源的场景进行信息补充。
在步骤303中,服务器获取该搜索词的搜索词特征和该第一多媒体资源的第一资源特征。
在一些实施例中,服务器可以利用词向量模型对该搜索词进行嵌入处理,得到该搜索词的嵌入特征,将该搜索词的嵌入特征作为该搜索词特征,从而能够提升搜索词的表达能力。
在一些实施例中,服务器还可以对该搜索词进行独热(One-hot)编码,得到该搜索词的独热向量,将该搜索词的独热向量作为该搜索词特征,从而能够简化获取搜索词特征时的计算复杂度,本公开实施例不对搜索词特征的获取方式进行具体限定。
在一些实施例中,服务器可以获取该第一多媒体资源的详情信息,该详情信息可以是由第一多媒体资源的标题、简介、摘要、发布者昵称、发布者账号或者内容标签中至少一项组成形成的文本。接着,对该详情信息进行嵌入处理,得到该详情信息的嵌入特征,将该详情信息的嵌入特征作为该第一资源特征,从而能够简化获取第一资源特征时的复杂度。
在一些实施例中,服务器还可以将该第一多媒体资源的详情信息以及该第一多媒体资源的关键帧输入到特征提取模型中,通过该特征提取模型提取该详情信息和该关键帧之间的融合特征,将该融合特征作为该第一资源特征,从而能够提高第一资源特征的表达能力。可选地,该关键帧可以是该第一多媒体资源的封面,也可以是该第一多媒体资源的一个或多个关键视频帧,该关键视频帧可由视频发布者自行设定,也可以有服务器来进行智能识别和提取,本公开实施例不对此进行具体限定。
可选地,该特征提取模型可以是CNN、DNN、MLP等,还可以是具有多模态处理能力的机器学习模型,本公开实施例不对此进行具体限定。示意性地,该特征提取模型中可包括词向量子模型和DNN子模型,通过词向量子模型提取该详情信息的嵌入特征,通过DNN子模型提取该关键帧的图像特征,将该嵌入特征和该图像特征拼接后输入到全连接层中,通过全连接层提取得到该融合特征。
在步骤304中,服务器基于该搜索词特征、该第一资源特征以及多个候选多媒体资源的第二资源特征,从该多个候选多媒体资源中确定至少一个第二多媒体资源,该第二多媒体资源与该搜索词和该第一多媒体资源均关联。
在一些实施例中,服务器可以从多媒体资源库中获取所有的多媒体资源作为该多个候选多媒体资源,或者,服务器还可以从多媒体资源库中随机抽样目标数量的多媒体资源作为该多个候选多媒体资源等,本公开实施例不对此进行具体限定。
在一些实施例中,对每个候选多媒体资源,服务器可以获取该候选多媒体资源的详情信息,该详情信息可以是由候选多媒体资源的标题、简介、摘要、发布者昵称、发布者账号或者内容标签中至少一项组成形成的文本。接着,对该详情信息进行嵌入处理,得到该详情信息的嵌入特征,将该详情信息的嵌入特征作为该第二资源特征,从而能够简化获取第二资源特征时的复杂度。
在一些实施例中,服务器还可以将该候选多媒体资源的详情信息以及该候选多媒体资源的关键帧输入到特征提取模型中,通过该特征提取模型提取该详情信息和该关键帧之间的融合特征,将该融合特征作为该第二资源特征,从而能够提高第二资源特征的表达能力。可选地,该关键帧可以是该候选多媒体资源的封面,也可以是该候选多媒体资源的一个或多个关键视频帧,该关键视频帧可由视频发布者自行设定,也可以有服务器来进行智能识别和提取,本公开实施例不对此进行具体限定。
可选地,该特征提取模型可以是CNN、DNN、MLP等,还可以是具有多模态处理能力的机器学习模型,本公开实施例不对此进行具体限定。示意性地,该特征提取模型中可包括词向量子模型和DNN子模型,通过词向量子模型提取该详情信息的嵌入特征,通过DNN子模型提取该关键帧的图像特征,将该嵌入特征和该图像特征拼接后输入到全连接层中,通过全连接层提取得到该融合特征。
在一些实施例中,在提取完毕搜索词特征、第一资源特征和各个候选多媒体资源的第二资源特征之后,图4是本公开实施例提供的一种确定第二多媒体资源的流程图,如图4所示,服务器可以通过如下步骤3041-3043来确定各个第二多媒体资源,下面进行详述。
在步骤3041中,服务器基于该搜索词特征、该第一资源特征和该多个候选多媒体资源的第二资源特征,从该多个候选多媒体资源中确定至少一个第三多媒体资源,该第三多媒体资源与该搜索词和该第一多媒体资源之间的相似度符合第一目标条件。
在一些实施例中,服务器在确定各个第三多媒体资源时,对该多个候选多媒体资源中的任一候选多媒体资源,服务器可以执行如下操作:获取该搜索词特征与该候选多媒体资源的第二资源特征之间的第一相似度;获取该第一资源特征和该候选多媒体资源的第二资源特征之间的第二相似度;对该第一相似度和该第二相似度进行加权,得到第三相似度;在该第三相似度符合该第一目标条件的情况下,确定该候选多媒体资源为第三多媒体资源。
在一些实施例中,该第一相似度可以是该搜索词特征与该候选多媒体资源的第二资源特征之间的余弦距离,也可以是该搜索词特征与该候选多媒体资源的第二资源特征之间的欧氏距离的倒数,或者其他用于表征相似程度的参数,使得当第一相似度越大时,代表搜索词与该候选多媒体资源的相似程度越高,反之,当第一相似度越小时,代表搜索词与该候选多媒体资源的相似程度越低。
在一些实施例中,该第二相似度可以是该第一资源特征与该候选多媒体资源的第二资源特征之间的余弦距离,也可以是该第一资源特征与该候选多媒体资源的第二资源特征之间的欧氏距离的倒数,或者其他用于表征相似程度的参数,使得当第二相似度越大时,代表第一多媒体资源与该候选多媒体资源的相似程度越高,反之,当第二相似度越小时,代表第一多媒体资源与该候选多媒体资源的相似程度越低。
在一些实施例中,在获取第三相似度时,可以将该第一相似度与该第二相似度之间的算数平均值作为该第三相似度,或者,还可以将该第一相似度与该第二相似度之间的调和平均值作为该第三相似度,或者,还可以获取第一系数和第二系数,并保证第一系数和第二系数之间的和值等于1,将第一系数与第一相似度相乘,得到第一数值,将第二系数与第二相似度相乘,得到第二数值,将第一数值与第二数值相加,得到该第三相似度,其中,第一系数代表第一相似度在第三相似度中所占的比重,第二系数代表第二相似度在第三相似度中所占的比重。第一系数和第二系数均为大于或等于0且小于或等于1的数值。
服务器对每个候选多媒体资源均执行上述操作,可以得到每个候选多媒体资源的第三相似度,接着,选择第三相似度符合第一目标条件的候选多媒体资源作为第三多媒体资源。
在一些实施例中,在确定第三相似度是否符合第一目标条件时,服务器可以执行如下操作:基于第三相似度从大到小的顺序对该多个候选多媒体资源进行排序;若该候选多媒体资源在该排序中位于前第一目标位,确定该候选多媒体资源为第三多媒体资源。其中,该第一目标位为任一大于或等于1的整数位数。
在上述过程中,通过在所有候选多媒体资源中,选择第三相似度最大的第一目标位个候选多媒体资源作为第三多媒体资源,相当于能够从海量的候选多媒体资源中召回与搜索词和第一多媒体资源均相关的第三多媒体资源,以便于通过下述步骤3042-3043对各个第三多媒体资源进行排序,确定出最终的第二多媒体资源,能够提高第二多媒体资源的搜索准确度。
在一些实施例中,在确定第三相似度是否符合第一目标条件时,服务器可以执行如下操作:若该第三相似度大于相似阈值,确定该候选多媒体资源为第三多媒体资源。其中,相似阈值为任一大于或等于0的数值。
在上述过程中,通过在所有候选多媒体资源中,选择第三相似度大于相似阈值的候选多媒体资源作为第三多媒体资源,从而能够不限定召回阶段中确定的第三多媒体资源的数量,避免遗漏掉一些相似程度较高的候选多媒体资源,从而提高第二多媒体资源的搜索准确度。
在步骤3042中,服务器获取该至少一个第三多媒体资源的目标行为参数,该目标行为参数用于表征账号对该第三多媒体资源发生目标行为的可能性。
在一些实施例中,该目标行为参数包括:点击行为参数、点赞行为参数、转发行为参数、评论行为参数或收藏行为参数中至少一项。例如,该目标行为参数为点击行为参数即预估点击率,代表预测出的账号点击第三多媒体资源的可能性,又例如,该目标行为参数为点赞行为参数即预估点赞率,代表预测出的账号点赞第三多媒体资源的可能性等等,本公开实施例不对目标行为参数的类型进行具体限定。
在一些实施例中,对该至少一个第三多媒体资源中的任一第三多媒体资源,服务器在获取目标行为参数时,可以执行如下操作:将该搜索词特征、该第一资源特征和该第三多媒体资源的第二资源特征输入目标行为模型,该目标行为模型用于获取输入多媒体资源的目标行为参数;通过该目标行为模型对该搜索词特征、该第一资源特征和该第三多媒体资源的第二资源特征进行加权,得到目标行为特征;对该目标行为特征进行指数归一化,得到该目标行为参数。
示意性地,该目标行为模型为DNN,DNN中包括至少一个隐藏层和指数归一化层,服务器将该搜索词特征、该第一资源特征和该第三多媒体资源的第二资源特征进行拼接(Concat),得到拼接特征,将该拼接特征输入到DNN的至少一个隐藏层中,通过该至少一个隐藏层对该拼接特征进行加权,由最后一个隐藏层输出目标行为特征,其中,该至少一个隐藏层之间串行连接,也即是说,上一个隐藏层输出的特征作为下一个隐藏层输入的特征。接着,将该目标行为特征输入至该指数归一化层,在该指数归一化层中调用指数归一化函数对该目标行为特征进行指数归一化,输出该目标行为参数。
在上述过程中,通过调用目标行为模型来预测目标行为参数,能够提高目标行为参数的预测准确度,并且,针对不同的目标行为参数,可以训练不同的目标行为模型,例如若目标行为参数为预估点击率,可以训练点击率模型,若目标行为参数为预估点赞率,可以训练点赞率模型,从而能够为不同目标行为参数灵活配置不同的目标行为模型。
在步骤3043中,服务器从该至少一个第三多媒体资源中,获取目标行为参数符合第二目标条件的第三多媒体资源为该至少一个第二多媒体资源。
在一些实施例中,服务器在确定目标行为参数是否符合第二目标条件时,可以执行如下操作:基于目标行为参数从大到小的顺序对该至少一个第三多媒体资源进行排序,选择排序位于前第二目标位的第三多媒体资源为该至少一个第二多媒体资源。其中,该第二目标位为任一大于或等于1的整数位数。
在上述过程中,通过在所有第三多媒体资源中,选择目标行为参数最大的第二目标位个第三多媒体资源作为第二多媒体资源,相当于能够从召回的第三多媒体资源中精筛出用户最有可能感兴趣的第二多媒体资源,以便于针对用户的搜索行为推荐出用户更加感兴趣的第二多媒体资源,提高资源搜索过程的搜素准确度。
在一些实施例中,服务器在确定目标行为参数是否符合第二目标条件时,可以执行如下操作:从该至少一个第三多媒体资源中,选择目标行为参数大于行为参数阈值的第三多媒体资源为该至少一个第二多媒体资源。
在上述过程中,通过在所有第三多媒体资源中,选择目标行为参数大于行为参数阈值的第三多媒体资源作为第二多媒体资源,从而能够不限定精排阶段中确定的第二多媒体资源的数量,避免遗漏掉一些用户可能感兴趣的第二多媒体资源,从而提高第二多媒体资源的搜索准确度。
在一些实施例中,由于终端在搜索的结果页中通常仅会显示固定数量的多媒体资源,因此服务器在通过上述两种方式确定出第二多媒体资源之后,还可以通过随机抽样的方式,抽样出该固定数量的第二多媒体资源,并执行下述步骤305,从而能够灵活控制返回的第二多媒体资源的数量。
在上述步骤3041-3043中,从候选多媒体资源中召回第三多媒体资源的阶段可以视为粗筛过程,粗筛过程能够保证召回的第三多媒体资源不仅与搜索词相关,而且还与导流的第一多媒体资源相关,从第三多媒体资源中确定第二多媒体资源的阶段可以视为精排过程,精排过程能够保证筛选得到的第二多媒体资源是更加符合用户兴趣的资源,这种两阶段的筛选过程能够提升最终确定的第二多媒体资源的搜索准确度。
在步骤305中,服务器向终端发送该至少一个第二多媒体资源。
在一些实施例中,服务器可以向终端发送该至少一个第二多媒体资源的相关信息,该相关信息中至少携带该至少一个第二多媒体资源的资源标识和排序序号,除此之外,还可以携带下述至少一项:该至少一个第二多媒体资源的封面、标题、简介、摘要、内容标签、视频发布者的昵称等,本公开实施例对此不进行具体限定。
在一些实施例中,服务器可以采用数据传输协议对该至少一个第二多媒体资源的相关信息进行封装,得到与该搜索请求对应的搜索结果报文,该数据传输协议可以是TCP(Transmission Control Protocol,传输控制协议)、UDP(User Datagram Protocol,用户数据报协议)、IP(Internet Protocol,网际互连协议)等,本公开实施例对此不进行具体限定。
在一些实施例中,服务器在发送搜索结果报文之前,还可以对该搜索结果报文进行压缩和加密,本公开实施例不对压缩采用的压缩算法和加密采用的加密算法进行具体限定。
在步骤306中,终端接收服务器基于该搜索请求返回的至少一个第二多媒体资源。
在一些实施例中,终端可以接收服务器返回的搜索结果报文,如果该搜索结果报文是经过压缩和加密的,可以对该搜索结果报文进行解密和解压缩,解密采用的加密算法与加密采用的加密算法相匹配,解压缩采用的解压缩算法与压缩采用的压缩算法相匹配。进一步地,在经过上述预处理之后,解析该搜索结果报文,得到该至少一个第二多媒体资源的相关信息,该相关信息中至少携带该至少一个第二多媒体资源的资源标识和排序序号,除此之外,还可以携带下述至少一项:该至少一个第二多媒体资源的封面、标题、简介、摘要、内容标签、视频发布者的昵称等,本公开实施例对此不进行具体限定。
在步骤307中,终端显示该至少一个第二多媒体资源。
在一些实施例中,终端可以显示搜索的结果页,并在该结果页中显示该至少一个第二多媒体资源,例如,在该结果页中基于该至少一个第二多媒体资源的排序序号,显示该至少一个第二多媒体资源的封面,并在每个第二多媒体资源的封面下面显示各自的标题,使得用户可以通过点击任一第二多媒体资源的封面或者标题,触发终端从服务器中加载该任一第二多媒体资源,并跳转至该任一第二多媒体资源的播放界面,以播放该任一第二多媒体资源。
图5是本公开实施例提供的一种资源搜索方法的原理性示意图,如图5所示,用户在浏览第一多媒体资源时,终端在第一多媒体资源的播放界面510中提供有该第一多媒体资源的内容标签511,此时第一多媒体资源可称为导流作品,而内容标签511可称为垂类标签按钮。终端响应于用户对该内容标签511的点击操作,向服务器发送搜索请求,并接收服务器返回的6个第二多媒体资源。接着,从播放界面510跳转至显示搜索的结果页520,在该结果页520中显示该6个第二多媒体资源的封面521-526,用户可点击任一第二多媒体资源的封面,从而从结果页520跳转至任一第二多媒体资源的播放界面中。
在本公开实施例中,在处理结果页520中各个第二多媒体资源时,在其召回和排序算法中引入了播放界面510中导流作品的特征(即第一资源特征),使得在结果页520中能够将与导流作品更相似的作品(即第二多媒体资源)排在前面,以增加曝光,使得用户在浏览结果页520中的各个作品时,保证其各个作品与导流作品具有更强的内容相似度,并利用用户的视觉惯性增加用户对结果页520的消费,换言之,能够将垂搜的结果页520的排序问题转化为推荐问题,以便于推荐出更多符合用户消费惯性的作品。
进一步地,在应用本公开实施例提供的资源搜索方式进行测试的过程中,使用地点标签进行了测试,通过将导流作品的特征引入到排序模型(即目标行为模型)中,使得用户从不同的导流作品中,即使点击的是同一个地点标签,其各自返回的搜索结果页中呈现的各个作品的排序也是不同的,这是由于排序模型将导流作品内容上更相似的作品排在了前列,用户在消费时会发现更多与导流作品相似和相关的作品在结果页中被展示出来,符合了用户消费的视觉惯性,增加了用户的消费量,同时也因为结果页中的作品与导流作品的整体相似度提高,从而提高了结果页中的作品本次搜索行为之间的相关度。
以地点标签为POI(Point of Interest,兴趣点)标签为例进行测试时,通过将用户点击的导流作品即第一多媒体资源的第一资源特征引入到目标行为模型(下文简称本模型)中,人工gsb(good-same-bad,更优-相同-更劣)评测时相关性得到较大提升,其中gsb是一个形如a:b:c的比值,在对本模型和传统模型输入相同的多个搜索词之后,对比不同模型针对同一搜索词返回的搜索结果,能够进行性能(如准确率、召回率等指标)优劣的比较,a值代表本模型与传统模型相比性能提升的搜索词数量,b值代表本模型与已有模型相比性能相同的搜索词数量,c值代表本模型与已有模型相比性能变差的搜索词数量,当a值大于c值时,代表本模型的性能由于传统模型,且a值与c值之间的差距越大,代表本模型的性能优化越多。在实验中,高热POI词的gsb为89:9:9,随机POI的gsb词为57:46:27,实验结果显示后验指标也获得较大提升,包括点击率提升+2.8%,曝光时长提升+4.15%等。其中,POI是指在地图上任何非地理意义的有意义的点:比如商店,酒吧,加油站,医院,车站等。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
本公开实施例提供的方法,通过在接收到搜索请求时,确定与搜索词关联的第一多媒体资源,并将第一多媒体资源的第一资源特征引入到获取搜索结果的过程中,以保证作为搜索结果的各个第二多媒体资源不仅与搜索词关联,而且与第一多媒体资源也关联,避免了与搜索词关联但与第一多媒体资源无关的这一类多媒体资源出现在搜索结果,从而获取到了更加准确的搜索结果,提高了搜索行为的搜索准确度。
图6是根据一示例性实施例示出的一种资源搜索装置的逻辑结构框图。参照图6,该装置包括第一确定单元601、获取单元602、第二确定单元603以及发送单元604:
第一确定单元601,被配置为执行响应于搜索请求,确定该搜索请求对应的搜索词和第一多媒体资源,该第一多媒体资源与该搜索词关联;
获取单元602,被配置为执行获取该搜索词的搜索词特征和该第一多媒体资源的第一资源特征;
第二确定单元603,被配置为执行基于该搜索词特征、该第一资源特征以及多个候选多媒体资源的第二资源特征,从该多个候选多媒体资源中确定至少一个第二多媒体资源,该第二多媒体资源与该搜索词和该第一多媒体资源均关联;
发送单元604,被配置为执行发送该至少一个第二多媒体资源。
本公开实施例提供的装置,通过在接收到搜索请求时,确定与搜索词关联的第一多媒体资源,并将第一多媒体资源的第一资源特征引入到获取搜索结果的过程中,以保证作为搜索结果的各个第二多媒体资源不仅与搜索词关联,而且与第一多媒体资源也关联,避免了与搜索词关联但与第一多媒体资源无关的这一类多媒体资源出现在搜索结果,从而获取到了更加准确的搜索结果,提高了搜索行为的搜索准确度。
在一种可能实施方式中,该第一确定单元601被配置为执行:
若该搜索请求为第一搜索请求,从该第一搜索请求中获取该搜索词和该第一多媒体资源的资源标识,该第一搜索请求基于对该第一多媒体资源的播放界面上的内容标签的触发操作生成,且该第一搜索请求将该内容标签作为该搜索词。
在一种可能实施方式中,基于图6的装置组成,该第一确定单元601包括:
第一获取子单元,被配置为执行若该搜索请求为第二搜索请求,获取该搜索请求携带的该搜索词,该第二搜索请求基于在搜索输入框中的输入操作生成;
选择子单元,被配置为执行从历史浏览记录中,选择与该搜索词关联的多媒体资源为该第一多媒体资源。
在一种可能实施方式中,该选择子单元被配置为执行:
从该历史浏览记录中,选择内容标签包括该搜索词且时间戳最新的多媒体资源为该第一多媒体资源。
在一种可能实施方式中,该选择子单元被配置为执行:
从该历史浏览记录中,选择与该搜索词之间相似度最高的多媒体资源为该第一多媒体资源。
在一种可能实施方式中,基于图6的装置组成,该第二确定单元603包括:
确定子单元,被配置为执行基于该搜索词特征、该第一资源特征和该多个候选多媒体资源的第二资源特征,从该多个候选多媒体资源中确定至少一个第三多媒体资源,该第三多媒体资源与该搜索词和该第一多媒体资源之间的相似度符合第一目标条件;
第二获取子单元,被配置为执行获取该至少一个第三多媒体资源的目标行为参数,该目标行为参数用于表征账号对该第三多媒体资源发生目标行为的可能性;
第三获取子单元,被配置为执行从该至少一个第三多媒体资源中,获取目标行为参数符合第二目标条件的第三多媒体资源为该至少一个第二多媒体资源。
在一种可能实施方式中,基于图6的装置组成,该确定子单元包括:
获取子子单元,被配置为执行对该多个候选多媒体资源中的任一候选多媒体资源,获取该搜索词特征与该候选多媒体资源的第二资源特征之间的第一相似度;
该获取子子单元,还被配置为执行获取该第一资源特征和该候选多媒体资源的第二资源特征之间的第二相似度;
加权子子单元,被配置为执行对该第一相似度和该第二相似度进行加权,得到第三相似度;
确定子子单元,被配置为执行在该第三相似度符合该第一目标条件的情况下,确定该候选多媒体资源为第三多媒体资源。
在一种可能实施方式中,该确定子子单元被配置为执行:
基于第三相似度从大到小的顺序对该多个候选多媒体资源进行排序;
若该候选多媒体资源在该排序中位于前第一目标位,确定该候选多媒体资源为第三多媒体资源。
在一种可能实施方式中,该确定子子单元被配置为执行:
若该第三相似度大于相似阈值,确定该候选多媒体资源为第三多媒体资源。
在一种可能实施方式中,该第二获取子单元被配置为执行:
对该至少一个第三多媒体资源中的任一第三多媒体资源,将该搜索词特征、该第一资源特征和该第三多媒体资源的第二资源特征输入目标行为模型,该目标行为模型用于获取输入多媒体资源的目标行为参数;
通过该目标行为模型对该搜索词特征、该第一资源特征和该第三多媒体资源的第二资源特征进行加权,得到目标行为特征;
对该目标行为特征进行指数归一化,得到该目标行为参数。
在一种可能实施方式中,该第三获取子单元被配置为执行:
基于目标行为参数从大到小的顺序对该至少一个第三多媒体资源进行排序,选择排序位于前第二目标位的第三多媒体资源为该至少一个第二多媒体资源。
在一种可能实施方式中,该第三获取子单元被配置为执行:
从该至少一个第三多媒体资源中,选择目标行为参数大于行为参数阈值的第三多媒体资源为该至少一个第二多媒体资源。
在一种可能实施方式中,该目标行为参数包括:点击行为参数、点赞行为参数、转发行为参数、评论行为参数或收藏行为参数中至少一项。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
关于上述实施例中的装置,其中各个单元执行操作的具体方式已经在有关该资源搜索方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图7是根据一示例性实施例示出的一种资源搜索装置的逻辑结构框图,参照图7,该装置包括发送单元701、接收单元702和显示单元703。
发送单元701,被配置为执行发送携带搜索词的搜索请求;
接收单元702,被配置为执行接收基于该搜索请求返回的至少一个第二多媒体资源,该第二多媒体资源与该搜索词和第一多媒体资源均关联,该第一多媒体资源与该搜索词关联;
显示单元703,被配置为执行显示该至少一个第二多媒体资源。
本公开实施例提供的装置,通过发送搜索请求之后,接收到的各个第二多媒体资源不仅与搜索词关联,而且与第一多媒体资源也关联,避免了与搜索词关联但与第一多媒体资源无关的这一类多媒体资源出现在搜索结果中,从而获取到了更加准确的搜索结果,提高了搜索行为的搜索准确度。
在一种可能实施方式中,该发送单元701被配置为执行:
在该第一多媒体资源的播放界面中显示该第一多媒体资源的多个内容标签;
响应于对该多个内容标签中任一内容标签的触发操作,发送携带该内容标签和该第一多媒体资源的资源标识的该搜索请求。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
关于上述实施例中的装置,其中各个单元执行操作的具体方式已经在有关该资源搜索方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图8示出了本公开一个示例性实施例提供的一种终端的结构框图,该终端也即是计算机设备的一种示例性说明。该终端800可以是:智能手机、平板电脑、MP3播放器(MovingPicture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端800还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端800包括有:处理器801和存储器802。
处理器801可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器801可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器801也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器801可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器801还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器802可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器802还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器802中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器801所执行以实现本公开中各个实施例提供的资源搜索方法。
在一些实施例中,终端800还可选包括有:外围设备接口803和至少一个外围设备。处理器801、存储器802和外围设备接口803之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口803相连。具体地,外围设备包括:射频电路804、触摸显示屏805、摄像头组件806、音频电路807、定位组件808和电源809中的至少一种。
外围设备接口803可被用于将I/O(Input /Output,输入/输出)相关的至少一个外围设备连接到处理器801和存储器802。在一些实施例中,处理器801、存储器802和外围设备接口803被集成在同一芯片或电路板上;在一些其他实施例中,处理器801、存储器802和外围设备接口803中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路804用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路804通过电磁信号与通信网络以及其他通信设备进行通信。射频电路804将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路804包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路804可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路804还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本公开对此不加以限定。
显示屏805用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏805是触摸显示屏时,显示屏805还具有采集在显示屏805的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器801进行处理。此时,显示屏805还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏805可以为一个,设置终端800的前面板;在另一些实施例中,显示屏805可以为至少两个,分别设置在终端800的不同表面或呈折叠设计;在再一些实施例中,显示屏805可以是柔性显示屏,设置在终端800的弯曲表面上或折叠面上。甚至,显示屏805还可以设置成非矩形的不规则图形,也即异形屏。显示屏805可以采用LCD(LiquidCrystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件806用于采集图像或视频。可选地,摄像头组件806包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件806还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路807可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器801进行处理,或者输入至射频电路804以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端800的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器801或射频电路804的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路807还可以包括耳机插孔。
定位组件808用于定位终端800的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件808可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。
电源809用于为终端800中的各个组件进行供电。电源809可以是交流电、直流电、一次性电池或可充电电池。当电源809包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端800还包括有一个或多个传感器810。该一个或多个传感器810包括但不限于:加速度传感器811、陀螺仪传感器812、压力传感器813、指纹传感器814、光学传感器815以及接近传感器816。
加速度传感器811可以检测以终端800建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器811可以用于检测重力加速度在三个坐标轴上的分量。处理器801可以根据加速度传感器811采集的重力加速度信号,控制触摸显示屏805以横向视图或纵向视图进行用户界面的显示。加速度传感器811还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器812可以检测终端800的机体方向及转动角度,陀螺仪传感器812可以与加速度传感器811协同采集用户对终端800的3D动作。处理器801根据陀螺仪传感器812采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器813可以设置在终端800的侧边框和/或触摸显示屏805的下层。当压力传感器813设置在终端800的侧边框时,可以检测用户对终端800的握持信号,由处理器801根据压力传感器813采集的握持信号进行左右手识别或快捷操作。当压力传感器813设置在触摸显示屏805的下层时,由处理器801根据用户对触摸显示屏805的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器814用于采集用户的指纹,由处理器801根据指纹传感器814采集到的指纹识别用户的身份,或者,由指纹传感器814根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器801授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器814可以被设置终端800的正面、背面或侧面。当终端800上设置有物理按键或厂商Logo时,指纹传感器814可以与物理按键或厂商Logo集成在一起。
光学传感器815用于采集环境光强度。在一个实施例中,处理器801可以根据光学传感器815采集的环境光强度,控制触摸显示屏805的显示亮度。具体地,当环境光强度较高时,调高触摸显示屏805的显示亮度;当环境光强度较低时,调低触摸显示屏805的显示亮度。在另一个实施例中,处理器801还可以根据光学传感器815采集的环境光强度,动态调整摄像头组件806的拍摄参数。
接近传感器816,也称距离传感器,通常设置在终端800的前面板。接近传感器816用于采集用户与终端800的正面之间的距离。在一个实施例中,当接近传感器816检测到用户与终端800的正面之间的距离逐渐变小时,由处理器801控制触摸显示屏805从亮屏状态切换为息屏状态;当接近传感器816检测到用户与终端800的正面之间的距离逐渐变大时,由处理器801控制触摸显示屏805从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图8中示出的结构并不构成对终端800的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
图9是本公开实施例提供的一种一种服务器的结构示意图,该服务器900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(Central ProcessingUnits,CPU)901和一个或一个以上的存储器902,其中,该存储器902中存储有至少一条程序代码,该至少一条程序代码由该处理器901加载并执行以实现上述各个实施例提供的资源搜索方法。当然,该服务器900还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器900还可以包括其他用于实现设备功能的部件,在此不做赘述。
在示例性实施例中,还提供了一种包括至少一条指令的计算机可读存储介质,例如包括至少一条指令的存储器,上述至少一条指令可由计算机设备中的处理器执行以完成上述实施例中的资源搜索方法。可选地,上述计算机可读存储介质可以是非临时性计算机可读存储介质,例如,该非临时性计算机可读存储介质可以包括ROM(Read-Only Memory,只读存储器)、RAM(Random-Access Memory,随机存取存储器)、CD-ROM(Compact Disc Read-Only Memory,只读光盘)、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供了一种计算机程序产品,包括一条或多条指令,该一条或多条指令可以由计算机设备的处理器执行,以完成上述各个实施例提供的资源搜索方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (26)
1.一种资源搜索方法,其特征在于,包括:
响应于基于对内容标签的触发操作生成的第一搜索请求,从所述第一搜索请求的搜索词字段中获取所述内容标签;
从所述第一搜索请求的资源标识字段中获取资源标识,将所述资源标识所指示的多媒体资源确定为第一多媒体资源,所述第一多媒体资源的播放界面中显示有所述内容标签;
对所述内容标签进行嵌入处理,得到搜索词特征;
将所述第一多媒体资源的详情信息和所述第一多媒体资源的关键帧输入到特征提取模型中,所述特征提取模型包括词向量子模型和深度神经网络DNN子模型,所述详情信息包括所述第一多媒体资源的标题、简介、摘要、发布者昵称、发布者账号或内容标签中的至少一项组成的文本;
通过所述词向量子模型提取得到所述详情信息的嵌入特征;
通过所述DNN子模型提取得到所述关键帧的图像特征;
将所述详情信息的嵌入特征和所述关键帧的图像特征拼接后输入到全连接层中,通过所述全连接层提取得到所述第一多媒体资源的第一资源特征,所述第一资源特征为所述详情信息和所述关键帧之间的融合特征;
对多个候选多媒体资源中的任一候选多媒体资源,获取所述搜索词特征与所述候选多媒体资源的第二资源特征之间的第一相似度;
获取所述第一资源特征和所述候选多媒体资源的第二资源特征之间的第二相似度;
将所述第一相似度与第一系数相乘,得到第一数值,所述第一系数表征所述第一相似度在第三相似度中所占的比重;
将所述第二相似度与第二系数相乘,得到第二数值,所述第二系数表征所述第二相似度在所述第三相似度中所占的比重,所述第二系数与所述第一系数之间的和值等于1;
将所述第一数值与所述第二数值相加,得到所述第三相似度;
在所述第三相似度符合第一目标条件的情况下,确定所述候选多媒体资源为第三多媒体资源;
发送从至少一个第三多媒体资源中筛选得到的至少一个第二多媒体资源,所述第二多媒体资源与所述内容标签和所述第一多媒体资源均关联。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应于第二搜索请求,获取所述第二搜索请求携带的搜索词,所述第二搜索请求基于在搜索输入框中的输入操作生成;
从历史浏览记录中,选择与所述搜索词关联的多媒体资源为所述第一多媒体资源。
3.根据权利要求2所述的方法,其特征在于,所述从历史浏览记录中,选择与所述搜索词关联的多媒体资源为所述第一多媒体资源包括:
从所述历史浏览记录中,选择内容标签包括所述搜索词且时间戳最新的多媒体资源为所述第一多媒体资源。
4.根据权利要求2所述的方法,其特征在于,所述从历史浏览记录中,选择与所述搜索词关联的多媒体资源为所述第一多媒体资源包括:
从所述历史浏览记录中,选择与所述搜索词之间相似度最高的多媒体资源为所述第一多媒体资源。
5.根据权利要求1所述的方法,其特征在于,所述在所述第三相似度符合所述第一目标条件的情况下,确定所述候选多媒体资源为第三多媒体资源包括:
基于第三相似度从大到小的顺序对所述多个候选多媒体资源进行排序;
若所述候选多媒体资源在所述排序中位于前第一目标位,确定所述候选多媒体资源为第三多媒体资源。
6.根据权利要求1所述的方法,其特征在于,所述在所述第三相似度符合所述第一目标条件的情况下,确定所述候选多媒体资源为第三多媒体资源包括:
若所述第三相似度大于相似阈值,确定所述候选多媒体资源为第三多媒体资源。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述至少一个第三多媒体资源的目标行为参数,所述目标行为参数用于表征账号对所述第三多媒体资源发生目标行为的可能性;
从所述至少一个第三多媒体资源中,获取目标行为参数符合第二目标条件的第三多媒体资源为所述至少一个第二多媒体资源。
8.根据权利要求7所述的方法,其特征在于,所述获取所述至少一个第三多媒体资源的目标行为参数包括:
对所述至少一个第三多媒体资源中的任一第三多媒体资源,将所述搜索词特征、所述第一资源特征和所述第三多媒体资源的第二资源特征输入目标行为模型,所述目标行为模型用于获取输入多媒体资源的目标行为参数;
通过所述目标行为模型对所述搜索词特征、所述第一资源特征和所述第三多媒体资源的第二资源特征进行加权,得到目标行为特征;
对所述目标行为特征进行指数归一化,得到所述目标行为参数。
9.根据权利要求7所述的方法,其特征在于,所述从所述至少一个第三多媒体资源中,获取目标行为参数符合第二目标条件的第三多媒体资源为所述至少一个第二多媒体资源包括:
基于目标行为参数从大到小的顺序对所述至少一个第三多媒体资源进行排序,选择排序位于前第二目标位的第三多媒体资源为所述至少一个第二多媒体资源。
10.根据权利要求7所述的方法,其特征在于,所述从所述至少一个第三多媒体资源中,获取目标行为参数符合第二目标条件的第三多媒体资源为所述至少一个第二多媒体资源包括:
从所述至少一个第三多媒体资源中,选择目标行为参数大于行为参数阈值的第三多媒体资源为所述至少一个第二多媒体资源。
11.根据权利要求7所述的方法,其特征在于,所述目标行为参数包括:点击行为参数、点赞行为参数、转发行为参数、评论行为参数或收藏行为参数中至少一项。
12.一种资源搜索方法,其特征在于,包括:
在第一多媒体资源的播放界面中显示所述第一多媒体资源的多个内容标签;
响应于对所述多个内容标签中任一内容标签的触发操作,发送携带所述内容标签和所述第一多媒体资源的资源标识的第一搜索请求,其中,所述内容标签封装在所述第一搜索请求的搜索词字段,所述资源标识封装在所述第一搜索请求的资源标识字段;
接收基于所述第一搜索请求返回的至少一个第二多媒体资源,所述第二多媒体资源与所述内容标签和所述第一多媒体资源均关联,所述第二多媒体资源从至少一个第三多媒体资源中筛选得到,所述第三多媒体资源为第三相似度符合第一目标条件的候选多媒体资源,所述第三相似度由第一数值和第二数值相加得到,所述第一数值为第一相似度与第一系数的相乘得到的数值,所述第二数值为第二相似度与第二系数相乘得到的数值,所述第一系数表征所述第一相似度在第三相似度中所占的比重,所述第二系数表征所述第二相似度在所述第三相似度中所占的比重,所述第二系数与所述第一系数之间的和值等于1,所述第一相似度为搜索词特征与所述候选多媒体资源的第二资源特征之间的相似度,所述第二相似度为第一资源特征和所述候选多媒体资源的第二资源特征之间的相似度,所述搜索词特征基于对所述内容标签的嵌入处理得到,所述第一资源特征为所述第一多媒体资源的详情信息和所述第一多媒体资源的关键帧之间的融合特征,所述第一资源特征通过特征提取模型基于所述详情信息和所述关键帧提取得到,所述特征提取模型包括词向量子模型和深度神经网络DNN子模型,所述词向量子模型用于提取所述详情信息的嵌入特征,所述DNN子模型用于提取所述关键帧的图像特征,所述第一资源特征为全连接层对所述详情信息的嵌入特征和所述关键帧的图像特征拼接后的特征提取得到,所述详情信息包括所述第一多媒体资源的标题、简介、摘要、发布者昵称、发布者账号或内容标签中的至少一项组成的文本;
显示所述至少一个第二多媒体资源。
13.一种资源搜索装置,其特征在于,包括:
第一确定单元,被配置为执行响应于基于对内容标签的触发操作生成的第一搜索请求,从所述第一搜索请求的搜索词字段中获取所述内容标签;从所述第一搜索请求的资源标识字段中获取资源标识,将所述资源标识所指示的多媒体资源确定为第一多媒体资源,所述第一多媒体资源的播放界面中显示有所述内容标签;
获取单元,被配置为执行对所述内容标签进行嵌入处理,得到搜索词特征;将所述第一多媒体资源的详情信息和所述第一多媒体资源的关键帧输入到特征提取模型中,所述特征提取模型包括词向量子模型和深度神经网络DNN子模型,所述详情信息包括所述第一多媒体资源的标题、简介、摘要、发布者昵称、发布者账号或内容标签中的至少一项组成的文本;通过所述词向量子模型提取得到所述详情信息的嵌入特征;通过所述DNN子模型提取得到所述关键帧的图像特征;将所述详情信息的嵌入特征和所述关键帧的图像特征拼接后输入到全连接层中,通过所述全连接层提取得到所述第一多媒体资源的第一资源特征,所述第一资源特征为所述详情信息和所述关键帧之间的融合特征;
第二确定单元,包括确定子单元,其中所述确定子单元包括获取子子单元、加权子子单元和确定子子单元;
所述获取子子单元,被配置为执行对多个候选多媒体资源中的任一候选多媒体资源,获取所述搜索词特征与所述候选多媒体资源的第二资源特征之间的第一相似度;获取所述第一资源特征和所述候选多媒体资源的第二资源特征之间的第二相似度;
所述加权子子单元,被配置为执行将所述第一相似度与第一系数相乘,得到第一数值,所述第一系数表征所述第一相似度在第三相似度中所占的比重;将所述第二相似度与第二系数相乘,得到第二数值,所述第二系数表征所述第二相似度在所述第三相似度中所占的比重,所述第二系数与所述第一系数之间的和值等于1;将所述第一数值与所述第二数值相加,得到所述第三相似度;
确定子子单元,被配置为执行在所述第三相似度符合第一目标条件的情况下,确定所述候选多媒体资源为第三多媒体资源;
发送单元,被配置为执行发送从至少一个第三多媒体资源中筛选得到的至少一个第二多媒体资源,所述第二多媒体资源与所述内容标签和所述第一多媒体资源均关联。
14.根据权利要求13所述的装置,其特征在于,所述第一确定单元包括:
第一获取子单元,被配置为执行响应于第二搜索请求,获取所述第二搜索请求携带的所述搜索词,所述第二搜索请求基于在搜索输入框中的输入操作生成;
选择子单元,被配置为执行从历史浏览记录中,选择与所述搜索词关联的多媒体资源为所述第一多媒体资源。
15.根据权利要求14所述的装置,其特征在于,所述选择子单元被配置为执行:
从所述历史浏览记录中,选择内容标签包括所述搜索词且时间戳最新的多媒体资源为所述第一多媒体资源。
16.根据权利要求14所述的装置,其特征在于,所述选择子单元被配置为执行:
从所述历史浏览记录中,选择与所述搜索词之间相似度最高的多媒体资源为所述第一多媒体资源。
17.根据权利要求13所述的装置,其特征在于,所述确定子子单元被配置为执行:
基于第三相似度从大到小的顺序对所述多个候选多媒体资源进行排序;
若所述候选多媒体资源在所述排序中位于前第一目标位,确定所述候选多媒体资源为第三多媒体资源。
18.根据权利要求13所述的装置,其特征在于,所述确定子子单元被配置为执行:
若所述第三相似度大于相似阈值,确定所述候选多媒体资源为第三多媒体资源。
19.根据权利要求13所述的装置,其特征在于,所述第二确定单元还包括:
第二获取子单元,被配置为执行获取所述至少一个第三多媒体资源的目标行为参数,所述目标行为参数用于表征账号对所述第三多媒体资源发生目标行为的可能性;
第三获取子单元,被配置为执行从所述至少一个第三多媒体资源中,获取目标行为参数符合第二目标条件的第三多媒体资源为至少一个第二多媒体资源。
20.根据权利要求19所述的装置,其特征在于,所述第二获取子单元被配置为执行:
对所述至少一个第三多媒体资源中的任一第三多媒体资源,将所述搜索词特征、所述第一资源特征和所述第三多媒体资源的第二资源特征输入目标行为模型,所述目标行为模型用于获取输入多媒体资源的目标行为参数;
通过所述目标行为模型对所述搜索词特征、所述第一资源特征和所述第三多媒体资源的第二资源特征进行加权,得到目标行为特征;
对所述目标行为特征进行指数归一化,得到所述目标行为参数。
21.根据权利要求19所述的装置,其特征在于,所述第三获取子单元被配置为执行:
基于目标行为参数从大到小的顺序对所述至少一个第三多媒体资源进行排序,选择排序位于前第二目标位的第三多媒体资源为所述至少一个第二多媒体资源。
22.根据权利要求19所述的装置,其特征在于,所述第三获取子单元被配置为执行:
从所述至少一个第三多媒体资源中,选择目标行为参数大于行为参数阈值的第三多媒体资源为所述至少一个第二多媒体资源。
23.根据权利要求19所述的装置,其特征在于,所述目标行为参数包括:点击行为参数、点赞行为参数、转发行为参数、评论行为参数或收藏行为参数中至少一项。
24.一种资源搜索装置,其特征在于,包括:
发送单元,被配置为执行在第一多媒体资源的播放界面中显示所述第一多媒体资源的多个内容标签;响应于对所述多个内容标签中任一内容标签的触发操作,发送携带所述内容标签和所述第一多媒体资源的资源标识的第一搜索请求;其中,所述内容标签封装在所述第一搜索请求的搜索词字段,所述资源标识封装在所述第一搜索请求的资源标识字段;
接收单元,被配置为执行接收基于所述第一搜索请求返回的至少一个第二多媒体资源,所述第二多媒体资源与所述内容标签和所述第一多媒体资源均关联,所述第二多媒体资源从至少一个第三多媒体资源中筛选得到,所述第三多媒体资源为第三相似度符合第一目标条件的候选多媒体资源,所述第三相似度由第一数值和第二数值相加得到,所述第一数值为第一相似度与第一系数的相乘得到的数值,所述第二数值为第二相似度与第二系数相乘得到的数值,所述第一系数表征所述第一相似度在第三相似度中所占的比重,所述第二系数表征所述第二相似度在所述第三相似度中所占的比重,所述第二系数与所述第一系数之间的和值等于1,所述第一相似度为搜索词特征与所述候选多媒体资源的第二资源特征之间的相似度,所述第二相似度为第一资源特征和所述候选多媒体资源的第二资源特征之间的相似度,所述搜索词特征基于对所述内容标签的嵌入处理得到,所述第一资源特征为所述第一多媒体资源的详情信息和所述第一多媒体资源的关键帧之间的融合特征,所述第一资源特征通过特征提取模型基于所述详情信息和所述关键帧提取得到,所述特征提取模型包括词向量子模型和深度神经网络DNN子模型,所述词向量子模型用于提取所述详情信息的嵌入特征,所述DNN子模型用于提取所述关键帧的图像特征,所述第一资源特征为全连接层对所述详情信息的嵌入特征和所述关键帧的图像特征拼接后的特征提取得到,所述详情信息包括所述第一多媒体资源的标题、简介、摘要、发布者昵称、发布者账号或内容标签中的至少一项组成的文本;
显示单元,被配置为执行显示所述至少一个第二多媒体资源。
25.一种计算机设备,其特征在于,包括:
一个或多个处理器;
用于存储所述一个或多个处理器可执行指令的一个或多个存储器;
其中,所述一个或多个处理器被配置为执行所述指令,以实现如权利要求1至权利要求11中任一项或权利要求12所述的资源搜索方法。
26.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的至少一条指令由计算机设备的一个或多个处理器执行时,使得所述计算机设备能够执行如权利要求1至权利要求11中任一项或权利要求12所述的资源搜索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110936767.5A CN113377976B (zh) | 2021-08-16 | 2021-08-16 | 资源搜索方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110936767.5A CN113377976B (zh) | 2021-08-16 | 2021-08-16 | 资源搜索方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113377976A CN113377976A (zh) | 2021-09-10 |
CN113377976B true CN113377976B (zh) | 2022-09-09 |
Family
ID=77577205
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110936767.5A Active CN113377976B (zh) | 2021-08-16 | 2021-08-16 | 资源搜索方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113377976B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114625897B (zh) * | 2022-03-21 | 2024-08-20 | 腾讯科技(深圳)有限公司 | 多媒体资源处理方法、装置、电子设备及存储介质 |
CN117573897A (zh) * | 2023-10-16 | 2024-02-20 | 百度在线网络技术(北京)有限公司 | 多媒体资源检索方法、装置、设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111708942A (zh) * | 2020-06-12 | 2020-09-25 | 北京达佳互联信息技术有限公司 | 多媒体资源推送方法、装置、服务器及存储介质 |
CN113094522A (zh) * | 2021-06-09 | 2021-07-09 | 北京达佳互联信息技术有限公司 | 多媒体资源处理方法、装置、电子设备及存储介质 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9852188B2 (en) * | 2014-06-23 | 2017-12-26 | Google Llc | Contextual search on multimedia content |
CN110069698B (zh) * | 2017-11-01 | 2021-09-03 | 北京京东尚科信息技术有限公司 | 信息推送方法和装置 |
CN110909182B (zh) * | 2019-11-29 | 2023-05-09 | 北京达佳互联信息技术有限公司 | 多媒体资源搜索方法、装置、计算机设备及存储介质 |
CN113495965A (zh) * | 2020-04-08 | 2021-10-12 | 百度在线网络技术(北京)有限公司 | 一种多媒体内容检索方法、装置、设备及存储介质 |
CN111414498B (zh) * | 2020-04-29 | 2023-03-21 | 抖音视界有限公司 | 多媒体信息推荐方法、装置及电子设备 |
CN111611490A (zh) * | 2020-05-25 | 2020-09-01 | 北京达佳互联信息技术有限公司 | 资源搜索方法、装置、设备及存储介质 |
CN111797308B (zh) * | 2020-06-16 | 2023-11-28 | 北京达佳互联信息技术有限公司 | 一种资源推荐方法、装置、电子设备及介质 |
CN111966899B (zh) * | 2020-08-12 | 2024-02-13 | 新华智云科技有限公司 | 搜索排序方法、系统及计算机可读存储介质 |
CN112364204B (zh) * | 2020-11-12 | 2024-03-12 | 北京达佳互联信息技术有限公司 | 视频搜索方法、装置、计算机设备及存储介质 |
CN113094521A (zh) * | 2021-03-12 | 2021-07-09 | 北京达佳互联信息技术有限公司 | 一种多媒体资源搜索方法、装置、系统、设备及存储介质 |
CN113111286B (zh) * | 2021-05-12 | 2023-07-18 | 抖音视界有限公司 | 一种信息展示的方法、装置以及计算机存储介质 |
-
2021
- 2021-08-16 CN CN202110936767.5A patent/CN113377976B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111708942A (zh) * | 2020-06-12 | 2020-09-25 | 北京达佳互联信息技术有限公司 | 多媒体资源推送方法、装置、服务器及存储介质 |
CN113094522A (zh) * | 2021-06-09 | 2021-07-09 | 北京达佳互联信息技术有限公司 | 多媒体资源处理方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113377976A (zh) | 2021-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109740068B (zh) | 媒体数据推荐方法、装置及存储介质 | |
CN108304441B (zh) | 网络资源推荐方法、装置、电子设备、服务器及存储介质 | |
CN111866607B (zh) | 视频片段定位方法、装置、计算机设备及存储介质 | |
CN110471858B (zh) | 应用程序测试方法、装置及存储介质 | |
CN111737573A (zh) | 资源推荐方法、装置、设备及存储介质 | |
CN111611490A (zh) | 资源搜索方法、装置、设备及存储介质 | |
CN111897996A (zh) | 话题标签推荐方法、装置、设备及存储介质 | |
CN111291200B (zh) | 多媒体资源展示方法、装置、计算机设备及存储介质 | |
CN110572716B (zh) | 多媒体数据播放方法、装置及存储介质 | |
CN111432245B (zh) | 多媒体信息的播放控制方法、装置、设备及存储介质 | |
CN111339938A (zh) | 信息交互方法、装置、设备及存储介质 | |
CN111782950A (zh) | 样本数据集获取方法、装置、设备及存储介质 | |
CN113377976B (zh) | 资源搜索方法、装置、计算机设备及存储介质 | |
CN111031391A (zh) | 视频配乐方法、装置、服务器、终端及存储介质 | |
CN114154068A (zh) | 媒体内容推荐方法、装置、电子设备及存储介质 | |
CN113918767A (zh) | 视频片段定位方法、装置、设备及存储介质 | |
CN112131473B (zh) | 信息推荐方法、装置、设备及存储介质 | |
CN113886609A (zh) | 多媒体资源推荐方法、装置、电子设备及存储介质 | |
CN111416996B (zh) | 多媒体文件检测方法、播放方法、装置、设备及存储介质 | |
CN113987326B (zh) | 资源推荐方法、装置、计算机设备及介质 | |
CN111984803A (zh) | 多媒体资源处理方法、装置、计算机设备及存储介质 | |
CN113032587A (zh) | 多媒体信息推荐方法、系统、装置、终端和服务器 | |
CN114547429A (zh) | 数据推荐方法、装置、服务器及存储介质 | |
CN111563201A (zh) | 内容推送方法、装置、服务器及存储介质 | |
CN114385854A (zh) | 资源推荐方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |