CN102655584B - 一种远程呈现技术中媒体数据发送和播放的方法及系统 - Google Patents
一种远程呈现技术中媒体数据发送和播放的方法及系统 Download PDFInfo
- Publication number
- CN102655584B CN102655584B CN201110053344.5A CN201110053344A CN102655584B CN 102655584 B CN102655584 B CN 102655584B CN 201110053344 A CN201110053344 A CN 201110053344A CN 102655584 B CN102655584 B CN 102655584B
- Authority
- CN
- China
- Prior art keywords
- data
- bit stream
- video
- audio
- multichannel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/15—Conference systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/236—Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
- H04N21/2365—Multiplexing of several video streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/4302—Content synchronisation processes, e.g. decoder synchronisation
- H04N21/4307—Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen
- H04N21/43072—Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen of multiple content streams on the same device
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Telephonic Communication Services (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种远程呈现技术中媒体数据发送的方法及系统,通过采集与坐席相对应的视频或音频数据,对采集到的数据分别进行处理,得到根据采集位置区分的多路码流数据和对应的采集位置信息;对多路码流数据进行编码,并把编码后的多路音频数据和所述采集位置信息统一打包,和/或编码后的多路视频数据和所述采集位置信息统一打包,分别发送包含多路音频或视频的数据包。本发明还公开了一种远程呈现技术中媒体数据播放的方法及系统,通过上述方法和系统,能够在数据传输的过程中直接标识相应的采集位置,即对应的播放位置,使得接收端的与会者可以体验到听声辨位,身临其境的感受。进一步的,有效解决了多路音频或视频数据之间的同步问题。
Description
技术领域
本发明涉及视频会议技术,特别是指一种远程呈现技术中媒体数据发送和播放的方法及系统。
背景技术
远程呈现(telepresence)是一种高级的远程会议系统。远程呈现以其真实的临场感深受高端用户的喜爱,在远程呈现系统中,听声辨位、真身大小、眼神交流直接关系到用户是否能够有身临其境的感受,因此是衡量远程呈现系统非常重要的技术指标。在传统视频会议系统中,每个会场听到的声音是整个会议中前几个声音最大的会场混音叠加后的声音,每个会场声音的输入源和输出只有一个,用户无法感受到声音从会场的哪个方位发出。
在远程呈现会议系统中,各个会场有的是单屏会场有的是多屏会场。多屏会场中,每个屏幕显示一处坐席与会者的图像,相应的每处坐席与会者对应了一路音频输入。如果要达到听声辨位的效果,在多屏会场中,发言者图像显示在会场哪个屏,声音即从该屏所在方位发出,即实现声音跟随图像。例如三屏会场中,左席发言,那么应该听到声音从左侧发出;中席发言,其应该听到声音从中间发出;右席发言,与会人员应该听到声音从右侧发出。
这种情况下,不同方位的音频输入输出,需要区别对待进行不同的混音,传统的单路音频混音方法显然不能满足这种情况。同时在单屏和多屏会场互通的多点会议中,单屏和多屏会场如何混音输出,同时不影响两个会场听声辨位的效果,也是需要解决的问题。进一步的,若采用多路码流分别传输的方式,则多路码流之间的严格同步非常困难,难以达到视频会议对音频的同步要求。
发明内容
有鉴于此,本发明的主要目的在于提供一种远程呈现技术中媒体数据发送和播放的方法及系统,解决了现有的电视会议系统中,采用多路码流分别传输的方式来传输媒体数据,不易实现音频同步或视频同步的问题。
为达到上述目的,本发明的技术方案是这样实现的:
本发明提供了一种远程呈现技术中媒体数据发送的方法,所述方法包括:
采集与坐席相对应的音频或视频数据,对采集到的音频或视频数据分别进行处理,得到根据采集位置区分的多路码流数据和各路码流数据的采集位置信息;
对多路码流数据进行编码,并把编码后的多路音频数据和所述采集位置信息统一打包,和/或编码后的多路视频数据和所述采集位置信息统一打包,分别发送包含多路音频或视频的数据包。
其中,所述包含多路音频或视频的数据包,包括:数据包头部分和数据包体部分,其中,数据包头部分携带每一路的音频或视频数据的码流标识,并且标明码流长度,所述码流标识对应所述采集位置信息;数据包体部分携带多路码流数据的内容。
其中,所述对采集到的音频或视频数据分别进行处理,具体为:将每一个采集位置采集到的音频或视频数据都分别处理为一路码流数据。
本发明还提供了一种远程呈现技术中媒体数据播放的方法,所述方法包括:
接收端接收到包含多路音频或视频的数据包后,解析出多路音频数据或视频数据,以及各路码流数据的采集位置信息;
将多路音频数据或视频数据,按照各路码流数据的采集位置信息所对应的播放位置输出完成播放。
其中,所述解析出多路音频数据或视频数据,以及各路码流数据的采集位置信息,具体为:读取数据包头部分的码流标识得到码流数据的采集位置信息,根据码流长度,从数据包体部分解析出相应的多路音频数据或视频数据。
本发明还提供了一种远程呈现技术中媒体数据发送的系统,所述系统包括:一个或多个音视频采集设备、多路码流数据处理模块和多路码流数据传输模块,其中,
所述一个或多个音视频采集设备,用于分别采集与坐席相对应的音频或视频数据,将采集到的数据发送给多路码流数据处理模块;
所述多路码流数据处理模块,用于对采集到的音频或视频数据分别进行处理,得到根据采集位置区分的多路码流数据和各路码流数据的采集位置信息,将多路码流数据和所述采集位置信息发送给多路码流数据传输模块;
所述多路码流数据传输模块,用于对多路码流数据进行编码,并把编码后的多路音频数据和所述采集位置信息统一打包,和/或编码后的多路视频数据和所述采集位置信息统一打包,分别发送包含多路音频或视频的数据包。
其中,所述包含多路音频或视频的数据包,包括:数据包头部分和数据包体部分,其中,数据包头部分携带每一路的音频或视频数据的码流标识,并且标明码流长度,所述码流标识对应所述采集位置信息;数据包体部分携带多路码流数据的内容。
其中,所述多路码流数据处理模块对采集到的音频或视频数据分别进行处理,具体为:将每一个采集位置采集到的音频或视频数据都分别处理为一路码流数据。
本发明还提供了一种远程呈现技术中媒体数据播放的系统,所述系统包括:多个音视频播放设备、多路码流数据处理模块和多路码流数据传输模块,其中,
多路码流数据传输模块,用于接收并解析发送端的多路码流数据传输模块发送的包含多路音频或视频的数据包,将解析出的多路音频数据或视频数据,以及各路码流数据的采集位置信息,发送给接收端的多路码流数据处理模块;
多路码流数据处理模块,用于将多路音频数据或视频数据,发送给各路码流数据的采集位置信息所对应的音视频播放设备完成播放。
本发明所提供的远程呈现技术中媒体数据发送和播放的方法及系统,采集与坐席相对应的视频或音频数据,对采集到的视频或音频数据分别进行处理,得到根据采集位置区分的多路码流数据和各路码流数据的采集位置信息;对多路码流数据进行编码,并把编码后的多路音频数据和所述采集位置信息统一打包,和/或编码后的多路视频数据和所述采集位置信息统一打包,分别发送包含多路音频或视频的数据包。能够在数据传输的过程中直接标识相应的采集位置,即对应的播放位置,使得接收端的与会者可以体验到听声辨位,身临其境的感受。进一步的,也不需要另外进行音频同步或视频同步。
附图说明
图1为本发明一种远程呈现技术中媒体数据发送和播放的方法流程示意图;
图2为本发明所述包含多路音频或视频的数据包的结构示意图;
图3为在三个单屏会场与一个多屏会场组网时应用本发明通信的音频视频码流走向示意图;
图4为两个三个单屏会场组网时应用本发明通信的音频视频码流走向示意图;
图5为本发明一种远程呈现技术中媒体数据发送和播放的系统结构示意图。
具体实施方式
本发明的基本思想是:采集与坐席相对应的视频或音频数据,对采集到的视频或音频数据分别进行处理,得到根据采集位置区分的多路码流数据和各路码流数据的采集位置信息;对多路码流数据进行编码,并把编码后的多路音频数据和所述采集位置信息统一打包,和/或编码后的多路视频数据和所述采集位置信息统一打包,分别发送包含多路音频或视频的数据包。
下面结合附图和具体实施例对本发明的技术方案进一步详细阐述。
图1为本发明一种远程呈现技术中媒体数据发送和播放的方法流程示意图,如图1所示,所述方法包括:
步骤101,采集与坐席相对应的音频或视频数据;
具体的,所述采集与坐席相对应的音频或视频数据,具体为:通过安装在不同采集位置上的视频采集设备和音频采集设备来完成。
步骤102,对采集到的音频或视频数据分别进行处理,得到根据采集位置区分的多路码流数据和各路码流数据的采集位置信息;
具体的,所述对采集到的音频或视频数据分别进行处理,具体为:将每一个采集位置采集到的视频或音频数据都分别处理为一路码流数据。其中,所述分别处理是根据采集位置的不同进行区分。例如:三屏会场中有左、中、右三个采集位置,针对左侧视频和音频采集设备采集到的数据,分别处理得到左侧视频码流数据和左侧音频码流数据,所述左侧音频码流数据即对应接收端播放的左声道;针对右侧视频和音频采集设备采集到的数据,分别处理得到右侧视频码流数据和右侧音频码流数据,所述右侧音频码流数据即对应接收端播放的右声道;针对中间视频和音频采集设备采集到的数据,分别处理得到中间视频码流数据和中间音频码流数据。其中,中间音频码流数据可以是对应接收端播放的中间声道,也可以同时对应接收端播放的左声道和右声道,对于与会者来说同时听到左右声道播放相同的声音,会感觉声音来自中间,即正前方。进一步的,针对多余3个屏幕的会场,则通过调整不同声道的音量大小,来体现音频数据的采集位置,原则上越接近于采集位置的声道的音量越大。
步骤103,对多路码流数据进行编码,并把编码后的多路音频数据和所述采集位置信息统一打包,和/或编码后的多路视频数据和所述采集位置信息统一打包,分别发送包含多路音频或视频的数据包。
具体的,所述多路码流数据进行编码,具体为:根据传输协议对多路码流进行编码。所述包含多路音频或视频的数据包,包括:在数据包头部分为每一路的视频或音频数据添加码流标识,并且标明码流长度,然后将码流数据的具体内容添加到数据包体部分。其中,所述添加的码流标识,用于对应码流数据各自的采集位置。图2为本发明所述包含多路音频或视频的数据包的结构示意图,如图2所示,数据包头21中包含:码流1标识22、码流1长度23、码流2标识24、码流2长度25。数据包体26中包含:码流1数据27和码流2数据28。在本发明的包含多路音频或视频的数据包中可以为多路码流分别添加码流标识,并标明码流长度,这样可以将多路码流打包为一个包含多路音频或视频的数据包,使得多路码流同步的问题得到很好的解决。进一步的,由于添加了对应采集位置信息的码流标识,因此可以在接收端依据采集位置还原音频数据的播放位置,实现了听声辨位。
在步骤103之后,接收端为了播放所述包含多路音频或视频的数据包,本方法还包括:
步骤104,接收端接收到包含多路音频或视频的数据包后,解析出多路音频数据或视频数据,以及各路码流数据的采集位置信息;
具体的,所述解析包含多路音频或视频的数据包,具体为:读取数据包头部分的码流标识得到码流数据的采集位置,根据码流长度,从数据包体部分解析出相应的多路音频数据或视频数据。
步骤105,将多路音频数据或视频数据,按照各路码流数据的采集位置信息所对应的播放位置输出完成播放。
具体的,将解析出的码流数据内容输出到会场中的对应的播放位置完成播放,则与会者可以得到听声辨位的体验。
图3为在三个单屏会场与一个多屏会场组网时应用本发明通信的音频视频码流走向示意图,如图3所示,3个单屏会场分别为:单屏会场31、单屏会场32和单屏会场33,所述三个单屏会场和1个三屏会场34进行组网,其中3个单屏会场的视频依次显示在三屏会场的左、中、右屏幕,各单屏会场可以选看三屏会场34的任一坐席视频。
首先三屏会场34中多个音频采集设备采集的音频码流,都输入到音频处理器设备,由音频处理器设备处理后分成左右两个声道的音频码流数据,再由负责三屏会场34的远程呈现多媒体终端对两个声道码流分别进行编码,并打包为包含多路音频的数据包进行发送。本实施例中以实时传送协议(Real-timeTransport Protocol,RTP)包结构为例,表1为包含多路音频或视频的数据包在RTP协议中的扩展结构。
表1
如表1所示,其中,标准的RTP头结构部分按照RFC3550定义的规范填充。扩展部分描述如下:
RTP H-Ext ID域用2个字节表示RTP扩展头标识,例如:赋值0x0011;
length域用2个字节表示扩展RTP头域的长度,一路码流的位置信息和长度一共占2个字节,因此通过填充和解析本域数值来获取后面一共含有几路码流;本实施例中以同一数据包中含左、右两路音频码流为例,因此length域的数值为4个字节;
posID1域用4个字节表示码流1的位置信息,例如:0001B表示左声道码流,0010B表示右声道码流,如果有多余2路码流可以用该域进行具体的区分;
length1表示posID1对应的码流的长度;
posID2域用4个字节表示码流2的位置信息;
length2表示posID2对应的码流的长度;
进一步的,表1中还有posID3和length3可以根据需要进一步扩展,来携带更多声道的音频数据码流。
RTP payload为数据体部分,按照posID1、posID2的顺序依次存放其对应的音频码流数据。
远程呈现系统多媒体终端按上述方式打包编码后的数据发送给多点处理单元(Multipoint Control Unit,MCU)35,由MCU35将包含多路音频的数据包发送给接收端。
3个单屏会场也可以按照上述方式编码打包各自的音频码流数据向MCU35发送;如果单屏会场没有音频处理器设备,可以由单屏会场各自的远程呈现系统多媒体终端直接发送左、右声道数据相同的包给MCU35。MCU35接收上述会场远程呈现系统多媒体终端发送的码流数据后,解析扩展的RTP数据包头可以获取各路码流数据对应的位置信息和码流长度,根据视频显示位置进行混音发送处理;例如本实施例中,MCU35把单屏会场31的音频码流数据混入到左声道数据中;单屏会场32的音频码流数据同时混入到左右声道数据中;单屏会场33的音频码流数据混入到右声道数据中,然后按照上述扩展的RTP数据包结构打包发送给三屏会场34的远程呈现系统多媒体终端。
MCU35把单屏会场32、单屏会场33、单屏会场34的音频码流数据中,左声道和右声道数据分别混音,然后按照上述扩展的RTP数据包结构发送码流给单屏会场31的远程呈现系统多媒体终端。单屏会场31的远程呈现系统多媒体终端接收数据包后解析出左、右声道码流位置信息和对应码流数据,分别解码,并把左、右声道数据分别通过音频处理器设备输出到左右音箱,达到听声辨位的效果。如果单屏会场只有一个音箱,则左右声道数据都输出到同一音箱。
MCU35把单屏会场31、单屏会场33、单屏会场34的音频码流数据中,左声道和右声道数据分别混音,然后按照上述扩展的RTP数据包结构发送码流给单屏会场32的远程呈现系统多媒体终端。单屏会场32的处理和上述单屏会场31处理方式相同。
MCU35把单屏会场31、单屏会场32、单屏会场34的音频码流数据中,左声道和右声道数据分别混音,然后按照上述扩展的RTP数据包结构发送码流给单屏会场33的远程呈现系统多媒体终端。单屏会场33的处理和上述单屏会场31处理方式相同。
进一步的,本实施例中的视频数据也可以按照上述方法打包为包含多路视频的数据包进行传输,其中,posID1、posID2可以标识出视频码流数据的采集位置,同样可以对应接收端会场中的多个屏幕的播放位置。特别需要说明的,对于单屏会场可以根据需要在解析出的多路码流视频数据间进行切换。
图4为两个三个单屏会场组网时应用本发明通信的音频视频码流走向示意图,如图4所示,两个三屏会场点对点进行组网,三屏会场41的左、中、右坐席的视频依次显示在三屏会场42的左、中、右屏幕,三屏会场42的左、中、右坐席的视频依次显示在三屏会场41的左、中、右屏幕。三屏会场41的多个音频采集设备采集的音频码流都输入到音频处理器设备,由音频处理器设备处理后分成左右两个声道的码流数据,再由远程呈现多媒体终端对两个声道码流分别进行编码和打包,然后发送给对端的远程呈现多媒体终端,打包部分与图3所述实施例中描述相同。三屏会场42的远程呈现多媒体终端接收到含有左右两声道的码流数据后,解析出左、右声道码流位置信息和对应码流数据,分别解码,并把左、右声道数据分别通过音频处理器设备输出到左右音箱,达到听声辨位的效果。本实施例中如果通过MCU43组网,处理方式类似,但码流数据需要通过MCU43分别中转给参加会议的会场的远程呈现多媒体终端。如果有3个或以上会场参与会议,则必须有MCU43参与码流数据的处理。
图5为本发明一种远程呈现技术中媒体数据发送和播放的系统结构示意图,如图5所示,所述系统发送端包括:一个或多个音视频采集设备51、多路码流数据处理模块52和多路码流数据传输模块53,其中,
所述一个或多个音视频采集设备51,用于分别采集与坐席相对应的音频或视频数据,将采集到的数据发送给多路码流数据处理模块52;
所述多路码流数据处理模块52,用于对采集到的音频或视频数据分别进行处理,得到根据采集位置区分的多路码流数据和各路码流数据的采集位置信息,将多路码流数据和所述采集位置信息发送给多路码流数据传输模块53;
具体的,所述多路码流数据处理模块52对采集到的音频或视频数据分别进行处理,具体为:将每一个采集位置采集到的音频或视频数据都分别处理为一路码流数据。其中,所述分别处理是根据采集位置的不同进行区分。例如:三屏会场中有左、中、右三个采集位置,针对左侧视频和音频采集设备采集到的数据,分别处理得到左侧视频码流数据和左侧音频码流数据,所述左侧音频码流数据即对应接收端播放的左声道;针对右侧视频和音频采集设备采集到的数据,分别处理得到右侧视频码流数据和右侧音频码流数据,所述右侧音频码流数据即对应接收端播放的右声道;针对中间视频和音频采集设备采集到的数据,分别处理得到中间视频码流数据和中间音频码流数据。其中,中间音频码流数据可以是对应接收端播放的中间声道,也可以同时对应接收端播放的左声道和右声道,对于与会者来说同时听到左右声道播放相同的声音,会感觉声音来自中间,即正前方。进一步的,针对多余3个屏幕的会场,则通过调整不同声道的音量大小,来体现音频数据的采集位置,原则上越接近于采集位置的声道的音量越大。
所述多路码流数据传输模块53,用于对多路码流数据进行编码,并把编码后的多路音频数据和所述采集位置信息统一打包,和/或编码后的多路视频数据和所述采集位置信息统一打包,分别发送包含多路音频或视频的数据包。
具体的,所述多路码流数据进行编码,具体为:根据传输协议对多路码流进行编码。所述包含多路音频或视频的数据包,包括:在数据包头部分为每一路的视频或音频数据添加码流标识,并且标明码流长度,然后将码流数据的具体内容添加到数据包体部分。其中,所述添加的码流标识,用于对应码流数据各自的采集位置信息。在本发明的包含多路音频或视频的数据包中可以为多路码流分别添加码流标识,并标明码流长度,这样可以将多路码流打包为一个包含多路音频或视频的数据包,使得多路码流同步的问题得到很好的解决。进一步的,由于添加了对应采集位置的码流标识,因此可以在接收端依据采集位置还原音频数据的播放位置,实现了听声辨位。
进一步的,在接收端,本系统还包括:多路码流数据传输模块54、多路码流数据处理模块55和多个音视频播放设备56,其中,
多路码流数据传输模块54,用于接收并解析发送端的多路码流数据传输模块53发送的包含多路音频或视频的数据包,将解析出的多路码流数据,以及各路码流数据的采集位置信息,发送给接收端的多路码流数据处理模块55;
多路码流数据处理模块55,用于将多路音频数据或视频数据,发送给各路码流数据的采集位置信息所对应的音视频播放设备56完成播放。
具体的,所述多路码流数据传输模块54解析包含多路音频或视频的数据包,具体为:读取数据包头部分的码流标识得到码流数据的采集位置信息,根据码流长度,从数据包体部分解析出相应的多路音频数据或视频数据。然后将解析出的码流数据内容输出到会场中的对应采集位置的播放位置完成播放,则与会者可以得到听声辨位的体验。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
Claims (10)
1.一种远程呈现技术中媒体数据发送的方法,其特征在于,所述方法包括:
采集与坐席相对应的音频或视频数据,对采集到的音频或视频数据分别进行处理,得到根据采集位置区分的多路码流数据和各路码流数据的采集位置信息;
对多路码流数据进行编码,并把编码后的多路音频数据和所述采集位置信息统一打包,和/或编码后的多路视频数据和所述采集位置信息统一打包,分别发送包含多路音频或视频的数据包。
2.根据权利要求1所述的方法,其特征在于,所述包含多路音频或视频的数据包,包括:数据包头部分和数据包体部分,其中,数据包头部分携带每一路的音频或视频数据的码流标识,并且标明码流长度,所述码流标识对应所述采集位置信息;数据包体部分携带多路码流数据的内容。
3.根据权利要求1或2所述的方法,其特征在于,所述对采集到的音频或视频数据分别进行处理,具体为:将每一个采集位置采集到的音频或视频数据都分别处理为一路码流数据。
4.一种远程呈现技术中媒体数据播放的方法,其特征在于,所述方法包括:
接收端接收到包含多路音频或视频的数据包后,解析出多路音频数据或视频数据,以及各路码流数据的采集位置信息;
将多路音频数据或视频数据,按照各路码流数据的采集位置信息所对应的播放位置输出完成播放。
5.根据权利要求4所述的方法,其特征在于,所述解析出多路音频数据或视频数据,以及各路码流数据的采集位置信息,具体为:读取数据包头部分的码流标识得到码流数据的采集位置信息,根据码流长度,从数据包体部分解析出相应的多路音频数据或视频数据。
6.一种远程呈现技术中媒体数据发送的系统,其特征在于,所述系统包括:一个或多个音视频采集设备、多路码流数据处理模块和多路码流数据传输模块,其中,
所述一个或多个音视频采集设备,用于分别采集与坐席相对应的音频或视频数据,将采集到的数据发送给多路码流数据处理模块;
所述多路码流数据处理模块,用于对采集到的音频或视频数据分别进行处理,得到根据采集位置区分的多路码流数据和各路码流数据的采集位置信息,将多路码流数据和所述采集位置信息发送给多路码流数据传输模块;
所述多路码流数据传输模块,用于对多路码流数据进行编码,并把编码后的多路音频数据和所述采集位置信息统一打包,和/或编码后的多路视频数据和所述采集位置信息统一打包,分别发送包含多路音频或视频的数据包。
7.根据权利要求6所述的系统,其特征在于,所述包含多路音频或视频的数据包,包括:数据包头部分和数据包体部分,其中,数据包头部分携带每一路的音频或视频数据的码流标识,并且标明码流长度,所述码流标识对应所述采集位置信息;数据包体部分携带多路码流数据的内容。
8.根据权利要求6或7所述的系统,其特征在于,所述多路码流数据处理模块对采集到的音频或视频数据分别进行处理,具体为:将每一个采集位置采集到的音频或视频数据都分别处理为一路码流数据。
9.一种远程呈现技术中媒体数据播放的系统,其特征在于,所述系统包括:多个音视频播放设备、多路码流数据处理模块和多路码流数据传输模块,其中,
多路码流数据传输模块,用于接收并解析发送端的多路码流数据传输模块发送的包含多路音频或视频的数据包,将解析出的多路音频数据或视频数据,以及各路码流数据的采集位置信息,发送给接收端的多路码流数据处理模块;
多路码流数据处理模块,用于将多路音频数据或视频数据,发送给各路码流数据的采集位置信息所对应的音视频播放设备完成播放。
10.根据权利要求9所述的系统,其特征在于,所述多路码流数据传输模块解析包含多路音频或视频的数据包,具体为:读取数据包头部分的码流标识得到码流数据的采集位置信息,根据码流长度,从数据包体部分解析出相应的多路音频数据或视频数据。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110053344.5A CN102655584B (zh) | 2011-03-04 | 2011-03-04 | 一种远程呈现技术中媒体数据发送和播放的方法及系统 |
PCT/CN2011/082884 WO2012119465A1 (zh) | 2011-03-04 | 2011-11-24 | 一种远程呈现技术中媒体数据发送和播放的方法及系统 |
US14/001,762 US9363474B2 (en) | 2011-03-04 | 2011-11-24 | Method and system for sending and playing media data in telepresence technology |
US15/159,651 US9532000B2 (en) | 2011-03-04 | 2016-05-19 | Method and system for sending and playing media data in telepresence technology |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110053344.5A CN102655584B (zh) | 2011-03-04 | 2011-03-04 | 一种远程呈现技术中媒体数据发送和播放的方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102655584A CN102655584A (zh) | 2012-09-05 |
CN102655584B true CN102655584B (zh) | 2017-11-24 |
Family
ID=46731104
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110053344.5A Active CN102655584B (zh) | 2011-03-04 | 2011-03-04 | 一种远程呈现技术中媒体数据发送和播放的方法及系统 |
Country Status (3)
Country | Link |
---|---|
US (2) | US9363474B2 (zh) |
CN (1) | CN102655584B (zh) |
WO (1) | WO2012119465A1 (zh) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102868873B (zh) * | 2011-07-08 | 2017-10-17 | 中兴通讯股份有限公司 | 一种远程呈现方法、终端和系统 |
CN103024339B (zh) * | 2012-10-11 | 2015-09-30 | 华为技术有限公司 | 一种基于视频源实现混音的方法和装置 |
US20140192200A1 (en) * | 2013-01-08 | 2014-07-10 | Hii Media Llc | Media streams synchronization |
CN104902217B (zh) * | 2014-03-05 | 2019-07-16 | 中兴通讯股份有限公司 | 一种在网真会议系统中显示布局的方法及装置 |
CN105704423A (zh) * | 2014-11-24 | 2016-06-22 | 中兴通讯股份有限公司 | 语音输出方法及装置 |
CN106162038A (zh) * | 2015-03-25 | 2016-11-23 | 中兴通讯股份有限公司 | 一种音频发送方法及装置 |
CN107547813A (zh) * | 2016-06-29 | 2018-01-05 | 深圳市巨龙科教高技术股份有限公司 | 一种采集处理多路音频信号的系统和方法 |
CN107195308B (zh) * | 2017-04-14 | 2021-03-16 | 苏州科达科技股份有限公司 | 音视频会议系统的混音方法、装置及系统 |
CN108880696B (zh) * | 2017-05-12 | 2022-04-15 | 中兴通讯股份有限公司 | 频率配置握手方法及系统、终端及计算机可读存储介质 |
CN111641855B (zh) * | 2020-05-18 | 2022-02-25 | 海信视像科技股份有限公司 | 一种双屏显示设备及其音频输出方法 |
CN111857645A (zh) * | 2020-07-31 | 2020-10-30 | 北京三快在线科技有限公司 | 一种音频数据处理、播放方法、装置、介质及无人设备 |
CN112351251A (zh) * | 2020-10-21 | 2021-02-09 | 深圳迈瑞生物医疗电子股份有限公司 | 图像处理系统和终端设备 |
CN112509590A (zh) * | 2020-12-03 | 2021-03-16 | 合肥星空物联信息科技有限公司 | 一种音频传输方法和装置 |
CN112672076A (zh) * | 2020-12-11 | 2021-04-16 | 展讯半导体(成都)有限公司 | 一种图像的显示方法和电子设备 |
CN112689118B (zh) * | 2020-12-29 | 2023-12-08 | 厦门亿联网络技术股份有限公司 | 一种多屏网真终端的数据传输方法和装置 |
CN113674751A (zh) * | 2021-07-09 | 2021-11-19 | 北京字跳网络技术有限公司 | 音频处理方法、装置、电子设备和存储介质 |
CN115550599B (zh) * | 2022-09-22 | 2024-09-27 | 苏州科达科技股份有限公司 | 网呈会场的音视频输出方法、电子设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1929593A (zh) * | 2005-09-07 | 2007-03-14 | 宝利通公司 | 多点视频会议中的空间相关音频 |
CN101073257A (zh) * | 2004-12-22 | 2007-11-14 | 中兴通讯股份有限公司 | 在会议电视系统中传输多路视频的方法 |
CN101150727A (zh) * | 2007-10-19 | 2008-03-26 | 深圳华为通信技术有限公司 | 多路视频信号传输和电视墙显示的方法、系统以及处理设备 |
CN101471804A (zh) * | 2007-12-28 | 2009-07-01 | 华为技术有限公司 | 一种音频处理方法、系统和控制服务器 |
CN101674476A (zh) * | 2009-09-18 | 2010-03-17 | 北京协进科技发展有限公司 | 一种无线直播方法、装置和系统 |
CN101938626A (zh) * | 2010-09-15 | 2011-01-05 | 杭州海康威视数字技术股份有限公司 | 一种视频会议终端、系统和方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003018580A (ja) * | 2001-06-29 | 2003-01-17 | Matsushita Electric Ind Co Ltd | コンテンツ配信システムおよび配信方法 |
US20030149792A1 (en) * | 2002-02-06 | 2003-08-07 | Leonid Goldstein | System and method for transmission of data through multiple streams |
US7177985B1 (en) * | 2003-05-30 | 2007-02-13 | Mips Technologies, Inc. | Microprocessor with improved data stream prefetching |
NO318911B1 (no) * | 2003-11-14 | 2005-05-23 | Tandberg Telecom As | Distribuert sammensetting av sanntids-media |
EP1784020A1 (en) | 2005-11-08 | 2007-05-09 | TCL & Alcatel Mobile Phones Limited | Method and communication apparatus for reproducing a moving picture, and use in a videoconference system |
CN101427232B (zh) * | 2006-04-20 | 2015-05-13 | 思科技术公司 | 用于控制远程呈现系统的系统和方法 |
US7499547B2 (en) * | 2006-09-07 | 2009-03-03 | Motorola, Inc. | Security authentication and key management within an infrastructure based wireless multi-hop network |
US20080273078A1 (en) * | 2007-05-01 | 2008-11-06 | Scott Grasley | Videoconferencing audio distribution |
US8289362B2 (en) * | 2007-09-26 | 2012-10-16 | Cisco Technology, Inc. | Audio directionality control for a multi-display switched video conferencing system |
CN101132516B (zh) | 2007-09-28 | 2010-07-28 | 华为终端有限公司 | 一种视频通讯的方法、系统及用于视频通讯的装置 |
US20120050456A1 (en) * | 2010-08-27 | 2012-03-01 | Cisco Technology, Inc. | System and method for producing a performance via video conferencing in a network environment |
-
2011
- 2011-03-04 CN CN201110053344.5A patent/CN102655584B/zh active Active
- 2011-11-24 US US14/001,762 patent/US9363474B2/en active Active
- 2011-11-24 WO PCT/CN2011/082884 patent/WO2012119465A1/zh active Application Filing
-
2016
- 2016-05-19 US US15/159,651 patent/US9532000B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101073257A (zh) * | 2004-12-22 | 2007-11-14 | 中兴通讯股份有限公司 | 在会议电视系统中传输多路视频的方法 |
CN1929593A (zh) * | 2005-09-07 | 2007-03-14 | 宝利通公司 | 多点视频会议中的空间相关音频 |
CN101150727A (zh) * | 2007-10-19 | 2008-03-26 | 深圳华为通信技术有限公司 | 多路视频信号传输和电视墙显示的方法、系统以及处理设备 |
CN101471804A (zh) * | 2007-12-28 | 2009-07-01 | 华为技术有限公司 | 一种音频处理方法、系统和控制服务器 |
CN101674476A (zh) * | 2009-09-18 | 2010-03-17 | 北京协进科技发展有限公司 | 一种无线直播方法、装置和系统 |
CN101938626A (zh) * | 2010-09-15 | 2011-01-05 | 杭州海康威视数字技术股份有限公司 | 一种视频会议终端、系统和方法 |
Non-Patent Citations (1)
Title |
---|
SIP:session initiation protocol;J.Rosenberg,H.Schulzrinne,et al;《Network working group》;https://tools.ietf.org/pdf/rfc3261.pdf;20020630;第1、2章、第20.14节、第20.20节、20.39节 * |
Also Published As
Publication number | Publication date |
---|---|
WO2012119465A1 (zh) | 2012-09-13 |
US9363474B2 (en) | 2016-06-07 |
CN102655584A (zh) | 2012-09-05 |
US20130335518A1 (en) | 2013-12-19 |
US9532000B2 (en) | 2016-12-27 |
US20160269683A1 (en) | 2016-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102655584B (zh) | 一种远程呈现技术中媒体数据发送和播放的方法及系统 | |
CN105430537B (zh) | 对多路数据进行合成的方法、服务器及音乐教学系统 | |
CN105743549B (zh) | 用户终端及其音频蓝牙播放方法、数字信号处理器 | |
CN102055949B (zh) | 多媒体会议的录播方法、装置及系统、回播方法及装置 | |
CN102740064B (zh) | 对讲系统中流媒体传输的组包方法 | |
CN100531398C (zh) | 一种移动多媒体广播系统的多音轨实现方法 | |
EP3384680A1 (en) | Selection of coded next generation audio data for transport | |
CN104254007B (zh) | 一种音频处理方法及装置 | |
KR20160030133A (ko) | 실시간 전송 프로토콜 기반의 방송 시스템에서 미디어 방송 신호의 송수신 방법 및 장치 | |
CN104426832A (zh) | 一种多终端多声道独立播放方法及装置 | |
CN102946570A (zh) | 一种自适应网络带宽的多流流媒体传输系统与传输方法 | |
CN104053039B (zh) | 数据收发装置、数据收发系统以及数据收发方法 | |
CN103686219B (zh) | 一种视频会议录播的方法、设备及系统 | |
CN103888815B (zh) | 一种音视频流实时分离处理及同步的方法及其系统 | |
KR20140125690A (ko) | 멀티미디어 전송 시스템에서 미디어 전송 패킷 전송 방법 및 장치 | |
CN101494793B (zh) | 流媒体数据的发送、接收方法、装置和系统 | |
CN105635798B (zh) | 一种基于异构无线音频的立体声实现方法及系统 | |
CN101009824A (zh) | 一种音/视频数据的网络传输方法 | |
CN100518074C (zh) | 一种移动多媒体广播多视频流的实现方法 | |
IL162075A0 (en) | Video conferencing over public network | |
CN107820112A (zh) | 一种音频文字直播系统 | |
CN105706164A (zh) | 发送设备、发送方法、接收设备和接收方法 | |
CN110225504A (zh) | 传输数据的方法及无线设备组件 | |
CN102412877B (zh) | 一种基于a2dp协议的非音频数据传输方法 | |
CN101489090B (zh) | 多路媒体流传输和接收的方法、装置及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |