KR20220097239A - server that analyzes synopsis text and predicts viewer ratings based on artificial intelligence - Google Patents
server that analyzes synopsis text and predicts viewer ratings based on artificial intelligence Download PDFInfo
- Publication number
- KR20220097239A KR20220097239A KR1020210177211A KR20210177211A KR20220097239A KR 20220097239 A KR20220097239 A KR 20220097239A KR 1020210177211 A KR1020210177211 A KR 1020210177211A KR 20210177211 A KR20210177211 A KR 20210177211A KR 20220097239 A KR20220097239 A KR 20220097239A
- Authority
- KR
- South Korea
- Prior art keywords
- recommended
- information
- text information
- synopsis
- drama
- Prior art date
Links
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 57
- 230000015654 memory Effects 0.000 claims abstract description 15
- 239000013598 vector Substances 0.000 claims description 37
- 230000013016 learning Effects 0.000 claims description 31
- 238000012545 processing Methods 0.000 claims description 27
- 238000010801 machine learning Methods 0.000 claims description 25
- 238000000034 method Methods 0.000 abstract description 46
- 238000004458 analytical method Methods 0.000 description 26
- 238000010586 diagram Methods 0.000 description 18
- 238000004891 communication Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 11
- 238000012360 testing method Methods 0.000 description 9
- 238000012549 training Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 230000033001 locomotion Effects 0.000 description 6
- 238000003860 storage Methods 0.000 description 6
- 230000009471 action Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 241001608711 Melo Species 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000035876 healing Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 235000019640 taste Nutrition 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3347—Query execution using vector based model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
Description
본 발명은 인공지능에 기반하여 시놉시스 텍스트를 분석하고 시청률을 예측하는 서버에 관한 것이다.The present invention relates to a server that analyzes synopsis text and predicts viewer ratings based on artificial intelligence.
또한 본 발명은 시놉시스 텍스트 분석 및 시청률 예측 방법에 관한 것으로서, 더욱 상세하게는 드라마 컨텐츠를 포함한 시놉시스의 텍스트를 분석하여 컨텐츠에 맞는 캐릭터 및 배우를 추천하고 드라마의 시청률을 예측할 수 있도록 한 방법 및 이의 전자 장치에 관한 것이다.The present invention also relates to a method for analyzing synopsis text and predicting audience ratings, and more particularly, a method for analyzing synopsis text including drama content to recommend characters and actors suitable for content and predict audience ratings for a drama, and an electronic method thereof It's about the device.
드라마는 TV, PC, 휴대폰, 스트리밍 서비스 등 컨텐츠를 재생하는 다양한 기기를 통해 다양한 시청자 층에 대하여 송출되고 있다. 그러나 이러한 드라마를 위한 시놉시스 텍스트 분석 시스템이 분석하는 시놉시스들의 수 및 앞으로 제공할 드라마를 위한 시놉시스의 수가 방대해지고 있으며, 시청자 층의 선호 역시 다각화 됨에 따라 종래의 시놉시스 텍스트 분석 시스템이 드라마 제작을 위한 시놉시스를 분석하는데 어려움이 있으며, 그에 따른 시청률에 대한 분석 역시 예측력이 떨어지는 문제가 있다. 특히, 신규 드라마를 위한 시놉시스의 경우 사용자가 해당 시놉시스의 컨텐츠를 선호하는지 사용자의 성향이 파악되어 있지 않으며, 신규 드라마는 아직 아무도 소비한 적이 없기 때문에 기존에 방영했던 비슷한 취지의 드라마의 전례를 통해 시청률을 분석할 수 밖에 없다.Dramas are being broadcast to a variety of audiences through various devices that reproduce content, such as TVs, PCs, mobile phones, and streaming services. However, the number of synopses analyzed by the synopsis text analysis system for dramas and the number of synopses for dramas to be provided in the future is increasing, and as the preferences of the viewer group are also diversified, the conventional synopsis text analysis system analyzes the synopsis for drama production. It is difficult to analyze, and there is also a problem in that the analysis of the audience rating is also poor in predictive power. In particular, in the case of a synopsis for a new drama, it is not known whether the user prefers the contents of the synopsis or not, and since no one has consumed the new drama yet, the audience rating is based on the precedent of previously aired dramas with a similar purpose. can only analyze
한편, 머신 러닝을 기반으로 한 텍스트 분석은 다양한 소셜 네트워크 서비스(SNS), 클라우드 플랫폼 서비스 등에서 널리 이용되고 있으며, 텍스트의 흐름, 뉘앙스 또는 의도까지 인식하는 수준으로 발전하고 있다. 텍스트 인식을 기반으로 하는 인공지능(AI) 서비스도 현재 시장의 트렌드의 하나이다. 이러한 인공지능(AI) 기술은 현재 컨텐츠 사업 분야에도 적용되는 추세로서, 종래 텍스트 분석뿐 아니라 이를 이용하여 특정한 컨텐츠를 포함한 텍스트를 생성하는 수준까지 발전되고 있다.On the other hand, text analysis based on machine learning is widely used in various social network services (SNS) and cloud platform services, and is developing to the level of recognizing the flow, nuance, or intention of text. Artificial intelligence (AI) services based on text recognition are also one of the current market trends. This artificial intelligence (AI) technology is a trend currently applied to the content business field, and has been developed to the level of generating text including specific content by using it as well as conventional text analysis.
본 발명의 방법에 따르면 시놉시스 텍스트 분석 및 시청률 예측 시스템은 머신 러닝을 통해 다양한 시청자 층의 취향을 고려하여 드라마 컨텐츠의 적합 장르를 분석하고, 시놉시스 텍스트에 적합한 캐릭터 및 해당 캐릭터에 맞는 배우를 추천하여 객관적인 시청률을 도출할 수 있도록 한다. 이를 통해 드라마 담당자의 직관에만 의존해야 했던 기존 방식에서 벗어나 작가가 입력한 시나리오에 가장 적합한 배우를 추천하며, 이러한 배우의 조합에 어울리는 드라마를 제시하고 그 드라마의 성과를 보여줌으로써 예상되는 드라마 성과를 예측할 수 있다.According to the method of the present invention, the synopsis text analysis and viewer rating prediction system analyzes the appropriate genre of drama content in consideration of the tastes of various viewer groups through machine learning, and recommends a character suitable for the synopsis text and an actor suitable for the character to provide an objective to derive the ratings. Through this, it is possible to break away from the existing method that had to rely only on the intuition of the drama manager, and recommend the most suitable actor for the scenario entered by the writer, and predict the expected performance of the drama by presenting the drama suitable for the combination of actors and showing the performance of the drama. can
본 발명에서 이루고자 하는 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급하지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.The technical problems to be achieved in the present invention are not limited to the technical problems mentioned above, and other technical problems not mentioned will be clearly understood by those of ordinary skill in the art to which the present invention belongs from the description below. will be able
다양한 실시예들은, 시놉시스 텍스트 분석 및 시청률 예측을 위한 전자 장치의 동작 방법 및 이를 지원하는 전자 장치를 제공할 수 있다.Various embodiments may provide a method of operating an electronic device for analyzing a synopsis text and predicting an audience rating, and an electronic device supporting the same.
다양한 실시예들에 따른 전자 장치의 동작 방법은: 대상 드라마 컨텐츠의 시놉시스 텍스트 정보를 획득하는 동작; 상기 시놉시스 텍스트 정보를 AI (artificial intelligence) 엔진 (engine)에 입력하는 동작; 및 상기 시놉시스 텍스트 정보에 대한 상기 AI 엔진의 출력 동작에 기초하여, 상기 대상 드라마 컨텐츠를 위한 추천 캐릭터들에 대한 정보, 추천 배우들에 대한 정보, 추천 드라마들에 대한 정보 및 예측 시청률에 대한 정보를 출력하는 동작을 포함할 수 있다. According to various embodiments of the present disclosure, a method of operating an electronic device may include: acquiring synopsis text information of target drama content; inputting the synopsis text information into an artificial intelligence (AI) engine; and information on recommended characters for the target drama content, information on recommended actors, information on recommended dramas, and information on predicted audience ratings based on the output operation of the AI engine with respect to the synopsis text information. It may include an operation to output.
예시적 실시예에서, 상기 AI 엔진의 출력 동작은: 상기 시놉시스 텍스트 정보를 벡터(vector)로 변환하는 임베딩(embedding)이 적용된 임베딩 된 시놉시스 텍스트 정보를 획득하는 동작; 상기 임베딩 된 시놉시스 텍스트 정보에 기초하여, 상기 대상 드라마 컨텐츠의 장르를 판단하는 동작; 상기 판단된 장르에 기초하여, 상기 추천 캐릭터들 및 상기 추천 배우들을 판단하는 동작; 및 상기 판단된 추천 배우들의 조합에 기초하여, 상기 추천 드라마들을 판단하는 동작; 상기 판단된 추천 드라마들에 기초하여, 상기 예측 시청률을 판단하는 동작을 포함할 수 있다. In an exemplary embodiment, the output operation of the AI engine includes: obtaining embedded synopsis text information to which embedding for converting the synopsis text information into a vector is applied; determining a genre of the target drama content based on the embedded synopsis text information; determining the recommended characters and the recommended actors based on the determined genre; and determining the recommended dramas based on the determined combination of recommended actors; and determining the predicted audience rating based on the determined recommended dramas.
예시적 실시예에서, 상기 대상 드라마 컨텐츠의 장르를 판단하는 동작은, 상기 AI 엔진의 앙상블 학습(ensemble learning)에 기초하여 수행되고, 상기 앙상블 학습은, 모델(model)에 상기 AI 엔진이 수행 가능한 복수의 기계 학습(machine learning)들을 적용함에 기초하여 구성되며, 상기 앙상블 학습은 상기 복수의 기계 학습들을 통해 종래의 드라마 장르들을 처리함에 기초하여 수행될 수 있다.In an exemplary embodiment, the operation of determining the genre of the target drama content is performed based on ensemble learning of the AI engine, and the ensemble learning is a model that the AI engine can perform It is configured based on applying a plurality of machine learning methods, and the ensemble learning may be performed based on processing conventional drama genres through the plurality of machine learning methods.
예시적 실시예에서, 상기 추천 캐릭터들 및 상기 추천 배우들을 판단하는 동작은: 상기 판단된 장르에 출연한 배우들의 목록을 획득하는 동작; 상기 출연한 배우들이 연기했던 드라마 캐릭터들에 대한 제1 캐릭터 임베딩 정보들을 획득하는 동작; 상기 제1 캐릭터 임베딩 정보들과 상기 임베딩 된 시놉시스 텍스트 정보를 비교하여, 상기 임베딩 된 시놉시스 텍스트 정보와 유사한 제2 캐릭터 임베딩 정보들을 판단하는 동작; 및 상기 제2 캐릭터 임베딩 정보들에 해당하는 캐릭터들 및 상기 제2 캐릭터 임베딩 정보들에 해당하는 캐릭터들을 연기했던 배우들을 판단하는 동작을 포함할 수 있다.In an exemplary embodiment, the determining of the recommended characters and the recommended actors may include: obtaining a list of actors appearing in the determined genre; obtaining first character embedding information for drama characters played by the actors; comparing the first character embedding information with the embedded synopsis text information to determine second character embedding information similar to the embedded synopsis text information; and determining characters corresponding to the second character embedding information and actors who played characters corresponding to the second character embedding information.
예시적 실시예에서, 상기 추천 드라마들을 판단하는 동작은: 상기 판단된 추천 배우들의 조합에 대한 임베딩 정보를 획득하는 동작; 상기 판단된 추천 배우들의 조합에 대한 임베딩 정보와 유사한 드라마 임베딩 정보들을 판단하는 동작; 및 상기 유사한 드라마 임베딩 정보들에 해당하는 드라마들을 판단하는 동작을 포함할 수 있다.In an exemplary embodiment, the determining of the recommended dramas includes: obtaining embedding information for the determined combination of recommended actors; determining drama embedding information similar to embedding information for the determined combination of recommended actors; and determining dramas corresponding to the similar drama embedding information.
예시적 실시예에서, 상기 예측 시청률에 대한 정보는 상기 추천 드라마들 중 유사성이 가장 높은 드라마의 시청률에 기반하여 구성될 수 있다.In an exemplary embodiment, the information on the predicted audience rating may be configured based on a rating of a drama having the highest similarity among the recommended dramas.
예시적 실시예에서, 상기 AI 엔진은, 모델 (model)에 기계 학습 (machine learning)을 적용할 수 있도록 미리 구성되고, 상기 기계 학습은: - (a) 학습용 드라마 데이터를 처리함에 기초하여 획득된 훈련용 데이터 및 테스트용 데이터 중 훈련용 데이터에 기초하여 상기 모델을 학습; - (b) 상기 테스트용 데이터가 상기 모델로 입력됨에 대한 응답으로 출력되는 피드백 정보를 획득; - (c) 상기 피드백 정보에 기초하여 상기 모델을 업데이트; 및 - (d) 상기 (a) 내지 (c) 가 반복되되, 상기 (a) 내지 (c) 의 반복 횟수가 미리 설정된 임계값과 일치함에 기초하여 종료; 됨에 기초하여 수행될 수 있다.In an exemplary embodiment, the AI engine is preconfigured to apply machine learning to a model, wherein the machine learning is: - (a) obtained based on processing drama data for learning learning the model based on training data among training data and test data; - (b) obtaining feedback information that is output in response to the test data being input to the model; - (c) updating said model based on said feedback information; and - (d) repeating (a) to (c), but ending based on the number of repetitions of (a) to (c) matching a preset threshold value; It can be performed based on
다양한 실시예들에 따른 전자 장치는: 프로세서 (processor); 및 하나 이상의 인스트럭션 (instruction)을 저장하는 하나 이상의 메모리 (memory)를 포함할 수 있다. An electronic device according to various embodiments may include: a processor; and one or more memories storing one or more instructions.
예시적 실시예에서, 대상 드라마 컨텐츠의 시놉시스 텍스트 정보를 획득하는 동작; 상기 시놉시스 텍스트 정보를 AI (artificial intelligence) 엔진 (engine)에 입력하는 동작; 및 상기 시놉시스 텍스트 정보에 대한 상기 AI 엔진의 출력 동작에 기초하여, 상기 대상 드라마 컨텐츠를 위한 추천 캐릭터들에 대한 정보, 추천 배우들에 대한 정보, 추천 드라마들에 대한 정보 및 예측 시청률에 대한 정보를 출력하는 동작을 수행하도록 상기 프로세서를 제어할 수 있다.In an exemplary embodiment, an operation of obtaining synopsis text information of a target drama content; inputting the synopsis text information into an artificial intelligence (AI) engine; and information on recommended characters for the target drama content, information on recommended actors, information on recommended dramas, and information on predicted audience ratings based on the output operation of the AI engine with respect to the synopsis text information. The processor may be controlled to perform an output operation.
예시적 실시예에서, 상기 AI 엔진의 출력 동작은: 상기 시놉시스 텍스트 정보를 벡터(vector)로 변환하는 임베딩(embedding)이 적용된 임베딩 된 시놉시스 텍스트 정보를 획득하는 동작; 상기 임베딩 된 시놉시스 텍스트 정보에 기초하여, 상기 대상 드라마 컨텐츠의 장르를 판단하는 동작; 상기 판단된 장르에 기초하여, 상기 추천 캐릭터들 및 상기 추천 배우들을 판단하는 동작; 및 상기 판단된 추천 배우들의 조합에 기초하여, 상기 추천 드라마들을 판단하는 동작; 상기 판단된 추천 드라마들에 기초하여, 상기 예측 시청률을 판단하는 동작을 포함할 수 있다. In an exemplary embodiment, the output operation of the AI engine includes: obtaining embedded synopsis text information to which embedding for converting the synopsis text information into a vector is applied; determining a genre of the target drama content based on the embedded synopsis text information; determining the recommended characters and the recommended actors based on the determined genre; and determining the recommended dramas based on the determined combination of recommended actors; and determining the predicted audience rating based on the determined recommended dramas.
예시적 실시예에서, 상기 대상 드라마 컨텐츠의 장르를 판단하는 동작은, 상기 AI 엔진의 앙상블 학습(ensemble learning)에 기초하여 수행되고, 상기 앙상블 학습은, 모델(model)에 상기 AI 엔진이 수행 가능한 복수의 기계 학습(machine learning)들을 적용함에 기초하여 구성되며, 상기 앙상블 학습은 상기 복수의 기계 학습들을 통해 종래의 드라마 장르들을 처리함에 기초하여 수행될 수 있다.In an exemplary embodiment, the operation of determining the genre of the target drama content is performed based on ensemble learning of the AI engine, and the ensemble learning is a model that the AI engine can perform It is configured based on applying a plurality of machine learning methods, and the ensemble learning may be performed based on processing conventional drama genres through the plurality of machine learning methods.
예시적 실시예에서, 상기 추천 캐릭터들 및 상기 추천 배우들을 판단하는 동작은: 상기 판단된 장르에 출연한 배우들의 목록을 획득하는 동작; 상기 출연한 배우들이 연기했던 드라마 캐릭터들에 대한 제1 캐릭터 임베딩 정보들을 획득하는 동작; 상기 제1 캐릭터 임베딩 정보들과 상기 임베딩 된 시놉시스 텍스트 정보를 비교하여, 상기 임베딩 된 시놉시스 텍스트 정보와 유사한 제2 캐릭터 임베딩 정보들을 판단하는 동작; 및 상기 제2 캐릭터 임베딩 정보들에 해당하는 캐릭터들 및 상기 제2 캐릭터 임베딩 정보들에 해당하는 캐릭터들을 연기했던 배우들을 판단하는 동작을 포함할 수 있다.In an exemplary embodiment, the determining of the recommended characters and the recommended actors may include: obtaining a list of actors appearing in the determined genre; obtaining first character embedding information for drama characters played by the actors; comparing the first character embedding information with the embedded synopsis text information to determine second character embedding information similar to the embedded synopsis text information; and determining characters corresponding to the second character embedding information and actors who played characters corresponding to the second character embedding information.
예시적 실시예에서, 상기 추천 드라마들을 판단하는 동작은: 상기 판단된 추천 배우들의 조합에 대한 임베딩 정보를 획득하는 동작; 상기 판단된 추천 배우들의 조합에 대한 임베딩 정보와 유사한 드라마 임베딩 정보들을 판단하는 동작; 및 상기 유사한 드라마 임베딩 정보들에 해당하는 드라마들을 판단하는 동작을 포함할 수 있다.In an exemplary embodiment, the determining of the recommended dramas includes: obtaining embedding information for the determined combination of recommended actors; determining drama embedding information similar to embedding information for the determined combination of recommended actors; and determining dramas corresponding to the similar drama embedding information.
예시적 실시예에서, 상기 예측 시청률에 대한 정보는 상기 추천 드라마들 중 유사성이 가장 높은 드라마의 시청률에 기반하여 구성될 수 있다.In an exemplary embodiment, the information on the predicted audience rating may be configured based on a rating of a drama having the highest similarity among the recommended dramas.
예시적 실시예에서, 상기 AI 엔진은, 모델 (model)에 기계 학습 (machine learning)을 적용할 수 있도록 미리 구성되고, 상기 기계 학습은: - (a) 학습용 드라마 데이터를 처리함에 기초하여 획득된 훈련용 데이터 및 테스트용 데이터 중 훈련용 데이터에 기초하여 상기 모델을 학습; - (b) 상기 테스트용 데이터가 상기 모델로 입력됨에 대한 응답으로 출력되는 피드백 정보를 획득; - (c) 상기 피드백 정보에 기초하여 상기 모델을 업데이트; 및 - (d) 상기 (a) 내지 (c) 가 반복되되, 상기 (a) 내지 (c)의 반복 횟수가 미리 설정된 임계값과 일치함에 기초하여 종료; 됨에 기초하여 수행될 수 있다.In an exemplary embodiment, the AI engine is preconfigured to apply machine learning to a model, wherein the machine learning is: - (a) obtained based on processing drama data for learning learning the model based on training data among training data and test data; - (b) obtaining feedback information that is output in response to the test data being input to the model; - (c) updating said model based on said feedback information; and - (d) repeating (a) to (c), but ending based on the number of repetitions of (a) to (c) matching a preset threshold value; It can be performed based on
상술한 본 개시의 다양한 실시예들은 본 개시의 바람직한 실시예들 중 일부에 불과하며, 본 개시의 다양한 실시예들의 기술적 특징들이 반영된 여러 가지 실시예들이 당해 기술분야의 통상적인 지식을 가진 자에 의해 이하 상술할 상세한 설명을 기반으로 도출되고 이해될 수 있다.The various embodiments of the present disclosure described above are only some of the preferred embodiments of the present disclosure, and various embodiments in which the technical features of various embodiments of the present disclosure are reflected are made by those of ordinary skill in the art. It can be derived and understood based on the detailed description to be described below.
본 발명은 드라마 컨텐츠를 포함한 시놉시스의 텍스트를 분석하여 컨텐츠에 맞는 캐릭터 및 배우를 추천하고 드라마의 시청률을 예측할 수 있는 방법을 제시하여, 보다 적합한 드라마 구성 및 정확한 시청률 예측 결과를 확보할 수 있는 측면에서 기술적인 효과를 갖는다.The present invention analyzes the text of the synopsis including the drama content, recommends characters and actors suitable for the content, and suggests a method for predicting the audience rating of the drama, in terms of securing a more suitable drama composition and accurate rating prediction results have a technical effect.
본 발명에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.The effects obtainable in the present invention are not limited to the above-mentioned effects, and other effects not mentioned may be clearly understood by those of ordinary skill in the art to which the present invention belongs from the following description. will be.
다양한 실시예들에 대한 이해를 돕기 위해 상세한 설명의 일부로 포함된, 첨부 도면은 다양한 실시예들을 제공하고, 상세한 설명과 함께 본 개시의 기술적 특징을 설명한다.
도 1은 다양한 실시예들에 따른 시놉시스 텍스트 분석 및 시청률 예측을 위한 전자 장치의 동작 방법이 구현될 수 있는 시놉시스 텍스트 분석 및 시청률 예측 시스템을 설명하기 위한 도면이다.
도 2는 다양한 실시예들에 따른 측정 장치 및/또는 사용자 장치의 구성을 도시한 도면이다.
도 3은 다양한 실시예들에 따른 시청률 예측 및 출력을 위한 전자 장치의 동작 방법을 도시한 도면이다.
도 4는 다양한 실시예들에 따른 시청률 예측 및 출력을 위한 UI/UX 일 예를 도시한 도면이다.
도 5는 다양한 실시예들에 따른 시놉시스 텍스트 분석을 위한 전자 장치의 동작 방법을 도시한 도면이다.
도 6은 단어 기반 단순 가공 형태의 임베딩 처리 예시 및 한글 자소 기반 형태소 가공 형태의 임베딩 처리 예시를 나타낸 도면이다.
도 7은 추천된 배우들의 조합에 따른 드라마 추천의 예시를 나타낸 도면이다.
도 8은 다양한 실시예들에 따른 시놉시스 텍스트 분석을 위한 AI (artificial intelligence) 엔진을 획득하는 과정을 도시한 도면이다.BRIEF DESCRIPTION OF THE DRAWINGS The accompanying drawings, which are included as part of the detailed description to aid understanding of the various embodiments, provide various embodiments and, together with the detailed description, explain the technical features of the present disclosure.
1 is a diagram for describing a synopsis text analysis and viewer rating prediction system in which a method of operating an electronic device for analyzing synopsis text and predicting audience rating according to various embodiments of the present disclosure may be implemented.
2 is a diagram illustrating a configuration of a measuring device and/or a user device according to various embodiments of the present disclosure;
3 is a diagram illustrating a method of operating an electronic device for predicting and outputting an audience rating according to various embodiments of the present disclosure;
4 is a diagram illustrating an example of a UI/UX for predicting and outputting an audience rating according to various embodiments of the present disclosure;
5 is a diagram illustrating a method of operating an electronic device for analyzing a synopsis text according to various embodiments of the present disclosure;
6 is a diagram illustrating an example of an embedding processing of a word-based simple processing form and an example of an embedding processing of a Hangeul grapheme-based morpheme processing form.
7 is a diagram illustrating an example of a drama recommendation according to a combination of recommended actors.
8 is a diagram illustrating a process of acquiring an artificial intelligence (AI) engine for analyzing synopsis text according to various embodiments of the present disclosure;
이하의 실시예들은 다양한 실시예들의 구성요소들과 특징들을 소정 형태로 결합한 것들이다. 각 구성요소 또는 특징은 별도의 명시적 언급이 없는 한 선택적인 것으로 고려될 수 있다. 각 구성요소 또는 특징은 다른 구성요소나 특징과 결합되지 않은 형태로 실시될 수 있다. 또한, 일부 구성요소들 및/또는 특징들을 결합하여 다양한 실시예들을 구성할 수도 있다. 다양한 실시예들에서 설명되는 동작들의 순서는 변경될 수 있다. 어느 실시예의 일부 구성이나 특징은 다른 실시예에 포함될 수 있고, 또는 다른 실시예의 대응하는 구성 또는 특징과 교체될 수 있다.The following embodiments combine elements and features of various embodiments in a predetermined form. Each component or feature may be considered optional unless explicitly stated otherwise. Each component or feature may be implemented in a form that is not combined with other components or features. In addition, various embodiments may be configured by combining some components and/or features. The order of operations described in various embodiments may be changed. Some features or features of one embodiment may be included in another embodiment, or may be replaced with corresponding features or features of another embodiment.
도면에 대한 설명에서, 다양한 실시예들의 요지를 흐릴 수 있는 절차 또는 단계 등은 기술하지 않았으며, 당해 기술분야에서 통상의 지식을 가진 자의 수준에서 이해할 수 있을 정도의 절차 또는 단계는 또한 기술하지 아니하였다.In the description of the drawings, procedures or steps that may obscure the gist of various embodiments are not described, and procedures or steps that can be understood at the level of those of ordinary skill in the art are also not described. did
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함(comprising 또는 including)"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서에 기재된 "...부", "...기", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다. 또한, "일(a 또는 an)", "하나(one)", "그(the)" 및 유사 관련어는 다양한 실시예들을 기술하는 문맥에 있어서(특히, 이하의 청구항의 문맥에서) 본 명세서에 달리 지시되거나 문맥에 의해 분명하게 반박되지 않는 한, 단수 및 복수 모두를 포함하는 의미로 사용될 수 있다.Throughout the specification, when a part is said to "comprising or including" a certain component, it does not exclude other components unless otherwise stated, meaning that other components may be further included. do. In addition, terms such as "...unit", "...group", and "module" described in the specification mean a unit that processes at least one function or operation, which is hardware or software or a combination of hardware and software. can be implemented as Also, "a or an," "one," "the," and like related terms are used herein in the context of describing various embodiments (especially in the context of the claims that follow). Unless indicated otherwise or clearly contradicted by context, it may be used in a sense including both the singular and the plural.
이하, 다양한 실시예들에 따른 바람직한 실시 형태를 첨부된 도면을 참조하여 상세하게 설명한다. 첨부된 도면과 함께 이하에 개시될 상세한 설명은 다양한 실시예들의 예시적인 실시형태를 설명하고자 하는 것이며, 유일한 실시형태를 나타내고자 하는 것이 아니다.Hereinafter, preferred embodiments according to various embodiments will be described in detail with reference to the accompanying drawings. DETAILED DESCRIPTION The detailed description set forth below in conjunction with the appended drawings is intended to describe exemplary embodiments of various embodiments, and is not intended to represent the only embodiments.
또한, 다양한 실시예들에서 사용되는 특정(特定) 용어들은 다양한 실시예들의 이해를 돕기 위해서 제공된 것이며, 이러한 특정 용어의 사용은 다양한 실시예들의 기술적 사상을 벗어나지 않는 범위에서 다른 형태로 변경될 수 있다.In addition, specific terms used in various embodiments are provided to help the understanding of various embodiments, and the use of these specific terms may be changed to other forms without departing from the technical spirit of various embodiments. .
1. 시놉시스 텍스트 분석 및 시청률 예측 시스템 구현1. Synopsis text analysis and viewer rating prediction system implementation
도 1은 다양한 실시예들에 따른 시놉시스 텍스트 분석 및 시청률 예측을 위한 전자 장치의 동작 방법이 구현될 수 있는 시놉시스 텍스트 분석 및 시청률 예측 시스템을 설명하기 위한 도면이다.1 is a diagram for describing a synopsis text analysis and audience rating prediction system in which a method of operating an electronic device for analyzing synopsis text and predicting audience rating according to various embodiments of the present disclosure may be implemented.
도 1을 참조하면, 다양한 실시예들에 따른 시놉시스 텍스트 분석 및 시청률 예측 시스템은 다양한 종류의 전자 장치들에 구현될 수 있다. 예를 들어, 시놉시스 텍스트 분석 및 시청률 예측 시스템은 서버(100) 및/또는 사용자 단말(200)에 구현될 수 있다. 달리 말해, 서버(100) 및/또는 사용자 단말(200)은 각각의 장치에 구현된 시놉시스 텍스트 분석 및 시청률 예측 시스템을 기반으로, 본 개시의 다양한 실시예들에 따른 동작을 수행할 수 있다. 한편, 다양한 실시예들에 따른 시놉시스 텍스트 분석 및 시청률 예측 시스템은, 상기 도 1에 도시된 바에 국한되지 않고, 더 다양한 전자 장치와 서버들에 구현될 수도 있을 것이다.Referring to FIG. 1 , a synopsis text analysis and viewer rating prediction system according to various embodiments may be implemented in various types of electronic devices. For example, the synopsis text analysis and viewer rating prediction system may be implemented in the
다양한 실시예들에 따른 서버(100)는, 복수 개의 사용자 단말(200)들과 무선 및/또는 유선 통신을 수행하며, 대단위의 저장 용량을 갖는 데이터베이스를 포함하는 장치일 수 있다. 예를 들어, 서버(100)는 복수 개의 사용자 디바이스들과 연동되는 클라우드 디바이스(Cloud device)일 수 있다.The
다양한 실시예들에 따른 사용자 단말(200)은, 데스크탑 피시, 태블릿 피시, 모바일 단말 등의 개인 사용자에 의해 이용될 수 있는 장치일 수 있다. 이외에도 유사한 기능을 수행하는 다른 전자 장치들이 사용자 단말(200)로 이용될 수 있다.The
1.1. 기능적 구현1.1. functional implementation
다양한 실시예들에 따른 시놉시스 텍스트 분석 및 시청률 예측 시스템은 동작을 위한 다양한 모듈들을 포함할 수 있다. 시놉시스 텍스트 분석 및 시청률 예측 시스템에 포함된 모듈들은 시놉시스 텍스트 분석 및 시청률 예측 시스템이 구현되는(또는, 물리적 장치에 포함되는) 물리적 장치(예: 서버(100) 및/또는 사용자 단말(200))가 지정된 동작을 수행할 수 있도록 구현된 컴퓨터 코드 내지는 하나 이상의 인스트럭션 (instruction) 일 수 있다. 다시 말해, 시놉시스 텍스트 분석 및 시청률 예측 시스템이 구현되는 물리적 장치는 복수 개의 모듈들을 컴퓨터 코드 형태로 메모리에 저장하고, 메모리에 저장된 복수 개의 모듈들이 실행되는 경우 복수 개의 모듈들은 물리적 장치가 복수 개의 모듈들에 대응하는 지정된 동작들을 수행하도록 할 수 있다.The synopsis text analysis and viewer rating prediction system according to various embodiments may include various modules for operations. The modules included in the synopsis text analysis and audience rating prediction system are implemented by a physical device (eg, the
1.2. 장치 구현1.2. device implementation
도 2는 다양한 실시예들에 따른 서버 및/또는 사용자 디바이스의 구성을 도시한 도면이다.2 is a diagram illustrating a configuration of a server and/or a user device according to various embodiments of the present disclosure;
도 2를 참조하면, 서버(100) 및/또는 사용자 단말(200)은 입/출력부(210), 통신부(220), 데이터베이스(230) 및 프로세서(240)를 포함할 수 있다. Referring to FIG. 2 , the
입/출력부(210)는 사용자 입력을 받거나 또는 사용자에게 정보를 출력하는 각종 인터페이스나 연결 포트 등일 수 있다. 입/출력부(210)는 입력 모듈과 출력 모듈로 구분될 수 있는데, 입력 모듈은 사용자로부터 사용자 입력을 수신한다. 사용자 입력은 키 입력, 터치 입력, 음성 입력을 비롯한 다양한 형태로 이루어질 수 있다. 이러한 사용자 입력을 받을 수 있는 입력 모듈의 예로는 전통적인 형태의 키패드나 키보드, 마우스는 물론, 사용자의 터치를 감지하는 터치 센서, 음성 신호를 입력받는 마이크, 영상 인식을 통해 제스처 등을 인식하는 카메라, 사용자 접근을 감지하는 조도 센서나 적외선 센서 등으로 구성되는 근접 센서, 가속도 센서나 자이로 센서 등을 통해 사용자 동작을 인식하는 모션 센서 및 그 외의 다양한 형태의 사용자 입력을 감지하거나 입력받는 다양한 형태의 입력 수단을 모두 포함하는 포괄적인 개념이다. 여기서, 터치 센서는 디스플레이 패널에 부착되는 터치 패널이나 터치 필름을 통해 터치를 감지하는 압전식 또는 정전식 터치 센서, 광학적인 방식에 의해 터치를 감지하는 광학식 터치 센서 등으로 구현될 수 있다. 이외에도 입력 모듈은 자체적으로 사용자 입력을 감지하는 장치 대신 사용자 입력을 입력받는 외부의 입력 장치를 연결시키는 입력 인터페이스(USB 포트, PS/2 포트 등)의 형태로 구현될 수도 있다. 또 출력 모듈은 각종 정보를 출력해 사용자에게 이를 제공할 수 있다. 출력 모듈은 영상을 출력하는 디스플레이, 소리를 출력하는 스피커, 진동을 발생시키는 햅틱 장치 및 그 외의 다양한 형태의 출력 수단을 모두 포함하는 포괄적인 개념이다. 이외에도 출력 모듈은 상술한 개별 출력 수단을 연결시키는 포트 타입의 출력 인터페이스의 형태로 구현될 수도 있다.The input/output unit 210 may be various interfaces or connection ports for receiving user input or outputting information to the user. The input/output unit 210 may be divided into an input module and an output module, and the input module receives a user input from a user. The user input may be made in various forms including a key input, a touch input, and a voice input. Examples of input modules that can receive such user input include a traditional keypad, keyboard, and mouse, as well as a touch sensor that detects a user's touch, a microphone that receives a voice signal, a camera that recognizes gestures through image recognition, A proximity sensor composed of an illuminance sensor or infrared sensor that detects a user's approach, a motion sensor that recognizes a user's motion through an acceleration sensor or a gyro sensor, and other various types of input means for sensing or receiving various types of user input It is a comprehensive concept that includes all Here, the touch sensor may be implemented as a piezoelectric or capacitive touch sensor for detecting a touch through a touch panel or a touch film attached to the display panel, an optical touch sensor for detecting a touch by an optical method, and the like. In addition, the input module may be implemented in the form of an input interface (USB port, PS/2 port, etc.) for connecting an external input device that receives a user input instead of a device that detects a user input by itself. In addition, the output module can output various information and provide it to the user. The output module is a comprehensive concept including a display that outputs an image, a speaker that outputs a sound, a haptic device that generates vibration, and other various types of output means. In addition, the output module may be implemented in the form of a port-type output interface for connecting the above-described individual output means.
일 예로, 디스플레이 형태의 출력 모듈은 텍스트, 정지 영상, 동영상을 디스플레이 할 수 있다. 디스플레이는 액정 디스플레이(LCD: Liquid Crystal Display), 발광 다이오드(LED: light emitting diode) 디스플레이, 유기 발광 다이오드(OLED: Organic Light Emitting Diode) 디스플레이, 평판 디스플레이(FPD: Flat Panel Display), 투명 디스플레이(transparent display), 곡면 디스플레이(Curved Display), 플렉시블 디스플레이(flexible display), 3차원 디스플레이(3D display), 홀로그래픽 디스플레이(holographic display), 프로젝터 및 그 외의 영상 출력 기능을 수행할 수 있는 다양한 형태의 장치를 모두 포함하는 광의의 영상 표시 장치를 의미하는 개념이다. 이러한 디스플레이는 입력 모듈의 터치 센서와 일체로 구성된 터치 디스플레이의 형태일 수도 있다.For example, the display-type output module may display text, still images, and moving images. The display includes a liquid crystal display (LCD), a light emitting diode (LED) display, an organic light emitting diode (OLED) display, a flat panel display (FPD), and a transparent display. display), a curved display, a flexible display, a three-dimensional display, a holographic display, a projector, and various types of devices capable of performing other image output functions. It is a concept meaning an image display device in a broad sense that includes all. Such a display may be in the form of a touch display integrally formed with the touch sensor of the input module.
통신부(220)는 외부 기기와 통신할 수 있다. 따라서, 서버(100) 및/또는 사용자 단말(200)은 통신부를 통해 외부 기기와 정보를 송수신할 수 있다. 예를 들어, 서버(100) 및/또는 사용자 단말(200)은 통신부를 이용해 상호 간 통신을 수행하거나, 기타 외부 기기와 통신을 수행할 수 있다.The communication unit 220 may communicate with an external device. Accordingly, the
여기서, 통신, 즉 데이터의 송수신은 유선 또는 무선으로 이루어질 수 있다. 이를 위해 통신부는 LAN(Local Area Network)를 통해 인터넷 등에 접속하는 유선 통신 모듈, 이동 통신 기지국을 거쳐 이동 통신 네트워크에 접속하여 데이터를 송수신하는 이동 통신 모듈, 와이파이(Wi-Fi) 같은 WLAN(Wireless Local Area Network) 계열의 통신 방식이나 블루투스(Bluetooth), 직비(Zigbee)와 같은 WPAN(Wireless Personal Area Network) 계열의 통신 방식을 이용하는 근거리 통신 모듈, GPS(Global Positioning System)과 같은 GNSS(Global Navigation Satellite System)을 이용하는 위성 통신 모듈 또는 이들의 조합으로 구성될 수 있다.Here, communication, that is, transmission and reception of data may be performed by wire or wirelessly. To this end, the communication unit includes a wired communication module that accesses the Internet through a local area network (LAN), a mobile communication module that accesses a mobile communication network through a mobile communication base station and transmits and receives data, and a wireless local area network (WLAN) such as Wi-Fi. A short-distance communication module using an area network communication method or a wireless personal area network (WPAN) communication method such as Bluetooth or Zigbee, or a global navigation satellite system (GNSS) such as GPS (Global Positioning System) ) using a satellite communication module or a combination thereof.
데이터베이스(230)는 각종 정보를 저장할 수 있다. 데이터베이스는 데이터를 임시적으로 또는 반영구적으로 저장할 수 있다. 예를 들어, 서버(100)의 데이터베이스에는 서버(100)를 구동하기 위한 운용 프로그램(OS: Operating System), 웹 사이트를 호스팅하기 위한 데이터나 점자 생성을 위한 프로그램 내지는 어플리케이션(예를 들어, 웹 어플리케이션)에 관한 데이터 등이 저장될 수 있다. 또, 데이터베이스는 상술한 바와 같이 모듈들을 컴퓨터 코드 형태로 저장할 수 있다. The
데이터베이스(230)의 예로는 하드 디스크(HDD: Hard Disk Drive), SSD(Solid State Drive), 플래쉬 메모리(flash memory), 롬(ROM: Read-Only Memory), 램(RAM: Random Access Memory) 등이 있을 수 있다. 이러한 데이터베이스는 내장 타입 또는 탈부착 가능한 타입으로 제공될 수 있다.Examples of the
프로세서(240)는 서버(100) 및/또는 사용자 단말(200)의 전반적인 동작을 제어한다. 이를 위해 프로세서(240)는 각종 정보의 연산 및 처리를 수행하고 서버(100)의 구성요소들의 동작을 제어할 수 있다. 예를 들어, 프로세서(240)는 시놉시스 텍스트 분석 및 시청률 예측을 위한 프로그램 내지 어플리케이션을 실행시킬 수 있을 것이다. 프로세서(240)는 하드웨어 소프트웨어 또는 이들의 조합에 따라 컴퓨터나 이와 유사한 장치로 구현될 수 있다. 하드웨어적으로 프로세서(240)는 전기적인 신호를 처리하여 제어 기능을 수행하는 전자 회로 형태로 제공될 수 있으며, 소프트웨어적으로는 하드웨어적인 프로세서(240)를 구동시키는 프로그램 형태로 제공될 수 있다. 한편, 이하의 설명에서 특별한 언급이 없는 경우에는 서버(100) 및/또는 사용자 단말(200)의 동작은 프로세서(240)의 제어에 의해 수행되는 것으로 해석될 수 있다. 즉, 상술한 시놉시스 텍스트 분석 및 시청률 예측 시스템에 구현되는 모듈들이 실행되는 경우, 모듈들은 프로세서(240)가 서버(100) 및/또는 사용자 단말(200)를 이하의 동작들을 수행하도록 제어하는 것으로 해석될 수 있다.The
요약하면, 다양한 실시예들은 다양한 수단을 통해 구현될 수 있다. 예를 들어, 다양한 실시예들은 하드웨어, 펌웨어(firmware), 소프트웨어 또는 그것들의 결합 등에 의해 구현될 수 있다.In summary, various embodiments may be implemented through various means. For example, various embodiments may be implemented by hardware, firmware, software, or a combination thereof.
하드웨어에 의한 구현의 경우, 다양한 실시예들에 따른 방법은 하나 또는 그 이상의 ASICs(application specific integrated circuits), DSPs(digital signal processors), DSPDs(digital signal processing devices), PLDs(programmable logic devices), FPGAs(field programmable gate arrays), 프로세서, 컨트롤러, 마이크로 컨트롤러, 마이크로 프로세서 등에 의해 구현될 수 있다.In the case of implementation by hardware, the method according to various embodiments may include one or more application specific integrated circuits (ASICs), digital signal processors (DSPs), digital signal processing devices (DSPDs), programmable logic devices (PLDs), FPGAs (field programmable gate arrays), may be implemented by a processor, a controller, a microcontroller, a microprocessor, and the like.
펌웨어나 소프트웨어에 의한 구현의 경우, 다양한 실시예들에 따른 방법은 이하에서 설명된 기능 또는 동작들을 수행하는 모듈, 절차 또는 함수 등의 형태로 구현될 수 있다. 예를 들어, 소프트웨어 코드는 메모리에 저장되어 프로세서에 의해 구동될 수 있다. 상기 메모리는 상기 프로세서 내부 또는 외부에 위치할 수 있으며, 이미 공지된 다양한 수단에 의해 상기 프로세서와 데이터를 주고받을 수 있다.In the case of implementation by firmware or software, the method according to various embodiments may be implemented in the form of a module, procedure, or function that performs the functions or operations described below. For example, the software code may be stored in a memory and driven by a processor. The memory may be located inside or outside the processor, and data may be exchanged with the processor by various known means.
2. 다양한 실시예들에 따른 전자 장치의 동작2. Operation of an electronic device according to various embodiments
이하에서는, 상기와 같은 기술적 사상에 기반하여 다양한 실시예들에 대해 보다 상세히 설명한다. 이하에서 설명되는 다양한 실시예들에 대해서는 앞서 설명한 제 1 절의 내용들이 적용될 수 있다. 예를 들어, 이하에서 설명되는 다양한 실시예들에서 정의되지 않은 동작, 기능, 용어 등은 제 1 절의 내용들에 기반하여 수행되고 설명될 수 있다.Hereinafter, various embodiments will be described in more detail based on the above technical idea. The contents of
2.1 시청률 예측 및 출력 동작2.1 Audience Prediction and Output Behavior
이하의 설명에서는 사용자 단말(200)가 시청률 예측 및 출력 동작을 수행함을 전제로 다양한 실시예들에 대하여 설명이나, 다양한 실시예들에 따르면, 사용자 단말(200)로부터 상 드라마 컨텐츠의 시놉시스 텍스트 정보를 획득한 서버(100)가 시청률 예측 및 출력 동작을 수행할 수도 있다. 또는, 다양한 실시예들에 따르면, 하나의 서버(100) 또는 하나의 사용자 단말(200) 각각이 직접 대상 드라마 컨텐츠의 시놉시스 텍스트 정보를 획득(예를 들어, 사용자로부터 직접 입력)하여, 시청률 예측 및 출력 동작을 수행할 수도 있다. 또는, 다양한 실시예들에 따르면, 복수의 사용자 단말(200)들 및/또는 복수의 서버(100)들이 마련되어, 복수의 사용자 단말(200)들 및/또는 복수의 서버(100)들 간에 대상 드라마 컨텐츠의 시놉시스 텍스트 정보 송수신 및 시청률 예측 동작이 각 동작 별로 분배되어, 별개로 실시될 수도 있다.In the following description, various embodiments will be described on the premise that the
도 3은 다양한 실시예들에 따른 시청률 예측 및 출력을 위한 전자 장치의 동작 방법을 도시한 도면이다.3 is a diagram illustrating a method of operating an electronic device for predicting and outputting an audience rating according to various embodiments of the present disclosure;
다양한 실시예들에 따르면, 동작 S310에서, 사용자 단말(200)은 대상 드라마 컨텐츠의 시놉시스 텍스트 정보를 획득할 수 있다.According to various embodiments, in operation S310 , the
예를 들어, 상기 시놉시스 텍스트 정보는 상기 드라마 컨텐츠에 대한 줄거리 개요 또는 전체 내용을 간단히 정리한 텍스트일 수 있다.For example, the synopsis text information may be a text summarizing the plot summary or the entire content of the drama content.
예를 들어, 상기 시놉시스 텍스트 정보는 사용자가 사용자 단말(200)에 직접 입력할 수 있다.For example, the synopsis text information may be directly input by the user into the
예를 들어, 상기 시놉시스 텍스트 정보는 상기 드라마 컨텐츠를 대표하는 단어, 용어, 문구 기타 텍스트 정보를 포함할 수 있으며, 상기 시놉시스 텍스트 정보에 포함된 모든 텍스트는 AI(artificial intelligence) 엔진에 기반한 분석의 대상이 될 수 있다.For example, the synopsis text information may include words, terms, phrases and other text information representing the drama content, and all texts included in the synopsis text information are subject to analysis based on an artificial intelligence (AI) engine. this can be
예를 들어, 사용자 단말(200)은 상기 시놉시스 텍스트 정보의 의미를 정확히 식별하기 위하여 상기 시놉시스 텍스트 정보 상의 오타 또는 띄어쓰기 등 기타 문법 오류가 있는지 판단할 수 있다.For example, in order to accurately identify the meaning of the synopsis text information, the
예를 들어, 사용자 단말(200)은 상기 시놉시스 텍스트 정보 상에 오타 또는 띄어쓰기 등 기타 문법 오류가 존재하여 상기 시놉시스 텍스트 정보의 의미를 정확히 식별하지 못하는 경우, 사용자에게 문법 오류가 존재하는 부분을 표시하고 해당 부분에 대한 수정을 요청할 수 있다.For example, when the
예를 들어, 사용자 단말(200)은 상기 시놉시스 텍스트 정보 상에 오타 또는 띄어쓰기 등 기타 문법 오류가 존재하더라도 상기 시놉시스 텍스트 정보의 의미를 정확히 식별할 수 있는 경우, 문법 오류에 대한 별도의 표시 또는 수정 요청 없이 시청률 예측을 위한 다음 동작을 수행할 수 있다.For example, when the
예를 들어, 사용자 단말(200)은 상기 시놉시스 텍스트 정보 상에서 의미를 식별할 수 있는 단어, 용어, 문구 기타 텍스트 정보가 부족하다고 판단되는 경우, 사용자에게 텍스트 정보의 부족을 표시하고 추가적인 텍스트 정보의 입력을 요청할 수 있다.For example, when it is determined that the word, term, phrase or other text information that can identify the meaning in the synopsis text information is insufficient, the
예를 들어, 사용자 단말(200)은 상기 시놉시스 텍스트 정보가 특정 수의 글자 미만인 경우 또는 특정 개수의 단어 미만인 경우 사용자에게 텍스트 정보의 부족을 표시하고 추가적인 텍스트 정보의 입력을 요청할 수 있으며, 상기 특정 글자의 수 또는 상기 특정 단어의 개수는 사전에 사용자 단말(200)에 구성될 수 있다.For example, when the synopsis text information is less than a specific number of characters or less than a specific number of words, the
예를 들어, 사용자 단말(200)은 상기 시놉시스 텍스트 정보 상에서 의미를 식별할 수 있는 단어, 용어, 문구 기타 텍스트 정보가 과다하다고 판단되는 경우, 사용자에게 텍스트 정보가 충분함을 표시하고 입력된 텍스트 정보의 일부에 대한 삭제를 요청할 수 있다.For example, when it is determined that the word, term, phrase, or other text information that can identify the meaning in the synopsis text information is excessive, the
예를 들어, 사용자 단말(200)은 상기 시놉시스 텍스트 정보가 특정 수의 글자 초과인 경우 또는 특정 개수의 단어 초과인 경우 사용자에게 텍스트 정보의 과다를 표시하고 입력된 텍스트 정보의 일부에 대한 삭제를 요청할 수 있으며, 상기 특정 글자의 수 또는 상기 특정 단어의 개수는 사전에 사용자 단말(200)에 구성될 수 있다.For example, when the synopsis text information exceeds a specific number of characters or a specific number of words, the
다양한 실시예들에 따르면, 동작 S320에서, 사용자 단말(200)은 시놉시스 텍스트 정보를 AI 엔진 (engine)에 입력할 수 있다.According to various embodiments, in operation S320 , the
예를 들어, 사용자 단말(200)은 상기 시놉시스 텍스트 정보를 AI 엔진에 입력 가능하도록 임베딩(embedding) 처리하여 벡터(vector)화 된 정보로서 AI 엔진에 상기 시놉시스 텍스트 정보를 입력할 수 있다.For example, the
예를 들어, 상기 시놉시스 텍스트 정보에 대한 임베딩(embedding) 처리는 자연어를 수치화 및 방향화하는 것을 의미할 수 있으며, 상기 자연어는 한국어, 영어 등 사용자 단말(200)가 인식 가능한 모든 언어를 포함할 수 있다.For example, the embedding processing for the synopsis text information may mean digitizing and directing a natural language, and the natural language may include all languages recognizable by the
예를 들어, AI 엔진에 대한 사용자 단말(200)의 상기 시놉시스 텍스트 정보 입력은 단어, 용어, 문구 등 의미를 파악할 수 있는 모든 단위에서 수행될 수 있다.For example, the input of the synopsis text information of the
다양한 실시예들에 따르면, 동작 S330에서, 사용자 단말(200)은 상기 시놉시스 텍스트 정보에 대한 상기 AI 엔진의 출력 동작에 기초하여, 상기 대상 드라마 컨텐츠를 위한 추천 캐릭터들에 대한 정보, 추천 배우들에 대한 정보, 추천 드라마들에 대한 정보 및 예측 시청률에 대한 정보를 출력할 수 있다.According to various embodiments, in operation S330, the
여기서, 상기 추천 캐릭터들에 대한 정보, 상기 추천 배우들에 대한 정보, 상기 추천 드라마들에 대한 정보 및 상기 예측 시청률에 대한 정보를 출력하기 위한 상기 AI 엔진의 출력 동작은, 후술할 도 5 내지 도 8의 동작에 따라 수행될 수 있다.Here, the output operation of the AI engine for outputting the information on the recommended characters, the information on the recommended actors, the information on the recommended dramas, and the information on the predicted audience rating is shown in FIGS. 5 to 5 to be described later. It can be performed according to the operation of 8.
도 4는 다양한 실시예들에 따른 시청률 예측 및 출력을 위한 UI/UX 일 예를 도시한 도면이다. 예를 들어, 도 4의 예시는 사용자 단말(200)를 위한 UI/UX (user interface/user experience) 일 수 있다.4 is a diagram illustrating an example of a UI/UX for predicting and outputting an audience rating according to various embodiments of the present disclosure; For example, the example of FIG. 4 may be a user interface/user experience (UI/UX) for the
예를 들어, 도 4를 참조하면, '시놉시스*' 로 표시된 제1 영역(401)에는 대상 드라마 컨텐츠에 대한 텍스트가 놓여짐에 따라 시놉시스 텍스트 정보가 입력될 수 있으며, 사용자 단말(200)은, 제1 영역(401)에 시놉시스 텍스트 정보가 입력되면 이를 서버(100)로 송신하고 AI 엔진에 입력할 수 있다. For example, referring to FIG. 4 , in the
예를 들어, 사용자 단말(200)은, 시놉시스 텍스트 정보를 분석하여, 시놉시스 텍스트 정보에 대응하는 추천 캐릭터들 정보 및 추천 배우들 정보를 '주연1*', '주연2*', ..., '조연3*' 등의 카테고리로 표시되는 제2 영역(403)에 표시할 수 있다. For example, the
예를 들어, 사용자 단말(200)은, 사용자에게 제2 영역(403)의 각 카테고리에 복수의 추천 배우들을 표시(display)할 수 있다. 이 때, 각 카테고리는 추천 캐릭터들 정보에 따라 분류된 것일 수 있다.For example, the
예를 들어, 사용자 단말(200)은, 추천 캐릭터들 정보 및 추천 배우들 정보를 분석하여, 시놉시스 텍스트 정보에 대응하는 추천 드라마 정보 및 추천 드라마의 시청률 정보를 제3 영역(405)에 표시할 수 있다. For example, the
도 4의 사용자 단말(200)를 위한 UI/UX 및 사용자 디바이스의 동작은 후술할 도 5 내지 도 8에 개시된 서버(100) 및 AI 엔진의 동작과 연관되어 수행되며, 도 4의 UI/UX 예시는 본 발명의 개시를 위한 하나의 예시로서 본 발명의 다양한 실시예들이 도 4의 UI/UX 형태에 한정되지 않으며 본 발명의 다양한 실시예들을 구현할 수 있는 모든 형태의 UI/UX에 따라 수행될 수 있다.The UI/UX for the
2.2 시놉시스 텍스트 분석 동작2.2 Synopsis text analysis operation
이하의 설명에서는 서버(100)가 시놉시스 텍스트 분석 동작을 수행함을 전제로 다양한 실시예들에 대하여 설명하나, 다양한 실시예들에 따르면, 서버(100)로부터 상 드라마 컨텐츠의 시놉시스 텍스트 정보를 획득한 사용자 단말(200)가 시청률 예측 동작을 수행할 수도 있다. 또는, 다양한 실시예들에 따르면, 하나의 서버(100) 또는 하나의 사용자 단말(200) 각각이 직접 대상 드라마 컨텐츠의 시놉시스 텍스트 정보를 획득(예를 들어, 사용자로부터 직접 입력)하여, 시놉시스 텍스트 분석 동작을 수행할 수도 있다. 또는, 다양한 실시예들에 따르면, 복수의 사용자 단말(200)들 및/또는 복수의 서버(100)들이 마련되어, 복수의 사용자 단말(200)들 및/또는 복수의 서버(100)들 간에 대상 드라마 컨텐츠의 시놉시스 텍스트 정보 송수신 및 시놉시스 텍스트 분석 동작이 각 동작 별로 분배되어, 별개로 실시될 수도 있다.In the following description, various embodiments will be described on the premise that the
도 5는 다양한 실시예들에 따른 시놉시스 텍스트 분석을 위한 전자 장치의 동작 방법을 도시한 도면이다. 5 is a diagram illustrating a method of operating an electronic device for analyzing a synopsis text according to various embodiments of the present disclosure;
다양한 실시예들에 따르면, 동작 S510에서, 서버(100)는 임베딩 된 시놉시스 텍스트 정보를 획득할 수 있다.According to various embodiments, in operation S510 , the
예를 들어, 임베딩 된 시놉시스 텍스트 정보는 서버(100)가 시놉시스 텍스트 정보를 임베딩(embedding) 처리하여 벡터(vector)화한 것일 수 있다.For example, the embedded synopsis text information may be vectorized by the
예를 들어, 임베딩 된 시놉시스 텍스트 정보는 사용자 단말(200)가 상기 시놉시스 텍스트 정보를 AI 엔진에 입력 가능하도록 임베딩(embedding) 처리하여 벡터(vector)화 한 것일 수 있다.For example, the embedded synopsis text information may be vectorized by embedding the synopsis text information so that the
예를 들어, 상기 시놉시스 텍스트 정보에 대한 임베딩(embedding) 처리는 자연어를 수치화 및 방향화하는 것을 의미할 수 있으며, 상기 자연어는 한국어, 영어 등 사용자 단말(200)가 인식 가능한 모든 언어를 포함할 수 있다.For example, the embedding processing for the synopsis text information may mean digitizing and directing a natural language, and the natural language may include all languages recognizable by the
예를 들어, 시놉시스 텍스트 정보는 단순 단어 단위에서 임베딩 처리가 수행될 수 있다. 또는, 시놉시스 텍스트 정보는 형태소(morpheme) 단위의 임베딩 기법인 'FastText' 기법에 의해 임베딩 될 수 있으며, 'FastText' 기법에 따라 형태소 단위에서 임베딩 처리가 수행될 수 있다. For example, embedding processing may be performed on the synopsis text information in units of simple words. Alternatively, the synopsis text information may be embedded by the 'FastText' technique, which is an embedding technique in units of morphes, and embedding processing may be performed in units of morphemes according to the 'FastText' technique.
구체적인 일 예시로서, 도 6은 단어 기반 단순 가공 형태의 임베딩 처리 예시 및 한글 자소 기반 형태소 가공 형태의 임베딩 처리 예시를 나타낸 도면이다. 도 6(a)는 '카리스마'라는 단어가 시놉시스 텍스트에 포함되어 있는 경우 이를 단순 가공 형태의 임베딩 처리한 결과를 나타낸 도면으로서, '카리스마'라는 단어가 포함되어 활용되는 어절들을 유사성에 따라 리스트화 한 것이다. 한편, 도 6(b)는 카리스마'라는 단어가 시놉시스 텍스트에 포함되어 있는 경우 이를 형태소 분석 가공 형태의 임베딩 처리한 결과를 나타낸 도면으로서, '카리스마'라는 단어와 의미가 유사한 단어들을 유사성에 따라 리스트화 한 것이다.As a specific example, FIG. 6 is a diagram illustrating an example of an embedding processing of a word-based simple processing form and an example of an embedding processing of a Hangeul grapheme-based morpheme processing form. 6(a) is a diagram showing the results of embedding processing in a simple processing form when the word 'charisma' is included in the synopsis text. did it Meanwhile, FIG. 6(b) is a diagram showing the result of embedding the word 'charisma' in the form of morphological analysis processing when the word 'charisma' is included in the synopsis text. it will be angry
이 때, 동작 S510에 필요한 임베딩 처리 과정은 서버(100) 또는 사용자 단말(200)와 연동된 AI 엔진의 기계 학습(machine learning)에 기반한 임베딩 학습을 통해 수행될 수 있다.In this case, the embedding process required for operation S510 may be performed through embedding learning based on machine learning of an AI engine interworking with the
예를 들어, 임베딩 학습을 수행하는 AI 엔진은 한글, 영어 등과 같은 자연어를 처리함에 기초하여 임베딩 용 데이터를 획득할 수 있으며, 획득한 임베딩 용 데이터를 형태소 단위로 분석하고 벡터화하여 'FastText' 모델을 학습할 수 있다.For example, an AI engine that performs embedding learning can acquire data for embedding based on processing natural languages such as Korean, English, etc. can learn
다양한 실시예들에 따르면, 동작 S520에서, 서버(100)는 임베딩 된 시놉시스 텍스트 정보에 기초하여 대상 드라마 컨텐츠의 장르를 판단할 수 있다.According to various embodiments, in operation S520 , the
예를 들어, 서버(100)는 임베딩 된 시놉시스 텍스트 정보에 대한 컨텍스트(context) 벡터를 획득하여 대상 드라마 컨텐츠의 장르를 판단할 수 있다.For example, the
예를 들어, 임베딩 된 시놉시스 텍스트 정보에 대한 컨텍스트 벡터는 시놉시스 텍스트 정보에 포함된 모든 단어 정보들을 압축한 벡터이거나, 또는 임베딩 처리가 된 시놉시스 텍스트 정보에 포함된 모든 벡터들을 합친 벡터일 수 있다.For example, the context vector for the embedded synopsis text information may be a vector in which all word information included in the synopsis text information is compressed or a vector in which all vectors included in the synopsis text information that have been embedded are combined.
예를 들어 임베딩 된 시놉시스 텍스트 정보에 대한 컨텍스트 벡터는, 시놉시스 텍스트 정보에 포함된 내용을 바탕으로 드라마 장르를 지시하기 위한 벡터 정보일 수 있다.For example, the context vector for the embedded synopsis text information may be vector information for indicating a drama genre based on content included in the synopsis text information.
이 때, 동작 S520에 필요한 장르 판단 과정은 서버(100) 또는 사용자 단말(200)와 연동된 AI 엔진의 기계 학습(machine learning)에 기반한 앙상블 학습(ensemble learning)을 통해 수행될 수 있다. 여기서, 앙상블 학습은 복수의 기계 학습 방법들을 사용하고 그 결과들을 결합하여 최종 결과를 도출해내는 학습 방법을 의미한다.In this case, the genre determination process required for operation S520 may be performed through ensemble learning based on machine learning of an AI engine interlocked with the
예를 들어, 앙상블 학습을 수행하는 AI 엔진은 AI 엔진 자신이 수행 가능한 복수의 기계 학습 모델들 중 일부를 선택하여 드라마 장르 판단에 대한 앙상블 학습을 수행할 수 있다.For example, an AI engine performing ensemble learning may perform ensemble learning for drama genre determination by selecting some of a plurality of machine learning models that the AI engine itself can perform.
예를 들어, 앙상블 학습을 수행하는 AI 엔진은 임베딩 된 시놉시스 텍스트 정보에 대한 컨텍스트 벡터를 정답 데이터로 학습하고, 복수의 기계 학습 모델들 중 성능이 우수하거나 정확도가 높은 3가지의 기계 학습 모델을 파악하여 앙상블 학습을 수행할 수 있다.For example, an AI engine that performs ensemble learning learns a context vector for embedded synopsis text information as correct answer data, and identifies three machine learning models with excellent performance or high accuracy among a plurality of machine learning models. Thus, ensemble learning can be performed.
예를 들어, 앙상블 학습을 수행하는 AI 엔진은 Catboost Classifier, Ridge Classifier, Linear Discriminant Analysis, Extreme Gradient Boosting, Light Gradient Boosting Machine, Logistic Regression, SVM-Linear Kemel, Random Forest Classifier, Extra Trees Classifier, Gradient Boosting Classifier, K Neighbors Classifier, Nave Bayes, Decision Tree Classifier, Ada Boost Classifier 및/또는 Quadratic Discriminant Analysis와 같은 모델들을 활용할 수 있으며, 만약 앙상블 학습을 수행하는 AI 엔진이 Logistic Regression, Catboost Classifier 및 Light Gradient Boosting Machine 모델들이 우수한 성능을 가진다고 판단하거나 정확도가 높다고 판단되는 경우 해당 3가지의 모델을 통해 앙상블 학습을 수행할 수 있다.For example, AI engines that perform ensemble learning include Catboost Classifier, Ridge Classifier, Linear Discriminant Analysis, Extreme Gradient Boosting, Light Gradient Boosting Machine, Logistic Regression, SVM-Linear Kemel, Random Forest Classifier, Extra Trees Classifier, Gradient Boosting Classifier. , K Neighbors Classifier, Na Models such as Bayes, Decision Tree Classifier, Ada Boost Classifier, and/or Quadratic Discriminant Analysis can be used, and if the AI engine performing ensemble learning is judged to have excellent performance, Logistic Regression, Catboost Classifier, and Light Gradient Boosting Machine models Or, if it is determined that the accuracy is high, ensemble learning can be performed through the three models.
예를 들어, 임베딩 된 시놉시스 텍스트 정보에 대한 앙상블 학습의 결과로서 판단된 장르는, 보편적으로 드라마 장르를 분류하는 여러 카테고리 중 하나로서 판단될 수 있다. For example, a genre determined as a result of ensemble learning for embedded synopsis text information may be determined as one of several categories that generally classify a drama genre.
구체적으로, 서버(100)에는 보편적으로 드라마 장르를 분류하는 복수의 카테고리들이 미리 설정될 수 있다. 드라마 장르 분류에 대한 일 예시로서, 드라마 장르를 분류하는 복수의 카테고리들은 '가족:0', '경제:1', '로맨스/멜로:2', '리얼리티:3', '막장:4', '법률:5', '복수:6', '사극:7', '성장:8', '수사/범죄/스릴러/미스터리:9', '액션:10', '오피스:11', '음식/요리:12', '의학:13', '정치:14', '청춘:15', '코미디:16', '판타지:17', '풍자:18', '휴머니즘:19', 및 '힐링:20' 와 같이 구성될 수 있다. Specifically, a plurality of categories that generally classify drama genres may be preset in the
만약 대상 드라마 컨텐츠에 대한 시놉시스 텍스트 정보가 “회사 가기 싫은 사람들의 아주 사소하고도 위대한 이야기. 이 시대의 평범한 직장인들을 위한 초밀착 리얼 오피스 드라마”와 같이 입력되었다면, 이 시놉시스 텍스트 정보를 임베딩 처리하여 획득한 컨텍스트 벡터는 '직장인', '오피스'와 같은 용어들을 종합함에 따라 카테고리 '오피스:11'를 지시할 수 있으며, 그에 따라서 서버(100)는 대상 드라마 컨텐츠에 대한 장르를 오피스 드라마에 해당한다고 판단할 수 있다.If the synopsis text information for the target drama content is “ A very small but great story of people who do not want to go to work. If it is input like “ a super close real office drama for ordinary office workers of this age ”, the context vector obtained by embedding this synopsis text information is a category 'office: 11 ', and accordingly, the
또는 만약 대상 드라마 컨텐츠에 대한 시놉시스 텍스트 정보가 “한국의 실리콘 벨리에서 성공을 꿈꾸며 스타트업에 뛰어든 청춘들의 시작과 성장을 그린 드라마”와 같이 입력되었다면, 이 시놉시스 텍스트 정보를 임베딩 처리하여 획득한 컨텍스트 벡터는 '성공', 꿈꾸며', '스타트업', '청춘', '성장'과 같은 용어들을 종합함에 따라 카테고리 '성장:8'을 지시할 수 있으며, 그에 따라서 서버(100)는 대상 드라마 컨텐츠에 대한 장르를 성장 드라마에 해당한다고 판단할 수 있다.Alternatively, if the synopsis text information for the target drama content is input like “ a drama depicting the beginning and growth of young people who jumped into startups dreaming of success in Korea’s Silicon Valley, ” the context vector obtained by embedding this synopsis text information. may indicate the category 'growth: 8' by synthesizing terms such as 'success', dreaming', 'startup', 'youth', and 'growth', and accordingly the
다양한 실시예들에 따르면, 동작 S530에서, 서버(100)는 대상 드라마 컨텐츠에 대해 판단된 장르를 기초로 하여, 대상 드라마 컨텐츠를 위해 추천할 캐릭터들 판단하고 추천 캐릭터들을 위해 추천할 배우들을 판단할 수 있다.According to various embodiments, in operation S530, the
예를 들어, 서버(100)는 대상 드라마 컨텐츠에 대해 판단된 장르에 출연했던 배우들의 목록을 획득할 수 있으며, 해당 배우들이 연기했던 드라마 상 캐릭터들의 인물 설명을 엠베딩 하여 캐릭터 임베딩 정보들을 획득할 수 있다. 즉, 서버(100)는 대상 드라마 컨텐츠에 대해 판단된 장르에 출연했던 배우들이 연기했던 드라마 상 캐릭터들을 캐릭터 벡터로서 계산할 수 있다.For example, the
예를 들어, 서버(100)는 계산한 캐릭터 벡터들과 기존에 획득했던 임베딩 된 시놉시스 텍스트 정보에 대한 컨텍스트 벡터 사이의 유사성을 비교하여 해당 시놉시스 텍스트 정보에 적합한 캐릭터들을 찾아내고, 해당 캐릭터들을 연기한 배우들을 판단할 수 있다.For example, the
이 때, 동작 S530에 필요한 추천 캐릭터 및 추천 배우 판단 과정은 서버(100) 또는 사용자 단말(200)와 연동된 AI 엔진의 기계 학습에 기반한 임베딩 학습을 통해 수행될 수 있다.In this case, the process of determining the recommended character and the recommended actor required for operation S530 may be performed through embedding learning based on machine learning of an AI engine interlocked with the
예를 들어, 임베딩 학습을 수행하는 AI 엔진은 드라마 컨텐츠에 대해 판단된 장르에 출연했던 배우들의 목록을 획득할 수 있으며, 해당 배우들이 연기했던 드라마 상 캐릭터들의 인물 설명을 'FastText' 모델에 따라 처리함에 기초하여 캐릭터 벡터들을 획득할 수 있다.For example, an AI engine that performs embedding learning can obtain a list of actors who appeared in a genre judged for drama content, and process the descriptions of characters in the drama played by the actors according to the 'FastText' model Character vectors may be obtained based on the
예를 들어, 서버(100)는 찾아낸 캐릭터들 배우들에 특성 문구를 추가하여 그 벡터를 더함으로써 더 적합한 캐릭터를 추천할 수도 있다. 구체적으로, 대상 드라마 컨텐츠에 대해 판단된 장르에 출연했던 배우들이 연기했던 드라마 상 캐릭터들에 대하여 계산한 캐릭터 벡터들에, 특성 문구가 임베딩 된 벡터를 더함으로써 유사성을 다시 판단하여 더 적합한 캐릭터를 추천할 수 있다. 일 예로, 특성 문구가 '카리스마 넘치는', '재벌가', 또는 '나쁜 남자'라면, 각 특성 문구가 임베딩 된 벡터를 계산하고 이미 획득한 캐릭터 벡터들과 합산하여 새로운 캐릭터 벡터를 획득할 수 있으며, 이를 다시 임베딩 된 시놉시스 텍스트 정보에 대한 컨텍스트 벡터와 유사성을 비교하여 더 적합한 캐릭터 및 그에 해당하는 배우를 추천할 수 있다.For example, the
다양한 실시예들에 따르면, 동작 S540에서, 서버(100)는 추천된 배우들의 조합을 위한 추천 드라마들을 판단할 수 있다.According to various embodiments, in operation S540 , the
예를 들어, 사용자는 서버(100)가 판단한 추천 배우들의 전부 또는 일부를 추천 드라마 판단을 위한 입력 값으로 설정할 수 있다.For example, the user may set all or some of the recommended actors determined by the
예를 들어, 서버(100)는 추천된 배우들에 대해 임베딩 된 벡터들을 계산하고, 계산된 벡터들의 합을 추천 드라마의 벡터로서 활용할 수 있다. 즉, 추천된 배우들의 조합에 대해 임베딩 된 벡터를 추천 드라마의 벡터로서 활용할 수 있다.For example, the
예를 들어, 서버(100)는 문장, 문단 또는 문서 단위의 임베딩 기법인 'Doc2Vex' 기법을 통해 드라마들과 각 드라마들에 출연했던 배우들 간의 관계를 벡터로 임베딩 할 수 있다.For example, the
이 때, 동작 S540에 필요한 추천 캐릭터 및 추천 배우 판단 과정은 서버(100) 또는 사용자 단말(200)와 연동된 AI 엔진의 기계 학습에 기반한 임베딩 학습을 통해 수행될 수 있다.In this case, the process of determining the recommended character and the recommended actor required for operation S540 may be performed through embedding learning based on machine learning of an AI engine interlocked with the
예를 들어, 임베딩 학습을 수행하는 AI 엔진은 드라마들 및 각 드라마들에 출연했던 배우들에 대한 정보를 획득할 수 있으며, 각 드라마들을 'Doc2Vex' 모델에 따라 처리함에 기초하여 드라마 임베딩 벡터들을 획득할 수 있다. 획득한 드라마 임베딩 벡터들은, 추천된 배우들의 조합에 대해 임베딩 된 벡터와 비교하여 유사성이 판단될 수 있다.For example, an AI engine that performs embedding learning may acquire information about dramas and actors who appeared in each drama, and obtain drama embedding vectors based on processing each drama according to the 'Doc2Vex' model can do. Similarity may be determined by comparing the obtained drama embedding vectors with vectors embedded for a combination of recommended actors.
구체적인 일 예시로서, 도 7은 추천된 배우들의 조합에 따른 드라마 추천의 예시를 나타낸 도면이다. 도 7(a)는 '조보아', '정연주', '박해진', '최광일' 및 '우정국' 배우들의 조합에 대하여 추천될 수 있는 드라마들을 유사성에 따라 리스트화 한 것이다. 한편, 도 7(b)는 다른 배우들은 동일하되 '조보아' 대신 '김혜리'를 입력 값 변경하여 달리 구성된 배우들의 조합에 대해 추천될 수 있는 드라마들을 유사성에 따라 리스트화 한 것으로서, 도 7(a)의 추천 드라마 리스트와는 일부 차이가 있음을 확인할 수 있다. '조보아' 배우에 대하여 임베딩 된 벡터가 '김혜리' 배우에 대하여 임베딩 된 벡터와 다르므로, 추천된 배우들에 대해 임베딩 된 벡터들을 합산한 결과도 달라지게 되어 추천 드라마 리스트 역시 차이가 발생하게 된다.As a specific example, FIG. 7 is a diagram illustrating an example of drama recommendation according to a combination of recommended actors. 7(a) is a list of dramas that can be recommended for combinations of actors 'Jo Bo-ah', 'Jeong Yeon-ju', 'Park Hae-jin', ' Choi Kwang-il' and ' Woo Jung-guk' according to their similarity. On the other hand, FIG. 7(b) is a list of dramas that can be recommended for a combination of actors configured differently by changing the input value of 'Kim Hye-ri' instead of 'Jo Bo-ah' although other actors are the same, according to similarity, and FIG. 7 ( It can be seen that there are some differences from the recommended drama list in a). Since the vector embedded for the actor 'Boa Jo' is different from the vector embedded for the actor 'Kim Hye-ri', the result of adding up the vectors embedded for the recommended actors is also different, so the recommended drama list also differs. .
다양한 실시예들에 따르면, 동작 S550에서, 서버(100)는 추천된 드라마들을 바탕으로 예측 시청률 정보를 판단할 수 있다.According to various embodiments, in operation S550 , the
예를 들어, 상기 대상 드라마 컨텐츠에 예측 시청률 정보는 수치화된 정보로서 출력될 수 있으며, 백분율 (%) 단위로서 표시될 수 있다.For example, the predicted audience rating information on the target drama content may be output as numerical information, and may be displayed as a percentage (%) unit.
예를 들어, 예측 시청률 정보는 추천된 드라마들의 시청률을 바탕으로 구성되는 것일 수 있다.For example, the predicted audience rating information may be configured based on ratings of recommended dramas.
예를 들어, 예측 시청률 정보는 추천된 드라마들 중 유사성이 가장 높은 드라마의 전 회 시청률 값들을 포함할 수 있다.For example, the predicted audience rating information may include previous rating values of a drama with the highest similarity among recommended dramas.
예를 들어, 예측 시청률 정보는 추천된 드라마들 중 유사성이 가장 높은 드라마의 전 회 평균 시청률 값들을 포함할 수 있다.For example, the predicted audience rating information may include previous average audience rating values of a drama with the highest similarity among recommended dramas.
예를 들어, 예측 시청률 정보는 추천된 드라마들 중 유사성이 가장 높은 드라마의 전 회 시청률 값들을 포함하고, 전 회 시청률 값들 중 최저 시청률 값 및/또는 최고 시청률 값을 별도로 표시할 수 있다.For example, the predicted audience rating information may include previous audience rating values of a drama with the highest similarity among recommended dramas, and may separately display a lowest audience rating value and/or a highest audience rating value among previous audience rating values.
예를 들어, 예측 시청률 정보는 추천된 모든 드라마들의 시청률을 평균값으로 한 시청률 값을 포함할 수 있다.For example, the predicted audience rating information may include a rating value obtained by taking the ratings of all recommended dramas as an average value.
예를 들어, 예측 시청률 정보는 추천된 드라마들 중 가장 높은 시청률을 기록했던 드라마의 시청률과 동일한 시청률 값을 포함할 수 있다.For example, the predicted audience rating information may include a rating value equal to the rating of a drama that recorded the highest rating among recommended dramas.
2.3. AI 엔진 획득 동작2.3. AI engine acquisition behavior
인공지능 시스템은 인간 수준의 지능을 구현하는 컴퓨터 시스템이며, 기존 Rule 기반 스마트 시스템과 달리 기계가 스스로 학습하고 판단하며 똑똑해지는 시스템이다. 인공지능 시스템은 사용할수록 인식률이 향상되고 사용자 취향을 보다 정확하게 이해할 수 있게 되어, 기존 Rule 기반 스마트 시스템은 점차 딥러닝 기반 인공지능 시스템으로 대체되고 있다.An artificial intelligence system is a computer system that implements human-level intelligence, and unlike the existing rule-based smart system, it is a system in which a machine learns, judges, and becomes smarter by itself. As artificial intelligence systems are used, the recognition rate improves and users can understand user preferences more accurately.
인공지능 기술은 기계 학습(딥러닝) 및 기계 학습을 활용한 요소 기술들로 구성된다.Artificial intelligence technology consists of machine learning (deep learning) and element technologies using machine learning.
기계 학습은 입력 데이터들의 특징을 스스로 분류/학습하는 알고리즘 기술이며, 요소 기술은 딥러닝 등의 기계 학습 알고리즘을 활용하여 인간 두뇌의 인지, 판단 등의 기능을 모사하는 기술로서, 언어적 이해, 시각적 이해, 추론/예측, 지식 표현, 동작 제어 등의 기술 분야로 구성된다.Machine learning is an algorithm technology that categorizes/learns the characteristics of input data by itself, and element technology uses machine learning algorithms such as deep learning to simulate functions such as cognition and judgment of the human brain. It consists of technical fields such as understanding, reasoning/prediction, knowledge expression, and motion control.
인공지능 기술이 응용되는 다양한 분야는 다음과 같다. 언어적 이해는 인간의 언어/문자를 인식하고 응용/처리하는 기술로서, 자연어 처리, 기계 번역, 대화시스템, 질의 응답, 음성 인식/합성 등을 포함한다. 시각적 이해는 사물을 인간의 시각처럼 인식하여 처리하는 기술로서, 객체 인식, 객체 추적, 영상 검색, 사람 인식, 장면 이해, 공간 이해, 영상 개선 등을 포함한다. 추론 예측은 정보를 판단하여 논리적으로 추론하고 예측하는 기술로서, 지식/확률 기반 추론, 최적화 예측, 선호 기반 계획, 추천 등을 포함한다. 지식 표현은 인간의 경험정보를 지식데이터로 자동화 처리하는 기술로서, 지식 구축(데이터 생성/분류), 지식 관리(데이터 활용) 등을 포함한다. 동작 제어는 차량의 자율 주행, 로봇의 움직임을 제어하는 기술로서, 움직임 제어(항법, 충돌, 주행), 조작 제어(행동 제어) 등을 포함한다.The various fields where artificial intelligence technology is applied are as follows. Linguistic understanding is a technology for recognizing and applying/processing human language/text, and includes natural language processing, machine translation, dialogue system, question and answer, and speech recognition/synthesis. Visual understanding is a technology for recognizing and processing objects like human vision, and includes object recognition, object tracking, image search, human recognition, scene understanding, spatial understanding, image improvement, and the like. Inference prediction is a technology for logically reasoning and predicting by judging information, and includes knowledge/probability-based reasoning, optimization prediction, preference-based planning, and recommendation. Knowledge expression is a technology that automatically processes human experience information into knowledge data, and includes knowledge construction (data generation/classification) and knowledge management (data utilization). Motion control is a technology for controlling autonomous driving of a vehicle and movement of a robot, and includes motion control (navigation, collision, driving), manipulation control (action control), and the like.
이하의 설명에서는 서버(100)가 AI 엔진 획득 동작을 수행함을 전제로 다양한 실시예들에 대하여 설명하였으나, 다양한 실시예들에 따르면, 서버(100) 외부의 다른 서버가 AI 엔진 획득 동작을 수행할 수도 있다. 또는, 다양한 실시예들에 따르면, 복수의 사용자 단말(200)들 및/또는 복수의 서버(100)들이 마련되어, 복수의 사용자 단말(200)들 및/또는 복수의 서버(100)들 간에 AI 엔진 획득 동작의 각 동작이 분배되어, 별개로 실시될 수도 있다. 후술하는 과정에 의해 획득되는 AI 엔진은, 전술한 도 3의 시청률 예측 및 출력 동작 및 도 5의 시놉시스 텍스트 분석 동작에서 언급되는 기계 학습(machine learning)에 활용될 수 있다.In the following description, various embodiments have been described on the premise that the
도 8은 다양한 실시예들에 따른 시놉시스 텍스트 분석을 위한 AI (artificial intelligence) 엔진을 획득하는 과정을 도시한 도면이다.8 is a diagram illustrating a process of acquiring an artificial intelligence (AI) engine for analyzing synopsis text according to various embodiments of the present disclosure;
도 8을 참조하면, 예를 들어, 서버(100)는, 종래의 드라마 장르들에 대한 데이터를 수집할 수 있다. 예를 들어, 종래의 드라마 장르들에 대한 데이터는, 일정 기간 동안 송출된 드라마들의 장르에 대한 데이터들이 수집될 수 있다. 예를 들어 드라마 장르들에 대한 데이터는 시청자의 성별, 시청자의 연령대, 드라마의 송출 시간대 등 다양한 특성들 중 하나 이상의 특성에 기초하여 수집될 수 있다.Referring to FIG. 8 , for example, the
예를 들어, 서버(100)는, 종래의 드라마들에 대한 데이터에 기초하여 학습 데이터를 획득할 수 있다. 예를 들어, 학습 데이터는 훈련용 데이터 및 테스트용 데이터를 포함할 수 있다.For example, the
예를 들어, 서버(100)는, 학습 데이터를 훈련용 데이터 및 테스트용 데이터로 분류할 수 있다. 예를 들어, 훈련용 데이터는 모델을 학습시키는데 활용되고, 테스트용 데이터는 학습된 모델을 검증 및 업데이트 하는데 활용될 수 있다.For example, the
예를 들어, 서버(100)는 학습된 모델에 기초하여 테스트용 데이터를 통해 피드백 정보를 획득할 수 있다. For example, the
예를 들어, 피드백 정보는, 서버(100) 관리자로부터 입력될 수 있다. For example, the feedback information may be input from the
예를 들어, 서버(100)는, 피드백에 기초하여 학습된 모델을 업데이트할 수 있다. For example, the
예를 들어, 서버(100)는 피드백에 기초하여 학습된 모델의 특성을 수정하고, 수정된 모델에 기초하여 테스트용 드라마 데이터를 가공하고, 다시 피드백을 획득하여 업데이트 하는 과정을 반복할 수 있다.For example, the
예를 들어, 서버(100)는 반복 횟수가 미리 설정된 임계값 (예를 들어, 3-5회)에 도달하면, 동작을 종료하고 학습된 모델을 AI 엔진으로서 획득할 수 있다.For example, when the number of iterations reaches a preset threshold value (eg, 3-5 times), the
본 명세서와 도면에 개시된 본 발명의 실시 예들은 본 발명의 기술 내용을 쉽게 설명하고 본 발명의 이해를 돕기 위해 특정 예를 제시한 것일 뿐이며, 본 발명의 범위를 한정하고자 하는 것은 아니다. 즉 본 발명의 기술적 사상에 바탕을 둔 다른 변형 예들이 실시 가능하다는 것은 본 발명의 속하는 기술 분야에서 통상의 지식을 가진 자에게 자명한 것이다. 또한 상기 각각의 실시 예는 필요에 따라 서로 조합되어 운용할 수 있다. 예컨대, 본 발명의 모든 실시 예는 일부분들이 서로 조합되어 시스템에 의해 구현될 수 있다.The embodiments of the present invention disclosed in the present specification and drawings are merely provided for specific examples to easily explain the technical content of the present invention and help the understanding of the present invention, and are not intended to limit the scope of the present invention. That is, it will be apparent to those of ordinary skill in the art to which the present invention pertains that other modified examples can be implemented based on the technical spirit of the present invention. In addition, each of the above embodiments may be operated in combination with each other as needed. For example, all embodiments of the present invention may be implemented by a system in which parts are combined with each other.
또한, 본 발명에 따른 시스템 등에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다.In addition, the method according to the system or the like according to the present invention may be implemented in the form of program instructions that can be executed through various computer means and recorded in a computer-readable medium.
이와 같이, 본 발명의 다양한 실시 예들은 특정 관점에서 컴퓨터 리드 가능 기록 매체(computer readable recording medium)에서 컴퓨터 리드 가능 코드(computer readable code)로서 구현될 수 있다. 컴퓨터 리드 가능 기록 매체는 컴퓨터 시스템에 의해 리드될 수 있는 데이터를 저장할 수 있는 임의의 데이터 저장 디바이스이다. 컴퓨터 리드 가능 기록 매체의 예들은 읽기 전용 메모리(read only memory: ROM)와, 랜덤-접속 메모리(random access memory: RAM)와, 컴팩트 디스크- 리드 온니 메모리(compact disk-read only memory: CD-ROM)들과, 마그네틱 테이프(magnetic tape)들과, 플로피 디스크(floppy disk)들과, 광 데이터 저장 디바이스들, 및 캐리어 웨이브(carrier wave)들(인터넷을 통한 데이터 송신 등)을 포함할 수 있다. 컴퓨터 리드 가능 기록 매체는 또한 네트워크 연결된 컴퓨터 시스템들을 통해 분산될 수 있고, 따라서 컴퓨터 리드 가능 코드는 분산 방식으로 저장 및 실행된다. 또한, 본 발명의 다양한 실시 예들을 성취하기 위한 기능적 프로그램들, 코드, 및 코드 세그먼트(segment)들은 본 발명이 적용되는 분야에서 숙련된 프로그래머들에 의해 쉽게 해석될 수 있다.As such, various embodiments of the present invention may be implemented as computer readable codes in a computer readable recording medium from a specific point of view. A computer readable recording medium is any data storage device capable of storing data that can be read by a computer system. Examples of computer readable recording media include read only memory (ROM), random access memory (RAM), and compact disk-read only memory (CD-ROM). ), magnetic tapes, floppy disks, optical data storage devices, and carrier waves (such as data transmission over the Internet). The computer readable recording medium may also be distributed over network-connected computer systems, so that the computer readable code is stored and executed in a distributed manner. In addition, functional programs, codes, and code segments for achieving various embodiments of the present invention may be easily interpreted by programmers skilled in the field to which the present invention is applied.
또한 본 발명의 다양한 실시 예들에 따른 장치 및 방법은 하드웨어, 소프트웨어 또는 하드웨어 및 소프트웨어의 조합의 형태로 실현 가능하다는 것을 알 수 있을 것이다. 이러한 소프트웨어는 예를 들어, 삭제 가능 또는 재 기록 가능 여부와 상관없이, ROM 등의 저장 장치와 같은 휘발성 또는 비 휘발성 저장 장치, 또는 예를 들어, RAM, 메모리 칩, 장치 또는 집적 회로와 같은 메모리, 또는 예를 들어 콤팩트 디스크(compact disk: CD), DVD, 자기 디스크 또는 자기 테이프 등과 같은 광학 또는 자기적으로 기록 가능함과 동시에 기계(예를 들어, 컴퓨터)로 읽을 수 있는 저장 매체에 저장될 수 있다. 본 발명의 다양한 실시 예들에 따른 방법은 제어부 및 메모리를 포함하는 컴퓨터 또는 이와 같은 메모리 또는 컴퓨터를 포함한 차량 등에 의해 구현될 수 있고, 이러한 메모리는 본 발명의 실시 예들을 구현하는 명령들을 포함하는 프로그램 또는 프로그램들을 저장하기에 적합한 기계로 읽을 수 있는 저장 매체의 한 예임을 알 수 있을 것이다. In addition, it will be appreciated that the apparatus and method according to various embodiments of the present invention can be realized in the form of hardware, software, or a combination of hardware and software. Such software may contain, for example, a volatile or non-volatile storage device, such as a storage device, such as a ROM, or a memory such as, for example, RAM, a memory chip, device or integrated circuit, whether erasable or rewritable; or, for example, a compact disk (CD), DVD, magnetic disk or magnetic tape, etc. may be stored in an optically or magnetically recordable and machine (eg computer) readable storage medium. . The method according to various embodiments of the present invention may be implemented by a computer including a controller and a memory or a vehicle including such a memory or a computer, and the memory is a program including instructions for implementing embodiments of the present invention or It will be appreciated that this is an example of a machine-readable storage medium suitable for storing programs.
따라서, 본 발명은 본 명세서의 청구항에 기재된 장치 또는 방법을 구현하기 위한 코드를 포함하는 프로그램 및 이러한 프로그램을 저장하는 기계(컴퓨터 등)로 읽을 수 있는 저장 매체를 포함한다. 또한, 이러한 프로그램은 유선 또는 무선 연결을 통해 전달되는 통신 신호와 같은 임의의 매체를 통해 전자적으로 이송될 수 있고, 본 발명은 이와 균등한 것을 적절하게 포함한다.Accordingly, the present invention includes a program including code for implementing the apparatus or method described in the claims of the present specification, and a machine (computer, etc.) readable storage medium storing the program. Also, such a program may be transmitted electronically through any medium such as a communication signal transmitted through a wired or wireless connection, and the present invention suitably includes the equivalent thereof.
상기에서는 본 발명의 실시 예들을 참조하여 설명하였지만, 본 명세서와 도면에 개시된 본 발명의 실시 예들은 본 발명의 기술 내용을 쉽게 설명하고 본 발명의 이해를 돕기 위해 특정 예를 제시한 것일 뿐이며 본 발명의 범위를 한정하고자 하는 것은 아니다. 또한 앞서 설명된 본 발명에 따른 실시 예들은 예시적인 것에 불과하며, 당해 분야에서 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 범위의 실시 예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 다음의 특허청구범위에 의해서 정해져야 할 것이다.Although the above has been described with reference to the embodiments of the present invention, the embodiments of the present invention disclosed in the present specification and drawings are merely presented as specific examples to easily explain the technical content of the present invention and help the understanding of the present invention. It is not intended to limit the scope of In addition, the embodiments according to the present invention described above are merely exemplary, and those of ordinary skill in the art will understand that various modifications and equivalent ranges of embodiments are possible therefrom. Accordingly, the true technical protection scope of the present invention should be defined by the following claims.
100: 서버
200: 사용자 디바이스
210: 입/출력부
220: 통신부
230: 데이터베이스
240: 프로세서100: server
200: user device
210: input/output unit 220: communication unit
230: database 240: processor
Claims (1)
하나 이상의 인스트럭션(instruction)을 저장하는 하나 이상의 메모리; 를 포함하고,
상기 프로세서는:
대상 드라마 컨텐츠의 시놉시스 텍스트 정보를 획득하고,
상기 시놉시스 텍스트 정보를 AI(artificial intelligence) 엔진 (engine)에 입력하도록 제어하고,
상기 시놉시스 텍스트 정보에 대한 상기 AI 엔진의 출력 동작에 기초하여, 상기 대상 드라마 컨텐츠를 위한 추천 캐릭터들에 대한 정보, 추천 배우들에 대한 정보, 추천 드라마들에 대한 정보 및 예측 시청률에 대한 정보를 출력(output)하도록 제어하고,
상기 AI 엔진의 출력 동작은:
상기 시놉시스 텍스트 정보를 벡터(vector)로 변환하는 임베딩(embedding)이 적용된 임베딩 된 시놉시스 텍스트 정보를 획득하는 동작;
상기 임베딩 된 시놉시스 텍스트 정보에 기초하여, 상기 대상 드라마 컨텐츠의 장르를 판단하는 동작;
상기 판단된 장르에 기초하여, 상기 추천 캐릭터들 및 상기 추천 배우들을 판단하는 동작; 및
상기 판단된 추천 배우들의 조합에 기초하여, 상기 추천 드라마들을 판단하는 동작;
상기 판단된 추천 드라마들에 기초하여, 상기 예측 시청률을 판단하는 동작; 을 포함하는 것을 특징으로 하며,
상기 시놉시스 텍스트 정보를 벡터(vector)로 변환하는 임베딩(embedding)이 적용된 임베딩 된 시놉시스 텍스트 정보를 획득하는 동작은,
상기 시놉시스 텍스트 정보를 상기 AI 엔진에 입력 가능하도록 임베딩 처리하여 벡터화하는 것을 의미하고,
상기 대상 드라마 컨텐츠의 장르를 판단하는 동작은, 상기 AI 엔진의 앙상블 학습(ensemble learning)에 기초하여 수행되고,
상기 앙상블 학습은, 모델(model)에 상기 AI 엔진이 수행 가능한 복수의 기계 학습(machine learning)들을 적용함에 기초하여 구성되며,
상기 앙상블 학습은 상기 복수의 기계 학습들을 통해 종래의 드라마 장르들을 처리함에 기초하여 수행되는, 서버.processor; and
one or more memories storing one or more instructions; including,
The processor is:
Acquire synopsis text information of target drama content,
Controlling the synopsis text information to be input to an artificial intelligence (AI) engine,
Based on the output operation of the AI engine with respect to the synopsis text information, information on recommended characters for the target drama content, information on recommended actors, information on recommended dramas, and information on predicted audience ratings are output (output) to control,
The output operation of the AI engine is:
obtaining embedded synopsis text information to which embedding for converting the synopsis text information into a vector is applied;
determining a genre of the target drama content based on the embedded synopsis text information;
determining the recommended characters and the recommended actors based on the determined genre; and
determining the recommended dramas based on the determined combination of recommended actors;
determining the predicted audience rating based on the determined recommended dramas; It is characterized in that it comprises
The operation of obtaining the embedded synopsis text information to which embedding for converting the synopsis text information into a vector is applied,
It means to vectorize the synopsis text information by embedding it so that it can be input to the AI engine,
The operation of determining the genre of the target drama content is performed based on ensemble learning of the AI engine,
The ensemble learning is configured based on applying a plurality of machine learning that the AI engine can perform to a model,
wherein the ensemble learning is performed based on processing conventional drama genres through the plurality of machine learnings.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210177211A KR102486806B1 (en) | 2020-12-30 | 2021-12-13 | server that analyzes synopsis text and predicts viewer ratings based on artificial intelligence |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200187819A KR102340485B1 (en) | 2020-12-30 | 2020-12-30 | method for text analysis and audience rating prediction of synopsis |
KR1020210177211A KR102486806B1 (en) | 2020-12-30 | 2021-12-13 | server that analyzes synopsis text and predicts viewer ratings based on artificial intelligence |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200187819A Division KR102340485B1 (en) | 2020-12-30 | 2020-12-30 | method for text analysis and audience rating prediction of synopsis |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20220097239A true KR20220097239A (en) | 2022-07-07 |
KR102486806B1 KR102486806B1 (en) | 2023-01-11 |
Family
ID=79033469
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200187819A KR102340485B1 (en) | 2020-12-30 | 2020-12-30 | method for text analysis and audience rating prediction of synopsis |
KR1020210177211A KR102486806B1 (en) | 2020-12-30 | 2021-12-13 | server that analyzes synopsis text and predicts viewer ratings based on artificial intelligence |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200187819A KR102340485B1 (en) | 2020-12-30 | 2020-12-30 | method for text analysis and audience rating prediction of synopsis |
Country Status (1)
Country | Link |
---|---|
KR (2) | KR102340485B1 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102643159B1 (en) * | 2022-01-19 | 2024-03-04 | 채현민 | A matching method that finds empty space in lcl containers in real time during container import and export |
CN117909543B (en) * | 2024-01-25 | 2024-08-13 | 华策影视(北京)有限公司 | Drama recommendation method based on authored episode evaluation |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018131576A1 (en) * | 2017-01-10 | 2018-07-19 | 株式会社電通 | Advertisement slot optimization system and advertisement slot optimization method in broadcast media such as television |
-
2020
- 2020-12-30 KR KR1020200187819A patent/KR102340485B1/en active IP Right Grant
-
2021
- 2021-12-13 KR KR1020210177211A patent/KR102486806B1/en active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018131576A1 (en) * | 2017-01-10 | 2018-07-19 | 株式会社電通 | Advertisement slot optimization system and advertisement slot optimization method in broadcast media such as television |
Non-Patent Citations (3)
Title |
---|
강수연 외 3명. 국내 드라마 시청률 예측 및 영향요인 분석. 2015.07.26. * |
이상훈 외3, 텍스트 마이닝을 활용한 영화흥행 예측 연구, 한국데이터정보과학회지 v.26 no.6. 2015.11.30. * |
최현종 외3, 데이터 마이닝을 통한 지상파 드라마 첫 회 시청률 예측 모형 연구, 한국정보기술학회논문지 15(1). 2017.01.31. * |
Also Published As
Publication number | Publication date |
---|---|
KR102340485B1 (en) | 2021-12-17 |
KR102486806B1 (en) | 2023-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10977452B2 (en) | Multi-lingual virtual personal assistant | |
CN112189229B (en) | Skill discovery for computerized personal assistants | |
US10789755B2 (en) | Artificial intelligence in interactive storytelling | |
US10896679B1 (en) | Ambient device state content display | |
WO2021076304A1 (en) | Improved speech recognition accuracy with natural-language understanding based meta-speech systems for assistant systems | |
US11847168B2 (en) | Training model with model-provided candidate action | |
US11881209B2 (en) | Electronic device and control method | |
US10762902B2 (en) | Method and apparatus for synthesizing adaptive data visualizations | |
JP2015162244A (en) | Methods, programs and computation processing systems for ranking spoken words | |
KR102486806B1 (en) | server that analyzes synopsis text and predicts viewer ratings based on artificial intelligence | |
US20240370445A1 (en) | Apparatus and methods for tracking progression of measured phenomena | |
US20230055991A1 (en) | System and method for interactive dialogue | |
US12099908B2 (en) | Updating training examples for artificial intelligence | |
US20240028952A1 (en) | Apparatus for attribute path generation | |
US20230252418A1 (en) | Apparatus for classifying candidates to postings and a method for its use | |
US11403556B2 (en) | Automated determination of expressions for an interactive social agent | |
Chang et al. | Report of 2017 NSF workshop on multimedia challenges, opportunities and research roadmaps | |
US11854535B1 (en) | Personalization for speech processing applications | |
US11803599B2 (en) | Apparatus and method for attribute data table matching | |
US12124967B1 (en) | Apparatus and method for generating a solution | |
US12046232B1 (en) | Systems and methods for determining contextual rules | |
Vildjiounaite et al. | Lightweight adaptation of classifiers to users and contexts: Trends of the emerging domain | |
ONAN et al. | ENHANCING AUTOMATIC IMAGE CAPTIONING SYSTEM LSTM | |
CN118828123A (en) | Display device and interface display method | |
CN116975220A (en) | Event data processing method, device, equipment, storage medium and program product |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right |