Japanese follows English. / 日本語の記述は英語に続きます.
The Coco-Nut corpus is a corpus including Japanese voice and free-form texts describing the voice characteristics (hereinafter, characteristics prompt.)
Coco-Nutコーパスは日本語音声および声質を表現する自由記述文(声質表現文)を含むコーパスです.
Project page: https://sites.google.com/site/shinnosuketakamichi/research-topics/coconut_corpus
This corpus consists of voices, transcriptions, and characteristics prompts.
This repository provides the characteristics prompts, separated into train, validation, and test csv files. These csv files include:
- Segment ID
- Characteristics_prompt_[prompt ID]
- Each voice can have the multiple charactersitics prompts
- More than 1 per segment in train set, 5 for validation and test sets.
- Prompt ID (1-5) specifies the prompt associated with the same voice.
- Each voice can have the multiple charactersitics prompts
- Annotator_[prompt ID]
- Annotator name who wrote the characteristics prompt with same prompt ID.
- Note that the same annotator writes several characteristics prompts.
We plan to distribute voices and transcriptions through the Informatics Research Data Repository (https://www.nii.ac.jp/dsc/idr/index.html).
このコーパスは日本語音声と書き起こし文,および声質表現文からなります.
声質表現文はこちらのリポジトリで公開します.学習・検証・評価セットに分けてcsvファイルに記述しております.内容は以下のとおりです
- 音声セグメントID
- Characteristics_prompt_[prompt ID](声質表現文)
- 音声セグメント1件につき,学習セットは1件以上,検証および評価セットは5件収録されています.
- Annotator_[prompt ID](アノテータID)
- prompt ID を付けたアノテータの名称
- 1人のアノテータが複数の音声セグメントに対して声質表現文を付与しています.
音声及び書き起こし文は情報学研究データリポジトリ(https://www.nii.ac.jp/dsc/idr/index.html)を通しての配布を予定しています.
The characteristics prompts within this repository are licensed under CC BY 4.0 (https://creativecommons.org/licenses/by/4.0/). For the voices and transcriptions, the terms of use will adhere to the guidelines specified by the Informatics Research Data Repository.
本リポジトリ内の声質表現文はCC BY 4.0(https://creativecommons.org/licenses/by/4.0/)にてライセンスされます.音声データと書き起こし文は,音声資源コンソーシアムの利用規約に基づいて使用してください.
Aya Watanabe / 渡邊 亞椰 (University of Tokyo / 東京大学)
Shinnosuke Takamichi 高道 慎之介 (@forthshinji, University of Tokyo / 東京大学)
Yuki Saito / 齋藤 佑樹 (University of Tokyo / 東京大学)
Detai Xin / 辛 徳泰 (University of Tokyo / 東京大学)
Hiroshi Saruwatari / 猿渡 洋 (University of Tokyo / 東京大学)
- Aya Watanabe, Shinnosuke Takamichi, Yuki Saito, Wataru Nakata, Detai Xin, Hiroshi Saruwatari, "Coco-Nut: Corpus of Japanese Utterance and Voice Characteristics Description for Prompt-based Control," Proc. ASRU, 2023.
- 渡邊 亞椰,高道 慎之介,齋藤 佑樹,辛 徳泰,猿渡 洋,"Coco-Nut: 自由記述文による声質制御に向けた多話者音声・声質自由記述ペアデータセット," 日本音響学会2023年秋季研究発表会, 2023.
For any inquiries, please contact Shinnosuke Takamichi ([email protected]).
本コーパスに関するお問い合わせは,高道 慎之介 ([email protected]) にお願いいたします.