Skip to content

The corpus of Japanese spam messages of invitation Mama Katu.

License

Notifications You must be signed in to change notification settings

unyacat/mama-katu-DM-corpus

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

63 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

ママ活DMコーパス

ダウンロード

Mama_katu_DM_corpus.txt

概要

ママ活の勧誘DMを集めてコーパスにしたものです

仕様

  • 文字コードはUTF-8、改行コードはLFです
  • 一行に一つのママ活DMのテキストです
  • 改行は「__br__」という記号に変換しています
  • 送り先ユーザー名は「__to_user__」という記号に変換しています
  • 送り元ユーザー名は「__from_user__」という記号に変換しています

追加方法

  1. in_conv.txtに追加するママ活DMの内容を書き書き(一度に一つずつしか追加できません)
  2. python3 conv.pyを実行
  3. Mama_katu_DM_corpus.txtに追加されている

※conv.pyは「__to_user__」と「__from_user__」に置き換える匿名化にはまだ対応できていません。手動で置換をおこなってください

About

The corpus of Japanese spam messages of invitation Mama Katu.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%