docs/Pythonでデータ解析を始める人へ.md
とdocs/データを読み込む方法.md
に書かれている方法でセットアップしてください。
環境構築するためにはdockerが必要です。環境構築する前にローカルにインストールされていることを確認してください。
-
Docker 19.03.12
-
docker-compose 1.27.2
その他の利用しているライブラリはdocker/requirement.txt
を参照してください。
docker で仮想環境を構築しています。次のコマンドで環境が作成されます。
$ docker-compose up -d
|- data/
|- jader/ - JADERの元データフォルダ
|- target/ - 解析後のデータフォルダ
|- docker/
|- Dockerfile
|- requirements.txt - 必要なライブラリ
|- docs/ - ドキュメントフォルダ
|- examples/ - colab用のサンプルコード
|- notebooks/
|- preprecess/
|- create_db.py - jaderデータから解析用のデータを作成するモジュール
|- ror.py - 薬物と有害事象ごとにRORを計算するモジュール
TNF-α阻害薬に分類される5剤(インフリキシマブ、エタネルセプト、アダリズマブ、ゴリズマブ、セルトリズマブ ぺゴル)に関連する有害事象が発生した症例の患者情報と頻度の集計、RORを算出する。
独立行政法人医薬品医療機器総合機構(PMDA)が提供している「副作用が疑われる症例報告に関する情報『医薬品副作用データベース』」のこと。以下の4つのテーブルからなる。
くすりの有害事象と薬剤疫学 DB構造について JADER版
dockerを使用してローカルで実行している場合は以下のコマンドを実行できます。
解析用のデータベースtarget/data.csv
が作成されます。 またTNF-α阻害薬を服用していた場合の副作用の集計結果target/count_side_effect.csv
とTNF-α阻害薬に分類される5剤(インフリキシマブ、エタネルセプト、アダリズマブ、ゴリズマブ、セルトリズマブ ぺゴル)の報告年度別の頻度target/count_years.csv
も作成されます。
$ docker exec -it jader-inf-2020 python3 preprocess/create_db.py
data.csv
を利用し、TNF-α阻害薬に分類される5剤(インフリキシマブ、エタネルセプト、アダリズマブ、ゴリズマブ、セルトリズマブ ぺゴル)とそれぞれの有害事象上位30までのRORの計算結果がtarget/ror.csv
を算出されます。
$ docker exec -it jader-inf-2020 python3 preprocess/ror.py
data.csv
を利用し、TNF-α阻害薬の年度別使用頻度target/drug_info.csv
と、服用している患者の年齢target/age.csv
と性別target/sex.csv
を集計されます。
$ docker exec -it jader-inf-2020 python3 preprocess/patient_background.py
JADER Chartもしくはdocs/JADER_Chart.pdf
をご確認ください。