Code for paper "G-Eval: NLG Evaluation using GPT-4 with Better Human Alignment" [https://arxiv.org/abs/2303.16634]

Experiments on SummEval dataset

Evaluate fluency on SummEval dataset

python .\gpt4_eval.py --prompt .\prompts\summeval\flu_detailed.txt --save_fp .\results\gpt4_flu_detailed.json --summeval_fp .\data\summeval.json --key XXXXX

Meta Evaluate the G-Eval results

python .\meta_eval_summeval.py --input_fp .\results\gpt4_flu_detailed.json --dimension fluency

Prompts and Evaluation Results

Prompts used to evaluate SummEval are in prompts/summeval

G-eval results on SummEval are in results

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Code for paper "G-Eval: NLG Evaluation using GPT-4 with Better Human Alignment" [https://arxiv.org/abs/2303.16634]

Experiments on SummEval dataset

Evaluate fluency on SummEval dataset

Meta Evaluate the G-Eval results

Prompts and Evaluation Results

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
data		data
prompts/summeval		prompts/summeval
results		results
LICENSE		LICENSE
README.md		README.md
gpt4_eval.py		gpt4_eval.py
meta_eval_summeval.py		meta_eval_summeval.py

License

nlpyang/geval

Folders and files

Latest commit

History

Repository files navigation

Code for paper "G-Eval: NLG Evaluation using GPT-4 with Better Human Alignment" [https://arxiv.org/abs/2303.16634]

Experiments on SummEval dataset

Evaluate fluency on SummEval dataset

Meta Evaluate the G-Eval results

Prompts and Evaluation Results

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages