Single-Stage Visual Query Localization in Egocentric Videos (NeurIPS 2023)

Project Page | Paper

Single-Stage Visual Query Localization in Egocentric Videos

Hanwen Jiang, Santhosh Ramakrishnan, Kristen Grauman

Installation

conda create --name vqloc python=3.8
conda activate vqloc

# Install pytorch or use your own torch version
conda install pytorch==1.12.0 torchvision==0.13.0 torchaudio==0.12.0 cudatoolkit=11.6 -c pytorch -c conda-forge

pip install -r requirements.txt

Pre-trained Weights

We provide the model weights trained on here.

Train VQLoC

Download Dataset

Please follow vq2d baseline step 1/2/4/5 to process the dataset into video clips.

Training

Use ./train.sh and change your training config accordingly.
The default training configurations require about 200GB at most, e.g. 8 A40 GPUs with 40GB VRAM, each.

Evaluate VQLoC

1. Use ./inference_predict.sh to inference on the target video clips. Change the path of your model checkpoint.
1. Use python inference_results.py --cfg ./config/val.yaml to format the results. Use --eval and --cfg ./config/eval.yaml for evaluation (submit to leaderboard).
1. Use python evaluate.py to get the numbers. Please change --pred-file and --gt-file accordingly.

Known Issues

The hard negative mining is not very steady. We set use_hnm=False by default.

Citation

@article{jiang2023vqloc,
   title={Single-Stage Visual Query Localization in Egocentric Videos},
   author={Jiang, Hanwen and Ramakrishnan, Santhosh and Grauman, Kristen},
   journal={ArXiv},
   year={2023},
   volume={2306.09324}
}

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Single-Stage Visual Query Localization in Egocentric Videos (NeurIPS 2023)

Project Page | Paper

Installation

Pre-trained Weights

Train VQLoC

Download Dataset

Training

Evaluate VQLoC

Known Issues

Citation

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
config		config
data		data
dataset		dataset
evaluation		evaluation
func		func
metrics		metrics
model		model
utils		utils
.gitignore		.gitignore
README.md		README.md
evaluate.py		evaluate.py
inference_predict.py		inference_predict.py
inference_predict.sh		inference_predict.sh
inference_results.py		inference_results.py
requirements.txt		requirements.txt
train.sh		train.sh
train_anchor.py		train_anchor.py

hwjiang1510/VQLoC

Folders and files

Latest commit

History

Repository files navigation

Single-Stage Visual Query Localization in Egocentric Videos (NeurIPS 2023)

Project Page | Paper

Installation

Pre-trained Weights

Train VQLoC

Download Dataset

Training

Evaluate VQLoC

Known Issues

Citation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages