#

audio-captioning

Here are 26 public repositories matching this topic...

Labbeti / dcase2021task6

IRIT-UPS DCASE 2021 AUDIO CAPTIONING SYSTEM

machine-learning deep-learning dcase audio-captioning dcase2021 dcase2021task6

Updated Jul 5, 2021
Python

zelaki / wsac

This reporsitory code form Weakly Supervised Automaed Audio Captioning via Text Only Training

clap audio-captioning dcase2023

Updated Jun 12, 2023
Python

iOPENCap / awesome-unimodal-training

Uni-modal training for multimdoal tasks

awesome image-captioning zero-shot video-captioning text2image audio-captioning composed-image-retrieval text-only-supervision text-only-training language-free-training

Updated Aug 17, 2024

Labbeti / dcase2024-task6-baseline

DCASE2024 Challenge Task 6 baseline system (Automated Audio Captioning)

baseline audio-captioning dcase2024

Updated Apr 19, 2024
Python

dr-costas / clotho-baseline-dataset

Code for using with the Clotho dataset

audio dataset zenodo machine-listening audio-captioning

Updated Dec 24, 2019
Python

paniquex / Automated_Audio_Captioning_DCASE2020

6-th task solution of DCASE2020

audio gru attention audio-processing mixup audio-captioning

Updated Jun 22, 2022
Python

audio-captioning / clotho-dataloader

PyTorch dataloader for Clotho dataset.

pytorch dataloader audio-captioning clotho-dataset

Updated Mar 30, 2020
Python

Sreyan88 / RECAP

Code for ICASSP 2024 Paper: RECAP: Retrieval-Augmented Audio Captioning

audio nlp ai ml clap audio-processing rag audio-captioning retreival generative-ai

Updated Jun 23, 2024
Python

abikaki / DCASE-Workshop-Papers

Workshop on Detection and Classification of Acoustic Scenes and Events

audio sound acoustic-scenes noise workshop-materials dcase acoustic-event-detection sound-classification acoustic-scene-classification audio-captioning dcase-challenge seld sound-event-localization sound-event-localization-detection bioacoustic-event-detection foley-sound-synthesis

Updated Apr 15, 2024

Labbeti / conette-audio-captioning

CoNeTTE: An efficient Audio Captioning system leveraging multiple datasets with Task Embedding

audio-captioning automated-audio-captioning

Updated Aug 13, 2024
Python

ExplainableML / ZerAuCap

[NeurIPS 2023 - ML for Audio Workshop (Oral)] Zero-shot audio captioning with audio-language model guidance and audio context keywords

audio zero-shot opt audio-captioning clotho-dataset large-language-models neurips-2023 audiocaps

Updated Nov 20, 2023

audio-captioning / caption-evaluation-tools

Tools for the evaluation of audio captioning.

captioning machine-translation-metrics audio-captioning

Updated May 23, 2020
Jupyter Notebook

blmoistawinde / fense

Fluency ENhanced Sentence-bert Evaluation (FENSE), metric for audio caption evaluation. And Benchmark dataset AudioCaps-Eval, Clotho-Eval.

benchmark evaluation-metrics audio-captioning audiocaption

Updated Feb 1, 2023
Python

lukewys / dcase_2020_T6

2nd place solution for 2020 DCASE challenge task 6 audio captioning. http:https://dcase.community/challenge2020/task-automatic-audio-captioning-results#wuyusong2020_t6

deep-learning audio-captioning

Updated Aug 3, 2023
Python

minguinho26 / Prefix_AAC_ICASSP2023

Official Implementation of "Prefix tuning for Automated Audio Captioning(ICASSP 2023)"

deep-learning pytorch-implementation audio-captioning icassp2023

Updated Dec 6, 2023
Jupyter Notebook

slSeanWU / beats-conformer-bart-audio-captioner

PyTorch implementation of the ICASSP-24 paper: "Improving Audio Captioning Models with Fine-grained Audio Features, Text Embedding Supervision, and LLM Mix-up Augmentation"

transformers pytorch audio-captioning clotho-dataset dcase-challenge

Updated Jan 6, 2024
Jupyter Notebook

soham97 / sound_ai_progress

Tracking states of the arts and recent results (bibliography) on sound tasks.

audio-processing sound-event-detection music-classification acoustic-scene-classification audio-captioning audio-generation audio-retrieval

Updated Jan 10, 2023

Labbeti / aac-metrics

Metrics for evaluating Automated Audio Captioning systems, designed for PyTorch.

audio metrics text captioning audio-captioning

Updated Jun 28, 2024
Python

audio-captioning / dcase-2020-baseline

Audio captioning baseline system for DCASE 2020 challenge.

machine-learning deep-neural-networks deep-learning signal-processing audio-signal-processing captioning dcase machine-listening audio-captioning dcase2020

Updated Aug 22, 2023
Python

an-tran528 / wavetransformer

Code base for WaveTransformer: A novel architecture for automated audio captioning

audio-captioning

Updated Mar 1, 2021
Python

Improve this page

Add a description, image, and links to the audio-captioning topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the audio-captioning topic, visit your repo's landing page and select "manage topics."