Analyzing partial dimensional collapse in non-contrastive self-supervised learning. "Understanding Collapse in Non-Contrastive Siamese Representation Learning." In ECCV, 2022.

Jupyter Notebook 12 1 Updated Nov 12, 2023

Kowalski1024 / Mi-Go

Mi-Go is an open-source test framework designed to evaluate and compare the accuracy of speech-to-text models on YouTube dataset.

Python 10 2 Updated Jul 2, 2024

nttcslab / audio-diff-caps

Python 2 Updated Aug 22, 2023

ymhzyj / UMMAFormer

[ACM MM'23] UMMAFormer: A Universal Multimodal-adaptive Transformer Framework For Temporal Forgery Localization

Python 46 1 Updated May 16, 2024

nttcslab / dcase2023_task2_evaluator

Python 10 2 Updated Aug 10, 2023

jianghaojun / Awesome-Parameter-Efficient-Transfer-Learning

A collection of parameter-efficient transfer learning papers focusing on computer vision and multimodal domains.

383 25 Updated Jul 17, 2024

nttcslab / japanese-dialog-transformers

Code for evaluating Japanese pretrained models provided by NTT Ltd.

Python 240 23 Updated Jun 21, 2023

YuanGongND / whisper-at

Code and Pretrained Models for Interspeech 2023 Paper "Whisper-AT: Noise-Robust Automatic Speech Recognizers are Also Strong Audio Event Taggers"

Python 304 25 Updated Feb 21, 2024

hppRC / llm-lora-classification

LLMとLoRAを用いたテキスト分類

Python 84 5 Updated Jul 22, 2023

BradyFU / Awesome-Multimodal-Large-Language-Models

✨✨Latest Advances on Multimodal Large Language Models

11,332 740 Updated Aug 26, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Daisuke Niizumi daisukelab

Achievements

Achievements

Block or report daisukelab

Stars

audioset / ontology

takamichi-lab / digitalsignalprocessing-keio

KeisukeImoto / ACalt4

yyyujintang / Awesome-Mamba-Papers

oreilly-japan / deep-learning-from-scratch-5

hustvl / Vim

SonyCSLParis / audio-representations

ga642381 / speech-trident

shansongliu / MU-LLaMA

soham97 / awesome-sound_event_detection

Audio-WestlakeU / ATST-SED

EmulationAI / awesome-large-audio-models

TUT-ARG / sed_vis

google-deepmind / slowfast_nfnets

bastibe / python-soundfile

Labbeti / aac-datasets

sarulab-speech / ml-audiocaps

a43992899 / MARBLE-Benchmark

MGitHubL / TMac

nttcslab / deep-sound-field-denoiser

alexlioralexli / noncontrastive-ssl