multimodal-deep-learning

Here are 222 public repositories matching this topic...

abs711 / The-way-of-the-future

A dataset of egocentric vision, eye-tracking and full body kinematics from human locomotion in out-of-the-lab environments. Also, different use cases of the dataset along with example code.

machine-learning data-visualization eye-tracking data-analysis motion-capture human-pose-estimation multimodal-deep-learning egocentric-vision

Updated Nov 5, 2023
Python

kyegomez / MMCA-MGQA

Sponsor

Star

Experiments around using Multi-Modal Casual Attention with Multi-Grouped Query Attention

artificial-intelligence attention attention-mechanism multimodality attention-is-all-you-need multimodal multimodal-deep-learning gpt4

Updated Mar 11, 2024
Python

l-yohai / Look-Attend-and-Generate-Poem

Star

AI Poet who looks at the images and writes poems Web service.

poem poem-generator imagecaptioning multimodal-deep-learning

Updated Dec 28, 2021
Python

ibnaleem / mikael

Star

a Discord chatbot trained on Mistral and LLaVA language models

chatbot discord-bot artificial-intelligence discord-py mistral multimodal multimodal-deep-learning gpt-4 large-language-models llava mistral-7b mistral-ai

Updated Feb 29, 2024
Python

YuxingLu613 / HTML

Star

Code for paper Multiomics dynamic learning enables personalized diagnosis and prognosis for pan-cancer and cancer-subtypes

uncertainty-estimation precision-medicine multimodal-deep-learning multiomics-data

Updated Oct 29, 2023
Python

pha123661 / NTU-2022Fall-ADL

Star

Applied Deep Learning 深度學習之應用 by Vivian Chen 陳縕儂 at NTU CSIE

natural-language-processing reinforcement-learning deep-learning question-answering policy-gradient summarization seq2seq ntu sequence-labeling sequence-classification adl multimodal-deep-learning token-classification prompt-tuning parameter-efficient-tuning

Updated Feb 1, 2023
Python

gorjanradevski / SMHA

Star

My master thesis: Siamese multi-hop attention for cross-modal retrieval.

deep-learning tensorflow attention-mechanism multimodal-deep-learning multimodal-representation image-text-search cross-modal-retrieval

Updated Mar 27, 2020
Python

usc-sail / mica-context-emotion-recognition

Star

Repository for context based emotion recognition

computer-vision emotion-recognition multimodal-deep-learning multimodal-fusion context-understanding

Updated Sep 25, 2023
Python

VityaVitalich / IMAD

Star

[AINL 2023] IMAD: IMage Augmented multi-modal Dialogue

deep-learning dataset dialogue-systems image2text multimodal multimodal-deep-learning

Updated May 28, 2023
Python

PrachiJainxD / AmbientAI_IMU2CLIP

Star

COMPSCI 696DS Industry Mentorship Program with Meta Reality Labs: Ambient AI: Multimodal Wearable Sensor Understanding (Experiments in Distilling Knowledge in Cross-Modal Contrastive Learning.)

imu knowledge-distillation contrastive-loss multimodal-deep-learning contrastive-learning

Updated Jun 3, 2023
Python

thatAverageGuy / EarlyFusion-on-EasyVQA

Star

Streamlit app for demonstrating multi-modal(vision+language) modelling in Pytorch.

transformers pytorch visual-question-answering vqa-dataset multimodal-deep-learning streamlit early-fusion

Updated Aug 22, 2022
Python

DistilledCode / mmrl

Star

Multi-Modal Representational Learning for Social Media Popularity Prediction

neural-network embeddings data-pipeline multimodal-deep-learning praw-reddit airflow-dags chromadb multimodal-large-language-models

Updated Jun 14, 2024
Python

XavierSpycy / MultiCLIP

Star

MultiCLIP: A framework for multimodal-multilabel-multistage classification utilizing advanced pretrained models like CLIP and BLIP. 一个多模态多标签多阶段分类框架，利用像CLIP和BLIP这样的先进预训练模型。

pretrained-models clip multimodality blip multilabel-classification multimodal-deep-learning

Updated Jun 21, 2024
Python

licesonw / deepmm

Star

Multimodal deep learning package that uses both categorical and text-based features in a single deep architecture for regression and binary classification use cases.

deep-learning wide-and-deep factorization-machine neural-factorization-machines categorical-features deepfm multimodal multimodal-deep-learning deep-and-cross

Updated Jul 23, 2020
Python

mobled37 / utils

Star

Deeplearning utils for multimodal research

finetuning multimodal-deep-learning

Updated Jul 28, 2023
Python

RunyuFan / UisNet-TGRS-2022

Star

Code for TGRS 2022 paper "Fine-scale Urban Informal Settlements Mapping by Fusing Remote Sensing Images and Building Data via a Transformer-based Multimodal Fusion Network"

remote-sensing urban multimodal-deep-learning