Add architecture search

pliang279 · Apr 9, 2021 · 0b2aa32 · 0b2aa32
1 parent effea17
commit 0b2aa32
Show file tree

Hide file tree

Showing 17 changed files with 1,356 additions and 1 deletion.
diff --git a/best.pt b/best.pt
diff --git a/datasets/avmnist/__pycache__/get_data.cpython-38.pyc b/datasets/avmnist/__pycache__/get_data.cpython-38.pyc
diff --git a/examples/avmnist_architecture_search.py b/examples/avmnist_architecture_search.py
@@ -0,0 +1,22 @@
+import sys
+import os
+sys.path.append(os.getcwd())
+from training_structures.architecture_search import train
+from fusions.common_fusions import Concat
+from datasets.avmnist.get_data import get_dataloader
+from unimodals.common_models import LeNet,MLP,Constant
+from torch import nn
+import torch
+import utils.surrogate as surr
+
+traindata, validdata, testdata = get_dataloader('/data/yiwei/avmnist/_MFAS/avmnist')
+
+train(['pretrained/avmnist/image_encoder.pt','pretrained/avmnist/audio_encoder.pt'],16,10,[(6,12,24),(6,12,24,48,96)],
+ traindata,validdata,surr.SimpleRecurrentSurrogate().cuda(),(3,5,2))
+
+"""
+print("Testing:")
+model=torch.load('best.pt').cuda()
+test(model,testdata)
+"""
+
diff --git a/examples/avmnist_pretraining.py b/examples/avmnist_pretraining.py
@@ -0,0 +1,24 @@
+import sys
+import os
+sys.path.append(os.getcwd())
+from training_structures.unimodal import train, test
+from fusions.common_fusions import Concat
+from datasets.avmnist.get_data import get_dataloader
+from unimodals.common_models import LeNet,MLP,Constant,Linear
+from torch import nn
+import torch
+
+traindata, validdata, testdata = get_dataloader('/data/yiwei/avmnist/_MFAS/avmnist')
+channels=3
+encoders=LeNet(1,channels,5).cuda()
+head=Linear(channels*32,10).cuda()
+mn=1
+
+train(encoders,head,traindata,validdata,100,optimtype=torch.optim.SGD,lr=0.1,weight_decay=0.0001,modalnum=mn)
+
+print("Testing:")
+encoder=torch.load('encoder.pt').cuda()
+head=torch.load('head.pt')
+test(encoder,head,testdata,modalnum=mn)
+
+
diff --git a/examples/avmnist_simple_late_fusion.py b/examples/avmnist_simple_late_fusion.py
@@ -10,7 +10,7 @@
 
 traindata, validdata, testdata = get_dataloader('/data/yiwei/avmnist/_MFAS/avmnist')
 channels=3
-encoders=[LeNet(1,channels,3).cuda(),Constant((40,96)).cuda()]
+encoders=[LeNet(1,channels,3).cuda(),(1,channels,5).cuda()]
 head=MLP(channels*40,100,10).cuda()
 
 fusion=Concat().cuda()

diff --git a/fusions/searchable.py b/fusions/searchable.py
@@ -0,0 +1,213 @@
+import torch
+import copy
+import torch.optim as op
+from torch import nn
+import utils.aux_models as aux
+import utils.scheduler as sc
+def train_sampled_models(sampled_configurations, searchable_type, dataloaders,
+ use_weightsharing, device, unimodal_files, rep_size, classes, sub_sizes, batch_size, epochs,
+ eta_max,eta_min, Ti, Tm,
+ return_model=False, premodels=False, preaccuracies=False,
+ train_only_central_params=True,
+ state_dict=dict()):
+
+ dataset_sizes = {x: len(dataloaders[x].dataset) for x in ['train', 'dev']}
+ num_batches_per_epoch = dataset_sizes['train'] / batch_size
+ criterion = torch.nn.CrossEntropyLoss()
+
+ real_accuracies = []
+
+ if return_model:
+ models = []
+
+ for idx, configuration in enumerate(sampled_configurations):
+
+ if not return_model or idx in return_model:
+
+ # model to train
+ if not premodels:
+ sds = []
+ for i in unimodal_files:
+ sds.append(torch.load(i))
+ for sd in sds:
+ sd.output_each_layer=True
+ rmode = searchable_type(sds,rep_size,classes, configuration,sub_sizes)
+
+ if train_only_central_params:
+ params = rmode.central_params()
+
+ # optimizer and scheduler
+ optimizer = op.Adam(params, lr=eta_max, weight_decay=1e-4)
+ scheduler = sc.LRCosineAnnealingScheduler(eta_max, eta_min, Ti, Tm,
+ num_batches_per_epoch)
+
+ rmode.to(device)
+
+ best_model_acc = train_track_acc(rmode, [criterion], optimizer, scheduler, dataloaders,
+ dataset_sizes,
+ device=device, num_epochs=epochs, verbose=False,
+ multitask=False)
+
+
+ real_accuracies.append(best_model_acc)
+
+ if return_model:
+ models.append(rmode)
+
+ if return_model:
+ return real_accuracies, models
+ else:
+ return real_accuracies
+
+def train_track_acc(model, criteria, optimizer, scheduler, dataloaders, dataset_sizes,
+ device=None, num_epochs=200, verbose=False, multitask=False):
+ best_model_sd = copy.deepcopy(model.state_dict())
+ best_acc = 0
+
+ for epoch in range(num_epochs):
+ # Each epoch has a training and validation phase
+ for phase in ['train', 'dev']:
+
+ if phase == 'train':
+ if not isinstance(scheduler, sc.LRCosineAnnealingScheduler):
+ scheduler.step()
+ model.train(True) # Set model to training mode
+ else:
+ model.train(False) # Set model to evaluate mode
+
+ running_loss = 0.0
+ running_corrects = 0
+
+ # Iterate over data.
+ for data in dataloaders[phase]:
+
+ # get the inputs
+ inputs = [d.float().cuda() for d in data[:-1]]
+ label = data[-1].cuda()
+
+
+ # zero the parameter gradients
+ optimizer.zero_grad()
+
+ # forward
+ # track history if only in train
+ with torch.set_grad_enabled(phase == 'train'):
+ output = model(inputs)
+
+ if not multitask:
+ _, preds = torch.max(output.detach(), 1)
+ loss = criteria[0](output, label)
+ else:
+ _, preds = torch.max(sum(output), 1)
+ loss = criteria[0](output[0], label) + criteria[1](output[1], label) + criteria[2](output[2],
+ label)
+
+ # backward + optimize only if in training phase
+ if phase == 'train':
+ if isinstance(scheduler, sc.LRCosineAnnealingScheduler):
+ scheduler.step()
+ scheduler.update_optimizer(optimizer)
+ loss.backward()
+ optimizer.step()
+
+ # statistics
+ running_loss += loss.item() * data[0].size(0)
+ running_corrects += torch.sum(preds == label.detach())
+
+ epoch_acc = torch.true_divide(running_corrects, dataset_sizes[phase])
+
+ print('{} Acc: {:.4f}'.format(phase, epoch_acc))
+
+ # deep copy the model
+ if phase == 'dev' and epoch_acc > best_acc:
+ best_acc = epoch_acc
+ best_model_sd = copy.deepcopy(model.state_dict())
+
+ model.load_state_dict(best_model_sd)
+ model.train(False)
+
+ return best_acc
+
+class Searchable(nn.Module):
+ def __init__(self,layered_encoders,rep_size,classes,conf,sub_sizes, alphas=False):
+ super(Searchable,self).__init__()
+ self.encoders=nn.ModuleList(layered_encoders)
+ self.using_alphas = alphas
+ self.conf=conf
+ self.subs=sub_sizes
+ self.hidden=rep_size
+ self.classes=classes
+ if alphas:
+ self.alphas = self.alphasgen()
+ self.fusion_layers=self.fcs()
+ self.head=nn.Linear(rep_size,classes)
+ for m in self.modules():
+ if isinstance(m,aux.AlphaScalarMultiplication):
+ nn.init.normal_(m.alpha_x,0.0,0.1)
+
+ def forward(self, inputs, training=False):
+ features=[]
+ for i in range(len(inputs)):
+ feat = self.encoders[i](inputs[i])[1:]
+ features.append([feat[idx] for idx in self.conf[:,i]])
+
+ for layer, conf in enumerate(self.conf):
+ feats = [f[layer] for f in features]
+ if self.using_alphas:
+ aout = self.alphas[layer](feats)
+ else:
+ aout = feats
+ if layer==0:
+ fused = torch.cat(aout,1)
+ out = self.fusion_layers[layer](fused)
+ else:
+ aout.append(out)
+ fused = torch.cat(aout,1)
+ out = self.fusion_layers[layer](fused)
+ out = self.head(out)
+ return out
+
+ def central_params(self):
+ if self.using_alphas:
+ cent = [{'params':self.alphas.parameters()},{'params':self.fusion_layers.parameters()},{'params':self.head.parameters()}]
+ else:
+ cent = [{'params':self.fusion_layers.parameters()},{'params':self.head.parameters()}]
+ return cent
+
+ def fcs(self):
+ fusion_layers = []
+ for i, conf in enumerate(self.conf):
+ in_size = 0
+ for j in range(len(self.encoders)):
+ in_size += self.subs[j][self.conf[i][j]]
+ if i > 0:
+ in_size += self.hidden
+ if conf[-1] == 0:
+ nl = nn.ReLU()
+ elif conf[-1] == 1:
+ nl = nn.Sigmoid()
+ elif conf[-1] == 2:
+ nl = nn.LeakyReLU()
+ op = nn.Sequential(nn.Linear(in_size,self.hidden),nl)
+ fusion_layers.append(op)
+ return nn.ModuleList(fusion_layers)
+
+ def alphasgen():
+ alphas = [aux.AlphaScalarMultiplication(self.subs[0][conf[0]],self.subs[0][conf[1]]) for conf in self.conf]
+ return nn.ModuleList(alphas)
+
+
+def get_possible_layer_configurations(max_labels):
+ list_conf=[]
+ if len(max_labels)==1:
+ for a in range(max_labels[0]):
+ list_conf.append([a])
+ else:
+ b = max_labels[1:]
+ for a in range(max_labels[0]):
+ li = get_possible_layer_configurations(b)
+ for k in li:
+ k.insert(0,a)
+ list_conf.extend(li)
+ return list_conf
+
diff --git a/head.pt b/head.pt
diff --git a/pretrained/avmnist/audio_encoder.pt b/pretrained/avmnist/audio_encoder.pt
diff --git a/pretrained/avmnist/image_encoder.pt b/pretrained/avmnist/image_encoder.pt