remove redundant method

EleutherAI · derpyplops · Jul 13, 2023 · Jul 13, 2023 · Jul 14, 2023 · Jul 14, 2023
commit 327d1eb17e112c79004f6041a5829d7203801628
diff --git a/elk/training/train.py b/elk/training/train.py
@@ -2,14 +2,12 @@
 
 from collections import defaultdict
 from dataclasses import dataclass, replace
-from pathlib import Path
 from typing import Literal
 
 import pandas as pd
 import torch
 from einops import rearrange, repeat
 from simple_parsing import subgroups
-from simple_parsing.helpers.serialization import save
 
 from ..evaluation import Eval
 from ..metrics import evaluate_preds, to_one_hot
@@ -124,20 +122,6 @@ class Elicit(Run):
  cross-validation. Defaults to "single", which means to train a single classifier
  on the training data. "cv" means to use cross-validation."""
 
- def create_models_dir(self, out_dir: Path):
- lr_dir = None
- lr_dir = out_dir / "lr_models"
- reporter_dir = out_dir / "reporters"
-
- lr_dir.mkdir(parents=True, exist_ok=True)
- reporter_dir.mkdir(parents=True, exist_ok=True)
-
- # Save the reporter config separately in the reporter directory
- # for convenient loading of reporters later.
- save(self.net, reporter_dir / "cfg.yaml", save_dc_types=True)
-
- return reporter_dir, lr_dir
-
  def make_eval(self, model, eval_dataset):
  assert self.out_dir is not None
  return Eval(
@@ -254,9 +238,6 @@ def apply_to_layer(
  (first_train_h, train_gt, _), *rest = train_dict.values()
  (_, v, k, d) = first_train_h.shape
 
- # TODO is this even needed
- # reporter_dir, lr_dir = self.create_models_dir(assert_type(Path, self.out_dir))
-
  if probe_per_prompt:
  prompt_indices = self.prompt_indices if self.prompt_indices else range(v)
  prompt_train_dicts = [
@@ -297,25 +278,15 @@ def apply_to_layer(
  # TODO fix lr_models
 
  else:
- prompt_train_dict = {
- ds_name: (
- train_h[:, self.prompt_indices, ...],
- train_gt,
- lm_preds[:, self.prompt_indices, ...]
- if lm_preds is not None
- else None,
- )
- for ds_name, (train_h, _, lm_preds) in train_dict.items()
- }
  reporter_train_result = self.train_and_save_reporter(
- device, layer, self.out_dir / "reporters", prompt_train_dict
+ device, layer, self.out_dir / "reporters", train_dict
  )
 
  maybe_multi_reporter = reporter_train_result.reporter
  train_loss = reporter_train_result.train_loss
 
  lr_models = self.train_lr_model(
- prompt_train_dict, device, layer, self.out_dir / "lr_models"
+ train_dict, device, layer, self.out_dir / "lr_models"
  )
 
  return evaluate_and_save(