chore!: unify and refactor trainer

Signed-off-by: Avik Basu <[email protected]>
numaproj · Oct 12, 2023 · a12948f · a12948f
1 parent 509e38a
commit a12948f
Show file tree

Hide file tree

Showing 24 changed files with 125 additions and 193 deletions.
diff --git a/docs/autoencoders.md b/docs/autoencoders.md
@@ -25,10 +25,10 @@ Here we are using `VanillaAE`, a Vanilla Autoencoder model.
 
 ```python
 from numalogic.models.autoencoder.variants import VanillaAE
-from numalogic.models.autoencoder import AutoencoderTrainer
+from numalogic.models.autoencoder import TimeseriesTrainer
 
 model = VanillaAE(seq_len=12, n_features=3)
-trainer = AutoencoderTrainer(max_epochs=50, enable_progress_bar=True)
+trainer = TimeseriesTrainer(max_epochs=50, enable_progress_bar=True)
 trainer.fit(model, datamodule=datamodule)
 ```
 

diff --git a/docs/quick-start.md b/docs/quick-start.md
@@ -20,15 +20,15 @@ pip install numalogic
 
 ## Numalogic as a Library
 
-Numalogic can be used as an independent library, and it provides various ML models and tools. Here, we are using the `AutoencoderTrainer`. Refer to [training section](autoencoders.md) for other available options.
+Numalogic can be used as an independent library, and it provides various ML models and tools. Here, we are using the `TimeseriesTrainer`. Refer to [training section](autoencoders.md) for other available options.
 
 In this example, the train data set has numbers ranging from 1-10. Whereas in the test data set, there are data points that go out of this range, which the algorithm should be able to detect as anomalies.
 
 ```python
 import numpy as np
 from sklearn.preprocessing import StandardScaler
 from torch.utils.data import DataLoader
-from numalogic.models.autoencoder import AutoencoderTrainer
+from numalogic.models.autoencoder import TimeseriesTrainer
 from numalogic.models.autoencoder.variants import VanillaAE
 from numalogic.models.threshold import StdDevThreshold
 from numalogic.transforms import TanhNorm
@@ -57,7 +57,7 @@ model = VanillaAE(seq_len=SEQ_LEN, n_features=1)
 train_dataset = StreamingDataset(train_data, seq_len=SEQ_LEN)
 
 # Define the trainer, and fit the model.
-trainer = AutoencoderTrainer(max_epochs=30, enable_progress_bar=True)
+trainer = TimeseriesTrainer(max_epochs=30, enable_progress_bar=True)
 trainer.fit(model, train_dataloaders=DataLoader(train_dataset))
 
 # Get the training reconstruction error from the model.

diff --git a/examples/conv_ae.ipynb b/examples/conv_ae.ipynb
@@ -329,7 +329,7 @@
  ],
  "source": [
  "from numalogic.models.autoencoder.variants import Conv1dAE\n",
- "from numalogic.models.autoencoder import AutoencoderTrainer\n",
+ "from numalogic.models.autoencoder import TimeseriesTrainer\n",
  "\n",
  "model_1 = Conv1dAE(seq_len=SEQ_LEN, in_channels=1, enc_channels=(16, 32, 8), enc_kernel_sizes=3)\n",
  "print(model_1)"
@@ -367,7 +367,7 @@
  }
  ],
  "source": [
- "trainer = AutoencoderTrainer(max_epochs=MAX_EPOCHS, enable_progress_bar=True)\n",
+ "trainer = TimeseriesTrainer(max_epochs=MAX_EPOCHS, enable_progress_bar=True)\n",
  "trainer.fit(model_1, train_dataloaders=DataLoader(train_dataset, batch_size=BATCH_SIZE))"
  ],
  "metadata": {
@@ -565,7 +565,7 @@
  }
  ],
  "source": [
- "trainer = AutoencoderTrainer(max_epochs=MAX_EPOCHS, enable_progress_bar=True)\n",
+ "trainer = TimeseriesTrainer(max_epochs=MAX_EPOCHS, enable_progress_bar=True)\n",
  "trainer.fit(model_2, train_dataloaders=DataLoader(train_dataset, batch_size=BATCH_SIZE))"
  ],
  "metadata": {
@@ -756,7 +756,7 @@
  ],
  "source": [
  "\n",
- "trainer = AutoencoderTrainer(accelerator=\"cpu\", max_epochs=MAX_EPOCHS, enable_progress_bar=True)\n",
+ "trainer = TimeseriesTrainer(accelerator=\"cpu\", max_epochs=MAX_EPOCHS, enable_progress_bar=True)\n",
  "trainer.fit(model_3, train_dataloaders=DataLoader(StreamingDataset(x_train, seq_len=SEQ_LEN), batch_size=BATCH_SIZE))"
  ],
  "metadata": {

diff --git a/examples/multi_udf/src/udf/inference.py b/examples/multi_udf/src/udf/inference.py
@@ -2,7 +2,7 @@
 import os
 
 import numpy.typing as npt
-from numalogic.models.autoencoder import AutoencoderTrainer
+from numalogic.models.autoencoder import TimeseriesTrainer
 from numalogic.udfs import NumalogicUDF
 from numalogic.registry import MLflowRegistry, ArtifactData
 from numalogic.tools.data import StreamingDataset
@@ -36,7 +36,7 @@ def _infer(artifact_data: ArtifactData, stream_data: npt.NDArray[float]) -> list
  main_model = artifact_data.artifact
  streamloader = DataLoader(StreamingDataset(stream_data, WIN_SIZE))
 
- trainer = AutoencoderTrainer()
+ trainer = TimeseriesTrainer()
  reconerr = trainer.predict(main_model, dataloaders=streamloader)
  return reconerr.tolist()
 

diff --git a/examples/multi_udf/src/udf/train.py b/examples/multi_udf/src/udf/train.py
@@ -4,7 +4,7 @@
 import cachetools
 import numpy.typing as npt
 import pandas as pd
-from numalogic.models.autoencoder import AutoencoderTrainer
+from numalogic.models.autoencoder import TimeseriesTrainer
 from numalogic.models.autoencoder.variants import Conv1dAE
 from numalogic.models.threshold import StdDevThreshold
 from numalogic.udfs import NumalogicUDF
@@ -34,7 +34,7 @@ def __init__(self):
  self.model_key = "ae::model"
 
  def _save_artifact(
- self, model, skeys: list[str], dkeys: list[str], _: Optional[AutoencoderTrainer] = None
+ self, model, skeys: list[str], dkeys: list[str], _: Optional[TimeseriesTrainer] = None
  ) -> None:
  """Saves the model in the registry."""
  self.registry.save(skeys=skeys, dkeys=dkeys, artifact=model)
@@ -81,7 +81,7 @@ def exec(self, keys: list[str], datum: Datum) -> Messages:
  # Train the autoencoder model
  datamodule = TimeseriesDataModule(WIN_SIZE, train_data, batch_size=BATCH_SIZE)
  model = Conv1dAE(seq_len=WIN_SIZE, in_channels=train_data.shape[1])
- trainer = AutoencoderTrainer(max_epochs=MAX_EPOCHS, enable_progress_bar=True)
+ trainer = TimeseriesTrainer(max_epochs=MAX_EPOCHS, enable_progress_bar=True)
  trainer.fit(model, datamodule=datamodule)
 
  # Get reconstruction error of the training set

diff --git a/examples/quick-start.ipynb b/examples/quick-start.ipynb
@@ -389,15 +389,15 @@
  {
  "data": {
  "text/plain": "<IPython.core.display.Javascript object>",
- "application/javascript": "\n setTimeout(function() {\n var nbb_cell_id = 60;\n var nbb_unformatted_code = \"from torch.utils.data import DataLoader\\nfrom numalogic.models.autoencoder import AutoencoderTrainer\\nfrom numalogic.models.autoencoder.variants import Conv1dAE\\nfrom numalogic.tools.data import StreamingDataset\\n\\nSEQ_LEN = 24 # length of the sequence\\nMAX_EPOCHS = 30 # number of epochs to run\\nBATCH_SIZE = 64 # training batch size\\n\\nmodel = Conv1dAE(seq_len=SEQ_LEN, in_channels=1, enc_channels=(8, 4))\\nmodel\";\n var nbb_formatted_code = \"from torch.utils.data import DataLoader\\nfrom numalogic.models.autoencoder import AutoencoderTrainer\\nfrom numalogic.models.autoencoder.variants import Conv1dAE\\nfrom numalogic.tools.data import StreamingDataset\\n\\nSEQ_LEN = 24 # length of the sequence\\nMAX_EPOCHS = 30 # number of epochs to run\\nBATCH_SIZE = 64 # training batch size\\n\\nmodel = Conv1dAE(seq_len=SEQ_LEN, in_channels=1, enc_channels=(8, 4))\\nmodel\";\n var nbb_cells = Jupyter.notebook.get_cells();\n for (var i = 0; i < nbb_cells.length; ++i) {\n if (nbb_cells[i].input_prompt_number == nbb_cell_id) {\n if (nbb_cells[i].get_text() == nbb_unformatted_code) {\n nbb_cells[i].set_text(nbb_formatted_code);\n }\n break;\n }\n }\n }, 500);\n "
+ "application/javascript": "\n setTimeout(function() {\n var nbb_cell_id = 60;\n var nbb_unformatted_code = \"from torch.utils.data import DataLoader\\nfrom numalogic.models.autoencoder import TimeseriesTrainer\\nfrom numalogic.models.autoencoder.variants import Conv1dAE\\nfrom numalogic.tools.data import StreamingDataset\\n\\nSEQ_LEN = 24 # length of the sequence\\nMAX_EPOCHS = 30 # number of epochs to run\\nBATCH_SIZE = 64 # training batch size\\n\\nmodel = Conv1dAE(seq_len=SEQ_LEN, in_channels=1, enc_channels=(8, 4))\\nmodel\";\n var nbb_formatted_code = \"from torch.utils.data import DataLoader\\nfrom numalogic.models.autoencoder import TimeseriesTrainer\\nfrom numalogic.models.autoencoder.variants import Conv1dAE\\nfrom numalogic.tools.data import StreamingDataset\\n\\nSEQ_LEN = 24 # length of the sequence\\nMAX_EPOCHS = 30 # number of epochs to run\\nBATCH_SIZE = 64 # training batch size\\n\\nmodel = Conv1dAE(seq_len=SEQ_LEN, in_channels=1, enc_channels=(8, 4))\\nmodel\";\n var nbb_cells = Jupyter.notebook.get_cells();\n for (var i = 0; i < nbb_cells.length; ++i) {\n if (nbb_cells[i].input_prompt_number == nbb_cell_id) {\n if (nbb_cells[i].get_text() == nbb_unformatted_code) {\n nbb_cells[i].set_text(nbb_formatted_code);\n }\n break;\n }\n }\n }, 500);\n "
  },
  "metadata": {},
  "output_type": "display_data"
  }
  ],
  "source": [
  "from torch.utils.data import DataLoader\n",
- "from numalogic.models.autoencoder import AutoencoderTrainer\n",
+ "from numalogic.models.autoencoder import TimeseriesTrainer\n",
  "from numalogic.models.autoencoder.variants import Conv1dAE\n",
  "from numalogic.tools.data import StreamingDataset\n",
  "\n",
@@ -440,14 +440,14 @@
  {
  "data": {
  "text/plain": "<IPython.core.display.Javascript object>",
- "application/javascript": "\n setTimeout(function() {\n var nbb_cell_id = 61;\n var nbb_unformatted_code = \"trainer = AutoencoderTrainer(max_epochs=MAX_EPOCHS, enable_progress_bar=True)\\ntrainer.fit(\\n model,\\n train_dataloaders=DataLoader(StreamingDataset(X_train, seq_len=SEQ_LEN), batch_size=BATCH_SIZE),\\n val_dataloaders=DataLoader(StreamingDataset(X_val, seq_len=SEQ_LEN), batch_size=BATCH_SIZE)\\n)\";\n var nbb_formatted_code = \"trainer = AutoencoderTrainer(max_epochs=MAX_EPOCHS, enable_progress_bar=True)\\ntrainer.fit(\\n model,\\n train_dataloaders=DataLoader(\\n StreamingDataset(X_train, seq_len=SEQ_LEN), batch_size=BATCH_SIZE\\n ),\\n val_dataloaders=DataLoader(\\n StreamingDataset(X_val, seq_len=SEQ_LEN), batch_size=BATCH_SIZE\\n ),\\n)\";\n var nbb_cells = Jupyter.notebook.get_cells();\n for (var i = 0; i < nbb_cells.length; ++i) {\n if (nbb_cells[i].input_prompt_number == nbb_cell_id) {\n if (nbb_cells[i].get_text() == nbb_unformatted_code) {\n nbb_cells[i].set_text(nbb_formatted_code);\n }\n break;\n }\n }\n }, 500);\n "
+ "application/javascript": "\n setTimeout(function() {\n var nbb_cell_id = 61;\n var nbb_unformatted_code = \"trainer = TimeseriesTrainer(max_epochs=MAX_EPOCHS, enable_progress_bar=True)\\ntrainer.fit(\\n model,\\n train_dataloaders=DataLoader(StreamingDataset(X_train, seq_len=SEQ_LEN), batch_size=BATCH_SIZE),\\n val_dataloaders=DataLoader(StreamingDataset(X_val, seq_len=SEQ_LEN), batch_size=BATCH_SIZE)\\n)\";\n var nbb_formatted_code = \"trainer = TimeseriesTrainer(max_epochs=MAX_EPOCHS, enable_progress_bar=True)\\ntrainer.fit(\\n model,\\n train_dataloaders=DataLoader(\\n StreamingDataset(X_train, seq_len=SEQ_LEN), batch_size=BATCH_SIZE\\n ),\\n val_dataloaders=DataLoader(\\n StreamingDataset(X_val, seq_len=SEQ_LEN), batch_size=BATCH_SIZE\\n ),\\n)\";\n var nbb_cells = Jupyter.notebook.get_cells();\n for (var i = 0; i < nbb_cells.length; ++i) {\n if (nbb_cells[i].input_prompt_number == nbb_cell_id) {\n if (nbb_cells[i].get_text() == nbb_unformatted_code) {\n nbb_cells[i].set_text(nbb_formatted_code);\n }\n break;\n }\n }\n }, 500);\n "
  },
  "metadata": {},
  "output_type": "display_data"
  }
  ],
  "source": [
- "trainer = AutoencoderTrainer(max_epochs=MAX_EPOCHS, enable_progress_bar=True)\n",
+ "trainer = TimeseriesTrainer(max_epochs=MAX_EPOCHS, enable_progress_bar=True)\n",
  "trainer.fit(\n",
  " model,\n",
  " train_dataloaders=DataLoader(StreamingDataset(X_train, seq_len=SEQ_LEN), batch_size=BATCH_SIZE),\n",

diff --git a/numalogic/blocks/_nn.py b/numalogic/blocks/_nn.py
@@ -14,7 +14,7 @@
 import numpy.typing as npt
 
 from numalogic.blocks import Block
-from numalogic.models.autoencoder import AutoencoderTrainer
+from numalogic.models.autoencoder import TimeseriesTrainer
 from numalogic.tools.data import StreamingDataset
 from numalogic.tools.types import nn_model_t, state_dict_t
 
@@ -64,7 +64,7 @@ def fit(
  -------
  The error of the model on the input data.
  """
- trainer = AutoencoderTrainer(**trainer_kwargs)
+ trainer = TimeseriesTrainer(**trainer_kwargs)
  ds = StreamingDataset(input_, self.seq_len)
  trainer.fit(self._artifact, train_dataloaders=DataLoader(ds, batch_size=batch_size))
  reconerr = trainer.predict(

diff --git a/numalogic/config/_config.py b/numalogic/config/_config.py
@@ -11,7 +11,7 @@
 
 
 from dataclasses import dataclass, field
-from typing import Optional, Any
+from typing import Any
 
 from omegaconf import MISSING
 
@@ -75,14 +75,12 @@ class LightningTrainerConf:
 
  accelerator: str = "auto"
  max_epochs: int = 50
- logger: bool = False
+ logger: bool = True
+ log_freq: int = 5
  check_val_every_n_epoch: int = 5
- log_every_n_steps: int = 20
  enable_checkpointing: bool = False
- enable_progress_bar: bool = True
+ enable_progress_bar: bool = False
  enable_model_summary: bool = True
- limit_val_batches: bool = 0
- callbacks: Optional[Any] = None
 
 
 @dataclass

diff --git a/numalogic/config/factory.py b/numalogic/config/factory.py
@@ -106,6 +106,7 @@ class ModelFactory(_ObjectFactory):
  TransformerAE,
  SparseTransformerAE,
  )
+ from numalogic.models.vae.variants import Conv1dVAE
 
  _CLS_MAP: ClassVar[dict] = {
  "VanillaAE": VanillaAE,
@@ -116,13 +117,16 @@ class ModelFactory(_ObjectFactory):
  "SparseLSTMAE": SparseLSTMAE,
  "TransformerAE": TransformerAE,
  "SparseTransformerAE": SparseTransformerAE,
+ "Conv1dVAE": Conv1dVAE,
  }
 
 
 class RegistryFactory(_ObjectFactory):
  """Factory class to create registry instances."""
 
- _CLS_SET: ClassVar[frozenset] = frozenset({"RedisRegistry", "MLflowRegistry"})
+ _CLS_SET: ClassVar[frozenset] = frozenset(
+ {"RedisRegistry", "MLflowRegistry", "DynamoDBRegistry"}
+ )
 
  def get_instance(self, object_info: Union[ModelInfo, RegistryInfo]):
  import numalogic.registry as reg

diff --git a/numalogic/models/autoencoder/__init__.py b/numalogic/models/autoencoder/__init__.py
@@ -10,6 +10,6 @@
 # limitations under the License.
 
 
-from numalogic.models.autoencoder.trainer import AutoencoderTrainer
+from numalogic.tools.trainer import TimeseriesTrainer
 
-__all__ = ["AutoencoderTrainer"]
+__all__ = ["TimeseriesTrainer"]
diff --git a/numalogic/models/autoencoder/base.py b/numalogic/models/autoencoder/base.py
@@ -44,23 +44,6 @@ def __init__(
  self.criterion = self.init_criterion(loss_fn)
  self.weight_decay = weight_decay
 
- self._total_train_loss = 0.0
- self._total_val_loss = 0.0
-
- @property
- def total_train_loss(self):
- return self._total_train_loss
-
- @property
- def total_val_loss(self):
- return self._total_val_loss
-
- def reset_train_loss(self):
- self._total_train_loss = 0.0
-
- def reset_val_loss(self):
- self._total_val_loss = 0.0
-
  @staticmethod
  def init_criterion(loss_fn: str):
  if loss_fn == "huber":
@@ -97,11 +80,11 @@ def configure_optimizers(self) -> dict[str, Any]:
  return {"optimizer": optimizer}
 
  def training_step(self, batch: Tensor, batch_idx: int) -> Tensor:
- loss = self._get_reconstruction_loss(batch)
- self._total_train_loss += loss.detach().item()
- return loss
+ recon_loss = self._get_reconstruction_loss(batch)
+ self.log("train_loss", recon_loss, on_epoch=True, on_step=False)
+ return recon_loss
 
  def validation_step(self, batch: Tensor, batch_idx: int) -> Tensor:
- loss = self._get_reconstruction_loss(batch)
- self._total_val_loss += loss.detach().item()
- return loss
+ recon_loss = self._get_reconstruction_loss(batch)
+ self.log("val_loss", recon_loss)
+ return recon_loss
diff --git a/numalogic/models/autoencoder/trainer.py b/numalogic/models/autoencoder/trainer.py
diff --git a/numalogic/models/autoencoder/variants/conv.py b/numalogic/models/autoencoder/variants/conv.py
@@ -342,5 +342,5 @@ def _get_reconstruction_loss(self, batch) -> Tensor:
  def validation_step(self, batch: Tensor, batch_idx: int) -> Tensor:
  recon = self.reconstruction(batch)
  loss = self.criterion(batch, recon)
- self._total_val_loss += loss.detach().item()
+ self.log("val_loss", loss)
  return loss