add specific param logging to wandb; update python logging

slegroux · slegroux · commit 111216ccde5f · 2024-12-16T15:36:23.000-08:00
diff --git a/nbs/image.datasets.ipynb b/nbs/image.datasets.ipynb
@@ -66,7 +66,10 @@
     "\n",
     "from typing import Any, Dict, Optional, Tuple, List\n",
     "from nimrod.data.core import DataModule\n",
-    "from nimrod.utils import logger, set_seed"
+    "from nimrod.utils import set_seed\n",
+    "\n",
+    "import logging\n",
+    "logger = logging.getLogger(__name__)"
    ]
   },
   {
diff --git a/nbs/models.conv.ipynb b/nbs/models.conv.ipynb
@@ -56,8 +56,11 @@
     "from omegaconf import OmegaConf\n",
     "\n",
     "from nimrod.image.datasets import MNISTDataModule\n",
-    "from nimrod.utils import get_device, logger\n",
-    "from nimrod.models.core import Classifier"
+    "from nimrod.utils import get_device\n",
+    "from nimrod.models.core import Classifier\n",
+    "\n",
+    "import logging\n",
+    "logger = logging.getLogger(__name__)"
    ]
   },
   {
diff --git a/nbs/models.core.ipynb b/nbs/models.core.ipynb
@@ -42,9 +42,11 @@
     "import torch\n",
     "\n",
     "from abc import ABC, abstractmethod\n",
-    "from nimrod.utils import logger\n",
+    "# from nimrod.utils import logger\n",
     "\n",
-    "from torchmetrics import Accuracy\n"
+    "from torchmetrics import Accuracy\n",
+    "import logging\n",
+    "logger = logging.getLogger(__name__)\n"
    ]
   },
   {
diff --git a/nbs/models.lm.ipynb b/nbs/models.lm.ipynb
diff --git a/nbs/models.mlp.ipynb b/nbs/models.mlp.ipynb
@@ -52,10 +52,12 @@
     "\n",
     "from nimrod.utils import get_device\n",
     "from nimrod.image.datasets import MNISTDataModule\n",
-    "from nimrod.utils import logger\n",
     "from nimrod.models.core import Classifier\n",
     "# torch.set_num_interop_threads(1)\n",
-    "# from IPython.core.debugger import set_trace"
+    "# from IPython.core.debugger import set_trace\n",
+    "\n",
+    "import logging\n",
+    "logger = logging.getLogger(__name__)"
    ]
   },
   {
diff --git a/nbs/text.datasets.ipynb b/nbs/text.datasets.ipynb
@@ -76,8 +76,11 @@
     "\n",
     "# nimrod\n",
     "# from nimrod.models.lm import Vocab\n",
-    "from nimrod.utils import set_seed, logger\n",
-    "from nimrod.data.core import DataModule\n"
+    "from nimrod.utils import set_seed\n",
+    "from nimrod.data.core import DataModule\n",
+    "\n",
+    "import logging\n",
+    "logger = logging.getLogger(__name__)\n"
    ]
   },
   {
diff --git a/nbs/utils.ipynb b/nbs/utils.ipynb
@@ -51,6 +51,7 @@
     "import random\n",
     "import os\n",
     "import logging\n",
+    "from rich.logging import RichHandler\n",
     "import lightning as L"
    ]
   },
@@ -87,8 +88,8 @@
      "name": "stdout",
      "output_type": "stream",
      "text": [
-      "cpu\n",
-      "Is MPS (Metal Performance Shader) built? False\n"
+      "mps\n",
+      "Is MPS (Metal Performance Shader) built? True\n"
      ]
     }
    ],
@@ -123,7 +124,7 @@
     "    # # Set a fixed value for the hash seed\n",
     "    # os.environ[\"PYTHONHASHSEED\"] = str(seed)\n",
     "    # print(f\"Random seed set as {seed}\")\n",
-    "    L.seed_everything(seed)"
+    "    L.seed_everything(seed, workers=True)"
    ]
   },
   {
@@ -166,10 +167,15 @@
     "#| export\n",
     "\n",
     "# Configure the logger\n",
-    "logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')\n",
+    "logging.basicConfig(\n",
+    "    level=logging.DEBUG, format='%(asctime)s - %(levelname)s - %(message)s',\n",
+    "    handlers=[RichHandler(rich_tracebacks=True)]\n",
+    "    )\n",
     "\n",
     "# Create a logger\n",
-    "logger = logging.getLogger(__name__)"
+    "# logger = logging.getLogger(__name__)\n",
+    "def get_logger(name=__name__):\n",
+    "    return logging.getLogger(name)"
    ]
   },
   {
diff --git a/recipes/image/mnist/train.py b/recipes/image/mnist/train.py
@@ -4,7 +4,10 @@
 from omegaconf import DictConfig, OmegaConf
 import hydra
 from hydra.utils import instantiate
-import wandb
+from nimrod.utils import set_seed
+import json
+import logging
+log = logging.getLogger(__name__)
 
 @hydra.main(version_base="1.3",config_path="conf", config_name="train_mlp.yaml")
 def main(cfg: DictConfig) -> dict:
@@ -15,12 +18,10 @@ def main(cfg: DictConfig) -> dict:
     hp = OmegaConf.to_container(cfg, resolve=True, throw_on_missing=True)
 
     # SEED
-
-    L.seed_everything(cfg.seed, workers=True)
+    set_seed(cfg.seed)
 
     # MODEL
     model = instantiate(cfg.model)
-    # from IPython import embed; embed()
 
     # DATA
     datamodule = instantiate(cfg.datamodule)
@@ -31,42 +32,53 @@ def main(cfg: DictConfig) -> dict:
         callbacks.append(instantiate(cb_conf))
 
     loggers = []
+    # logger.info("Instantiating logger <{}>".format(cfg.logger._target_))
     for log_conf in cfg.loggers:
         logger = instantiate(cfg[log_conf])
         # wandb logger special setup
         if isinstance(logger, L.pytorch.loggers.WandbLogger):
             # deal with hangs when hp optim multirun training 
             # wandb.init(settings=wandb.Settings(start_method="thread"))
             # wandb requires dict not DictConfig
-            logger.experiment.config.update(hp)
+            logger.experiment.config.update(hp["datamodule"], allow_val_change=True)
+            logger.experiment.config.update(hp["model"], allow_val_change=True)
         loggers.append(logger)
+    
+    # print(json.dumps(hp, indent=4))
         
     # trainer
     profiler = instantiate(cfg.profiler)
-    trainer = instantiate(cfg.trainer, callbacks=callbacks, profiler=profiler, logger=[logger])
-    trainer.logger.log_hyperparams(hp)
-
-    # lr finder
-    # tuner = Tuner(trainer)
+    trainer = instantiate(cfg.trainer, callbacks=callbacks, profiler=profiler, logger=loggers)
+    # trainer.logger.log_hyperparams(hp)
 
-    # tuner.scale_batch_size(model, datamodule=datamodule, mode="power")
-    # lr_finder = tuner.lr_find(model,datamodule=datamodule)
-    # print(lr_finder.results)
-    # # Plot with
-    # fig = lr_finder.plot(suggest=True)
-    # fig.show()
-    # new_lr = lr_finder.suggestion()
-    # model.hparams.lr = new_lr
+    # batch size & lr optimization
+    tuner = Tuner(trainer)
+    if cfg.get("bs_finder"):
+        tuner.scale_batch_size(model, datamodule=datamodule, mode="power", init_val= 65536)
+        if isinstance(logger, L.pytorch.loggers.WandbLogger):
+            # bs is automatically updated in L datamodule but we need to manuallyupdate it in wandb
+            logger.experiment.config.update({"batch_size": datamodule.hparams.batch_size}, allow_val_change=True)
+
+    if cfg.get("lr_finder"):
+        lr_finder = tuner.lr_find(model, datamodule=datamodule)
+        print(lr_finder.results)
+        # Plot with
+        fig = lr_finder.plot(suggest=True)
+        fig.show()
+        new_lr = lr_finder.suggestion()
+        model.hparams.lr = new_lr
+        if isinstance(logger, L.pytorch.loggers.WandbLogger):
+            logger.experiment.config.update({"lr": new_lr}, allow_val_change=True)
 
 
     if cfg.get("train"):
         # trainer.fit(model=autoencoder_pl, train_dataloaders=train_dl, val_dataloaders=dev_dl, ckpt_path=cfg.get("ckpt_path"))
         trainer.fit(model, datamodule=datamodule, ckpt_path=cfg.get("ckpt_path"))
 
     # # TEST
-    # if cfg.get("test"):
+    if cfg.get("test"):
     #     # trainer.test(autoencoder_pl, dataloaders=test_dl)
-    #     trainer.test(datamodule=datamodule, ckpt_path="best")
+        trainer.test(datamodule=datamodule, ckpt_path="best")
 
     # wandb.finish()
 

Original file line number	Diff line number	Diff line change
`@@ -66,7 +66,10 @@`
`66`	`66`	`"\n",`
`67`	`67`	`"from typing import Any, Dict, Optional, Tuple, List\n",`
`68`	`68`	`"from nimrod.data.core import DataModule\n",`
`69`		`- "from nimrod.utils import logger, set_seed"`
	`69`	`+ "from nimrod.utils import set_seed\n",`
	`70`	`+ "\n",`
	`71`	`+ "import logging\n",`
	`72`	`+ "logger = logging.getLogger(__name__)"`
`70`	`73`	`]`
`71`	`74`	`},`
`72`	`75`	`{`
Original file line number	Diff line number	Diff line change
`@@ -56,8 +56,11 @@`
`56`	`56`	`"from omegaconf import OmegaConf\n",`
`57`	`57`	`"\n",`
`58`	`58`	`"from nimrod.image.datasets import MNISTDataModule\n",`
`59`		`- "from nimrod.utils import get_device, logger\n",`
`60`		`- "from nimrod.models.core import Classifier"`
	`59`	`+ "from nimrod.utils import get_device\n",`
	`60`	`+ "from nimrod.models.core import Classifier\n",`
	`61`	`+ "\n",`
	`62`	`+ "import logging\n",`
	`63`	`+ "logger = logging.getLogger(__name__)"`
`61`	`64`	`]`
`62`	`65`	`},`
`63`	`66`	`{`
Original file line number	Diff line number	Diff line change
`@@ -42,9 +42,11 @@`
`42`	`42`	`"import torch\n",`
`43`	`43`	`"\n",`
`44`	`44`	`"from abc import ABC, abstractmethod\n",`
`45`		`- "from nimrod.utils import logger\n",`
	`45`	`+ "# from nimrod.utils import logger\n",`
`46`	`46`	`"\n",`
`47`		`- "from torchmetrics import Accuracy\n"`
	`47`	`+ "from torchmetrics import Accuracy\n",`
	`48`	`+ "import logging\n",`
	`49`	`+ "logger = logging.getLogger(__name__)\n"`
`48`	`50`	`]`
`49`	`51`	`},`
`50`	`52`	`{`
Original file line number	Diff line number	Diff line change
`@@ -76,8 +76,11 @@`
`76`	`76`	`"\n",`
`77`	`77`	`"# nimrod\n",`
`78`	`78`	`"# from nimrod.models.lm import Vocab\n",`
`79`		`- "from nimrod.utils import set_seed, logger\n",`
`80`		`- "from nimrod.data.core import DataModule\n"`
	`79`	`+ "from nimrod.utils import set_seed\n",`
	`80`	`+ "from nimrod.data.core import DataModule\n",`
	`81`	`+ "\n",`
	`82`	`+ "import logging\n",`
	`83`	`+ "logger = logging.getLogger(__name__)\n"`
`81`	`84`	`]`
`82`	`85`	`},`
`83`	`86`	`{`