openmedlab
diff --git a/‎.gitignore
+5-5 b/‎.gitignore
+5-5
diff --git a/‎.pre-commit-config.yaml
+62-35 b/‎.pre-commit-config.yaml
+62-35
diff --git a/‎usfm/__init__.py ‎USDSgen/__init__.py b/‎usfm/__init__.py ‎USDSgen/__init__.py
diff --git a/‎USDSgen/data/__init__.py
+1 b/‎USDSgen/data/__init__.py
+1
diff --git a/‎USDSgen/data/datasets.py
+173 b/‎USDSgen/data/datasets.py
+173
@@ -143,9 +143,9 @@ dmypy.json
 *.h5
 *.tar
 *.tar.gz
-*.ckpt
 
-configs/local/default.yaml
-/data/
-/logs/
-.env
+# Aim logging
+.aim
+assets/
+logs/
+*/local/*
@@ -3,12 +3,12 @@ default_language_version:
 
 repos:
   - repo: https://github.com/pre-commit/pre-commit-hooks
-    rev: v4.4.0
+    rev: v5.0.0
     hooks:
       # list of supported hooks: https://pre-commit.com/hooks.html
       - id: trailing-whitespace
       - id: end-of-file-fixer
-      - id: check-docstring-first
+      # - id: check-docstring-first
       - id: check-yaml
       - id: debug-statements
       - id: detect-private-key
@@ -19,41 +19,63 @@ repos:
 
   # python code formatting
   - repo: https://github.com/psf/black
-    rev: 23.1.0
+    rev: 24.4.2
     hooks:
       - id: black
-        args: [--line-length, "99"]
+        # args: [--line-length, "99"]
 
   # python import sorting
   - repo: https://github.com/PyCQA/isort
-    rev: 5.12.0
+    rev: 5.13.2
     hooks:
       - id: isort
         args: ["--profile", "black", "--filter-files"]
 
   # python upgrading syntax to newer version
   - repo: https://github.com/asottile/pyupgrade
-    rev: v3.3.1
+    rev: v3.15.2
     hooks:
       - id: pyupgrade
-        args: [--py38-plus]
+        # args: [--py38-plus]
 
-  # python docstring formatting
-  - repo: https://github.com/myint/docformatter
-    rev: v1.5.1
-    hooks:
-      - id: docformatter
-        args: [--in-place, --wrap-summaries=99, --wrap-descriptions=99]
+  # # python docstring formatting
+  # - repo: https://github.com/myint/docformatter
+  #   rev: v1.7.4
+  #   hooks:
+  #     - id: docformatter
+  #       args:
+  #         [
+  #           --in-place,
+  #           --wrap-summaries=99,
+  #           --wrap-descriptions=99,
+  #           --style=sphinx,
+  #           --black,
+  #         ]
+
+  # # python docstring coverage checking
+  # - repo: https://github.com/econchick/interrogate
+  #   rev: 1.5.0 # or master if you're bold
+  #   hooks:
+  #     - id: interrogate
+  #       args:
+  #         [
+  #           --verbose,
+  #           --fail-under=80,
+  #           --ignore-init-module,
+  #           --ignore-init-method,
+  #           --ignore-module,
+  #           --ignore-nested-functions,
+  #           -vv,
+  #         ]
 
   # python check (PEP8), programming errors and code complexity
   - repo: https://github.com/PyCQA/flake8
-    rev: 6.0.0
+    rev: 7.0.0
     hooks:
       - id: flake8
-        args:
-          [
+        args: [
             "--extend-ignore",
-            "E203,E402,E501,F401,F841",
+            "E203,E402,E501,F401,F841,E722", # add E722 to ignore bare except
             "--exclude",
             "logs/*,data/*",
           ]
@@ -67,34 +89,36 @@ repos:
 
   # yaml formatting
   - repo: https://github.com/pre-commit/mirrors-prettier
-    rev: v3.0.0-alpha.6
+    rev: v3.0.0
     hooks:
       - id: prettier
-        types: [yaml]
-        exclude: "environment.yaml"
+        additional_dependencies:
+          - prettier@3.3.3 # SEE: https://github.com/pre-commit/pre-commit/issues/3133
 
   # shell scripts linter
-  - repo: https://github.com/shellcheck-py/shellcheck-py
-    rev: v0.9.0.2
-    hooks:
-      - id: shellcheck
+  # - repo: https://github.com/shellcheck-py/shellcheck-py
+  #   rev: v0.10.0.1
+  #   hooks:
+  #     - id: shellcheck
 
   # md formatting
   - repo: https://github.com/executablebooks/mdformat
-    rev: 0.7.16
+    rev: 0.7.17
     hooks:
       - id: mdformat
         args: ["--number"]
         additional_dependencies:
           - mdformat-gfm
           - mdformat-tables
           - mdformat_frontmatter
+          - mdformat-beautysh
+          - mdformat-black
           # - mdformat-toc
           # - mdformat-black
 
   # word spelling linter
   - repo: https://github.com/codespell-project/codespell
-    rev: v2.2.4
+    rev: v2.3.0
     hooks:
       - id: codespell
         args:
@@ -103,21 +127,24 @@ repos:
 
   # jupyter notebook cell output clearing
   - repo: https://github.com/kynan/nbstripout
-    rev: 0.6.1
+    rev: 0.7.1
     hooks:
       - id: nbstripout
 
   # jupyter notebook linting
   - repo: https://github.com/nbQA-dev/nbQA
-    rev: 1.6.3
+    rev: 1.8.5
     hooks:
       - id: nbqa-black
-        args: ["--line-length=99"]
+        # args: ["--line-length=99"]
       - id: nbqa-isort
         args: ["--profile=black"]
-      - id: nbqa-flake8
-        args:
-          [
-            "--extend-ignore=E203,E402,E501,F401,F841",
-            "--exclude=logs/*,data/*",
-          ]
+      - id: nbqa-pyupgrade
+        args: ["--py38-plus"]
+      - id: nbqa-isort
+        args: ["--float-to-top"]
+      # - id: nbqa-flake8
+      #   args: [
+      #       # "--extend-ignore=E203,E402,E501,F401,F841",
+      #       "--exclude=logs/*,data/*",
+      #     ]
@@ -0,0 +1 @@
+from .make_dataloader import build_loader
@@ -0,0 +1,173 @@
+import os
+
+import albumentations as A
+import numpy as np
+import torch
+import torchvision.transforms as T
+from albumentations.pytorch import ToTensorV2
+from PIL import Image
+from timm.data.constants import IMAGENET_DEFAULT_MEAN, IMAGENET_DEFAULT_STD
+from timm.data.transforms import str_to_pil_interp
+from torch.utils.data import Dataset
+from torchvision import datasets
+
+
+def build_cls_dataset(config, logger):
+    train_transforms = T.Compose(
+        [
+            T.Lambda(lambda img: img.convert("RGB") if img.mode != "RGB" else img),
+            T.Resize(
+                (config.data.img_size, config.data.img_size),
+                interpolation=str_to_pil_interp(config.data.interpolation),
+            ),
+            # T.RandomHorizontalFlip(),
+            # A.RandomRotate90(p=0.5),
+            # A.HorizontalFlip(p=0.5),
+            # A.VerticalFlip(p=0.5),
+            T.ToTensor(),
+            T.Normalize(
+                mean=torch.tensor(IMAGENET_DEFAULT_MEAN),
+                std=torch.tensor(IMAGENET_DEFAULT_STD),
+            ),
+        ]
+    )
+    val_transforms = T.Compose(
+        [
+            T.Resize(
+                (config.data.img_size, config.data.img_size),
+                interpolation=str_to_pil_interp(config.data.interpolation),
+            ),
+            T.ToTensor(),
+            T.Normalize(
+                mean=torch.tensor(IMAGENET_DEFAULT_MEAN),
+                std=torch.tensor(IMAGENET_DEFAULT_STD),
+            ),
+        ]
+    )
+    if config.data.type == "cls_imagenet":
+        data_path = config.data.path
+        dataset_train = datasets.ImageFolder(
+            os.path.join(data_path.root, data_path.split.train),
+            transform=train_transforms,
+        )
+        dataset_val = datasets.ImageFolder(
+            os.path.join(data_path.root, data_path.split.val), transform=val_transforms
+        )
+        dataset_test = datasets.ImageFolder(
+            os.path.join(data_path.root, data_path.split.test), transform=val_transforms
+        )
+    else:
+        raise NotImplementedError("We only support ImageNet Now.")
+
+    logger.info(
+        f"Build [Cls] dataset: train images = {len(dataset_train)}, val images = {len(dataset_val)}, test images = {len(dataset_test)}"
+    )
+    return dataset_train, dataset_val, dataset_test
+
+
+def build_seg_dataset(config, logger):
+    train_transforms = A.Compose(
+        [
+            A.Resize(width=config.data.img_size, height=config.data.img_size),
+            A.RandomRotate90(p=0.5),
+            A.HorizontalFlip(p=0.5),
+            A.VerticalFlip(p=0.5),
+            # A.RandomBrightnessContrast(brightness_limit=0.3, contrast_limit=0.3, p=0.5),
+            A.ToFloat(max_value=255),
+            A.Normalize(
+                mean=(0.485, 0.456, 0.406), std=(0.229, 0.224, 0.225), max_pixel_value=1
+            ),
+            ToTensorV2(),
+        ]
+    )
+    val_transforms = A.Compose(
+        [
+            A.Resize(width=config.data.img_size, height=config.data.img_size),
+            A.ToFloat(max_value=255),
+            A.Normalize(
+                mean=(0.485, 0.456, 0.406), std=(0.229, 0.224, 0.225), max_pixel_value=1
+            ),
+            ToTensorV2(),
+        ]
+    )
+    Dataset_class = eval(config.data.type + "Dataset")
+
+    dataset_train = Dataset_class(config.data, "train", train_transforms)
+    dataset_val = Dataset_class(config.data, "val", val_transforms)
+    dataset_test = Dataset_class(config.data, "test", val_transforms)
+    logger.info(
+        f"Build [Seg] dataset: train images = {len(dataset_train)}, val images = {len(dataset_val)}, test images = {len(dataset_test)}"
+    )
+
+    return dataset_train, dataset_val, dataset_test
+
+
+class SegBaseDataset(Dataset):
+    def __init__(self, DataConfig, stage, transforms=None):
+        super().__init__()
+        data_folder = os.path.join(DataConfig.path.root, DataConfig.path.split[stage])
+        self.num_classes = DataConfig.num_classes
+        self.update_datalist(data_folder)
+        self.transforms = transforms
+
+    def __getitem__(self, index):
+        image_file = self.image_list[index]
+        mask_file = self.mask_list[index]
+        image = np.array(Image.open(image_file).convert("RGB"))
+        if self.num_classes == 2:
+            mask = np.array(Image.open(mask_file).convert("1")).astype(int)
+        else:
+            mask = np.array(Image.open(mask_file)).astype(int)
+        if self.transforms is not None:
+            image_mask = self.transforms(image=image, mask=mask)
+            image_mask["img_path"] = image_file
+            image_mask["mask_path"] = mask_file
+        return image_mask
+
+    def update_datalist(self, folder):
+        image_path = os.path.join(folder, "image")
+        mask_path = os.path.join(folder, "mask")
+        # find all file in the folder and subfolder
+        filenames = []
+        for root, dirs, files in os.walk(image_path):
+            for file in files:
+                filenames.append(os.path.join(root, file))
+
+        # filenames = os.listdir(image_path)
+        self.image_list = filenames
+        self.mask_list = [i.replace(image_path, mask_path) for i in filenames]
+
+    def __len__(self):
+        return len(self.image_list)
+
+
+class SegVocDataset(Dataset):
+    def __init__(self, DataConfig, stage, transforms=None):
+        super().__init__()
+        self.update_datalist(DataConfig.path.root, stage, DataConfig.path.image_type)
+        self.transforms = transforms
+
+    def __getitem__(self, index):
+        image_file = self.image_list[index]
+        mask_file = self.mask_list[index]
+        image = np.array(Image.open(image_file).convert("RGB"))
+        mask = np.array(Image.open(mask_file).convert("1")).astype(int)
+        if self.transforms is not None:
+            image_mask = self.transforms(
+                image=image, mask=mask, img_path=image_file, mask_path=mask_file
+            )
+        return image_mask
+
+    def update_datalist(self, root, stage, image_type):
+        filenames = np.loadtxt(
+            os.path.join(root, "ImageSets", stage + ".txt"), dtype=str
+        )
+        image_filenames = [i + "." + image_type for i in filenames]
+        mask_filenames = [i + ".png" for i in filenames]
+        self.image_list = [os.path.join(root, "JPEGImages", i) for i in image_filenames]
+        self.mask_list = [
+            os.path.join(root, "SegmentationClass", i) for i in mask_filenames
+        ]
+
+    def __len__(self):
+        return len(self.image_list)
Original file line number	Diff line number	Diff line change
`@@ -0,0 +1 @@`
	`1`	`+from .make_dataloader import build_loader`