ubcecon
diff --git a/‎docs/lectures/lectures/deep_learning.html
+755-2 b/‎docs/lectures/lectures/deep_learning.html
+755-2
diff --git a/‎docs/lectures/lectures/embeddings_nlp_llm.html
+641-162 b/‎docs/lectures/lectures/embeddings_nlp_llm.html
+641-162
diff --git a/‎docs/lectures/lectures/embeddings_nlp_llm_files/figure-revealjs/cell-12-output-1.png
239 KB b/‎docs/lectures/lectures/embeddings_nlp_llm_files/figure-revealjs/cell-12-output-1.png
239 KB
diff --git a/‎docs/lectures/lectures/examples/mlp_regression_jax_nnx_logging.py
+106 b/‎docs/lectures/lectures/examples/mlp_regression_jax_nnx_logging.py
+106
diff --git a/‎docs/lectures/lectures/examples/mlp_regression_jax_nnx_sweep.yaml
+17 b/‎docs/lectures/lectures/examples/mlp_regression_jax_nnx_sweep.yaml
+17
diff --git a/‎docs/lectures/lectures/figures/sweep_1.png
234 KB b/‎docs/lectures/lectures/figures/sweep_1.png
234 KB
diff --git a/‎docs/lectures/lectures/figures/sweep_2.png
40.4 KB b/‎docs/lectures/lectures/figures/sweep_2.png
40.4 KB
diff --git a/‎docs/lectures/lectures/figures/sweep_3.png
226 KB b/‎docs/lectures/lectures/figures/sweep_3.png
226 KB
@@ -0,0 +1,106 @@
+# Takes the baseline version and uses vmap, adds in a learning rate scheduler
+import jax
+import jax.numpy as jnp
+import numpy as np
+from jax import random
+import optax
+import jax_dataloader as jdl
+from jax_dataloader.loaders import DataLoaderJAX
+from flax import nnx
+from typing import List, Optional, Callable
+import wandb
+import jsonargparse
+
+
+# My MLP
+class MyMLP(nnx.Module):
+    def __init__(self, din: int, dout: int, width: int, *, rngs: nnx.Rngs):
+        self.linear1 = nnx.Linear(din, width, rngs=rngs)
+        self.linear2 = nnx.Linear(width, width, rngs=rngs)
+        self.linear3 = nnx.Linear(width, dout, rngs=rngs)
+
+    def __call__(self, x: jax.Array):
+        x = self.linear1(x)
+        x = nnx.relu(x)
+        x = self.linear2(x)
+        x = nnx.relu(x)
+        x = self.linear3(x)
+        return x
+
+
+def fit_model(
+    N: int = 500,
+    M: int = 2,
+    sigma: float = 0.0001,
+    width: int = 128,
+    lr: float = 0.001,
+    num_epochs: int = 2000,
+    batch_size: int = 512,
+    seed: int = 42,
+    wandb_project: str = "econ622_examples",
+    wandb_mode: str = "offline",  # "online", "disabled
+):
+    if not wandb_mode == "disabled":
+        wandb.init(project="survey", mode=wandb_mode)
+    rngs = nnx.Rngs(seed)
+
+    theta = random.normal(rngs(), (M,))
+    X = random.normal(rngs(), (N, M))
+    Y = X @ theta + sigma * random.normal(rngs(), (N,))  # Adding noise
+
+    def residual(model, x, y):
+        y_hat = model(x)
+        return (y_hat - y) ** 2
+
+    def residuals_loss(model, X, Y):
+        return jnp.mean(jax.vmap(residual, in_axes=(None, 0, 0))(model, X, Y))
+
+    model = MyMLP(M, 1, width, rngs=rngs)
+
+    n_params = sum(
+        np.prod(x.shape) for x in jax.tree.leaves(nnx.state(model, nnx.Param))
+    )
+    print(f"Number of parameters: {n_params}")
+
+    optimizer = nnx.Optimizer(model, optax.sgd(lr))
+
+    @nnx.jit
+    def train_step(model, optimizer, X, Y):
+        def loss_fn(model):
+            return residuals_loss(model, X, Y)
+
+        loss, grads = nnx.value_and_grad(loss_fn)(model)
+        optimizer.update(grads)
+        return loss
+
+    dataset = jdl.ArrayDataset(X, Y)
+    train_loader = DataLoaderJAX(dataset, batch_size=batch_size, shuffle=True)
+    for epoch in range(num_epochs):
+        for X_batch, Y_batch in train_loader:
+            loss = train_step(model, optimizer, X_batch, Y_batch)
+
+        if not (wandb_mode == "disabled"):
+            wandb.log({"epoch": epoch, "train_loss": loss, "lr": lr})
+        if epoch % 100 == 0:
+            print(f"Epoch {epoch}, loss {loss}")
+
+    N_test = 200
+    X_test = random.normal(rngs(), (N_test, M))
+    Y_test = X_test @ theta + sigma * random.normal(rngs(), (N_test,))  # Adding noise
+
+    loss_data = residuals_loss(model, X, Y)
+    loss_test = residuals_loss(model, X_test, Y_test)
+    print(f"loss(model, X, Y) = {loss_data}, loss(model, X_test, Y_test) = {loss_test}")
+    if not (wandb_mode == "disabled"):
+        wandb.log(
+            {"train_loss": loss_data, "test_loss": loss_test, "num_params": n_params}
+        )
+
+    if not wandb_mode == "disabled":
+        wandb.finish()
+
+
+if __name__ == "__main__":
+    jsonargparse.CLI(fit_model)
+    # Swap with this line to run debugger with different parameters
+    # jsonargparse.CLI(fit_model, args=["--num_epochs", "200", "--wandb_mode", "online"])
@@ -0,0 +1,17 @@
+program: lectures/examples/mlp_regression_jax_nnx_logging.py
+name: Sweep Example
+description: Example Sweep
+method: bayes
+metric:
+  name: test_loss
+  goal: minimize
+parameters:
+  wandb_mode:
+    value: online # otherwise won't log
+  num_epochs:
+    value: 300
+  lr:
+    min: 0.0001
+    max: 0.01
+  width:
+    values: [64, 128, 256]