Session 10: Neural Networks Without the Hype

Common Architecture Patterns

Binary Classification (spam/not spam, pass/fail):

model = keras.Sequential([
    keras.layers.Dense(64, activation='relu', input_shape=(features,)),
    keras.layers.Dense(1, activation='sigmoid')  # Output 0-1
])
model.compile(loss='binary_crossentropy', metrics=['accuracy'])

Multi-class Classification (iris species, digit recognition):

model = keras.Sequential([
    keras.layers.Dense(64, activation='relu', input_shape=(features,)),
    keras.layers.Dense(num_classes, activation='softmax')  # Output probabilities
])
model.compile(loss='categorical_crossentropy', metrics=['accuracy'])

Regression (price prediction):

model = keras.Sequential([
    keras.layers.Dense(64, activation='relu', input_shape=(features,)),
    keras.layers.Dense(1)  # No activation for regression
])
model.compile(loss='mse', metrics=['mae'])

Neural Networks Without the Hype

Today's Plan

Neural Network in 3 Bullets

The Keras Recipe

Dense Layer: The Building Block

Common Architecture Patterns

Common Error #1: Wrong Loss Function

Common Error #2: Wrong Output Activation

Common Error #3: Data Shape Issues

Training: What Those Parameters Mean

Monitoring Training

Overfitting Solutions

Debugging: Model Won't Learn

Data Normalization Matters!

Quick Reference: Model Building

Pro Tips

Let's Build Your First Neural Net!