Geospatial Machine Learning in Python

pip install geopandas rasterio scikit-learn xarray numpy pandas

import geopandas as gpd
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier

gdf = gpd.read_file("species_observations.shp")

gdf["lon"] = gdf.geometry.x
gdf["lat"] = gdf.geometry.y

df = pd.DataFrame(gdf.drop(columns="geometry"))

gdf["distance_to_river"] = gdf.geometry.distance(river_geometry)

from sklearn.cluster import KMeans

coords = df[["lat","lon"]]
kmeans = KMeans(n_clusters=5)
df["region_cluster"] = kmeans.fit_predict(coords)

X = df[["lat","lon","elevation","temperature"]]
y = df["species_presence"]

X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, random_state=42
)

model = RandomForestClassifier(n_estimators=200)

model.fit(X_train, y_train)

predictions = model.predict(X_test)

from sklearn.metrics import accuracy_score

accuracy = accuracy_score(y_test, predictions)
print(accuracy)

prediction_grid["predicted_presence"] = model.predict(grid_features)

results = gpd.GeoDataFrame(prediction_grid, geometry="geometry")

results.plot(column="predicted_presence", legend=True)

import rasterio

with rasterio.open("elevation.tif") as src:
    gdf["elevation"] = [
        x[0] for x in src.sample(
            [(geom.x, geom.y) for geom in gdf.geometry]
        )
    ]

import geopandas as gpd
import pandas as pd
from sklearn.ensemble import RandomForestClassifier

data = gpd.read_file("observations.shp")

data["lon"] = data.geometry.x
data["lat"] = data.geometry.y

X = data[["lat","lon","elevation"]]
y = data["target"]

model = RandomForestClassifier()
model.fit(X,y)

Library	Purpose
geopandas	Vector spatial data
rasterio	Raster data processing
numpy	Numerical operations
pandas	Tabular data manipulation
scikit-learn	Machine learning models
xarray	Multidimensional geospatial data

Geospatial Machine Learning in Python

Key Libraries

Spatial Features in Machine Learning

Preparing Spatial Data

Feature Engineering

Splitting Data

Training a Model

Evaluating Model Performance

Spatial Prediction

Mapping Machine Learning Results

Spatial Cross Validation

Working with Raster Features

Example Workflow

Summary

Next Steps