Working with Data

name,age,city
Alice,30,Denver
Bob,25,Boulder

import csv

with open("people.csv") as file:
    reader = csv.DictReader(file)

    for row in reader:
        print(row["name"], row["age"])

pip install pandas

import pandas as pd

data = pd.read_csv("people.csv")

data.head()

   name  age    city
0 Alice   30  Denver
1 Bob     25 Boulder

data.columns

data.describe()

data.dtypes

data["age"]

data[["name", "city"]]

filtered = data[data["age"] > 25]

denver_people = data[data["city"] == "Denver"]

data["age_next_year"] = data["age"] + 1

data.sort_values("age")

data.sort_values("age", ascending=False)

city,temperature
Denver,70
Denver,72
Boulder,68

data.groupby("city")["temperature"].mean()

data.isnull()

data.dropna()

data.fillna(0)

data.to_csv("output.csv", index=False)

data.to_excel("output.xlsx")

{
  "name": "Alice",
  "age": 30
}

import json

with open("data.json") as f:
    data = json.load(f)

print(data["name"])

import pandas as pd

# load data
data = pd.read_csv("sales.csv")

# filter rows
recent_sales = data[data["year"] == 2024]

# calculate totals
total = recent_sales["revenue"].sum()

print("Total revenue:", total)

# save results
recent_sales.to_csv("filtered_sales.csv", index=False)

Working with Data

Reading Data From a CSV File

Using Pandas for Data Analysis

Loading Data With Pandas

Exploring Data

Selecting Columns

Filtering Data

Creating New Columns

Sorting Data

Grouping Data

Handling Missing Data

Saving Data

Working With JSON Data

Example Data Workflow

Summary