import survey_pipeline.analysis_utils as utils
import sys
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.colors as pltcolors
import numpy as np
from textwrap import wrap
import os

from mpl_toolkits.axes_grid1 import Divider, Size
import ipywidgets as w
from ipywidgets import interact, FloatSlider, Checkbox, fixed
import matplotlib.pyplot as plt

print("Python version:", sys.version.split()[0])
print("pandas version:", pd.__version__)
print("numpy version:", np.__version__)
print("matplotlib version:", plt.matplotlib.__version__)

%load_ext autoreload
%autoreload 2

Python version: 3.12.3
pandas version: 2.3.3
numpy version: 2.3.4
matplotlib version: 3.10.7

paths = utils.get_paths()
df = pd.read_csv(paths.processed / "2_survey_multi_vc.csv")
likerts_qs = ["Q" + str(x) for x in range(7, 19)]
df_likert_vc = df.loc[df["question_index"].isin(likerts_qs)].copy()
df_likert_vc["question_number"] = df_likert_vc["question_index"].apply(lambda x: int(x[1:]))
df_likert_vc = df_likert_vc.sort_values(by=["question_number"], ascending=True)
print("Check value counts per question number:")
display(df_likert_vc["question_number"].value_counts())

Check value counts per question number:

question_number
7     175
8     175
9     175
10    175
11    175
12    175
13    175
14    175
15    175
16    175
17    175
18    175
Name: count, dtype: int64

%matplotlib widget

utils._plot_v1_interact(
    df_likert_vc,
    fig_width=13.0,
    fig_height=6.0,
    wratio_1=0.05,
    wratio_2=0.15,
    wratio_3=0.8,
    xlim=75,
    title_height=1.15,
    legend_height=1.15,
)

interactive(children=(Dropdown(description='group-by', options=('all', 'expertise', 'organization', 'role'), v…

%matplotlib inline
plt.ioff()
grouped = df_likert_vc.groupby(by=["group-by", "group-value"], sort=False)

for groups, df in grouped:
    groupby, groupval = groups
    # display(df.head())
    qnum = len(df["question"].unique())
    utils.group_likert_plot_v1(
        df,
        title="Survey Likert-Scaled Questions - " + groupval,
        group=groupby,
        fig_width=14,
        fig_height=8,
        xlim=75,
        barlabel_type="both",
        save=True,
    )

%matplotlib widget
# Interactive v2: pick question + group-by, tweak layout
utils._plot_v2_interact(
    df_likert_vc,
    fig_width=10.0,
    fig_height=8.0,
    wratio_1=0.05,
    wratio_2=0.25,
    wratio_3=0.75,
    xlim=75,
    title_height=1.15,
    legend_height=1.15,
)

interactive(children=(Dropdown(description='question', layout=Layout(width='70%'), options=('Q7: The documenta…

%matplotlib inline
plt.ioff()
df_likert_vc_dropall = df_likert_vc.loc[df_likert_vc['group-by'] != 'all']
grouped = df_likert_vc_dropall.groupby(by=["group-by", "question_index", "question"], sort=False)

for groups, df in grouped:
    groupby, question_index, question = groups
    utils.group_likert_plot_v2(
        df,
        title= question_index + " " + question,
        group=groupby,
        fig_width=14,
        fig_height=8,
        xlim=75,
        barlabel_type="both",
        save=True,
    )

Survey Analysis Pipeline (MS Forms → Clean Data → Plots)¶

Part 3 — Likert-Scaled Questions (Diverging Stacked Bars)¶

Input Data¶

Likert-Scaled Question Plotting¶

Plots with All Questions¶

All Responses¶

Plot Per Question¶