在数据时代,销售数据分析的重要性不言而喻。
只有对销售数据进行准确分析,才能查明数据变化(增加或减少)的原因。
那么解决问题,发现新的增长点就成为可能!
今天给大家介绍一种使用Python创建销售数据大屏的方法。
主要使用Python的Streamlit库、Plotly库、Pandas库构建。
Pandas 处理数据,Plotly 创建可视化图表,Streamlit 构建可视化页面。
对于以上三个库,Streamlit库大家可能比较陌生,所以简单介绍一下。
Streamlit 是一个完全免费的开源应用程序框架,可以帮助您快速创建一个很酷的网页,而无需了解复杂的 HTML、CSS 和其他前端技术。
01.数据
所用数据为虚构数据,2021年某超市销售订单数据,一共1000个订单数据。
共有三个城市,分别是北京、上海和杭州。有两种类型的客户,会员和普通客户。客户性别为男性和女性。
其余还包括订单号、商品类型、单价、数量、总价、日期、时间、支付方式、成本、毛利率、总收入、评级等信息。
一般的 Pandas read_excel 方法读取数据。
跳过前 3 行,选择 B 到 R 列,1000 行数据。
def get_data_from_excel():
df = pd.read_excel(
io="supermarkt_sales.xlsx",
engine="openpyxl",
sheet_name="Sales",
skiprows=3,
usecols="B:R",
nrows=1000,
)
# 添加小时列数据
df["小时"] = pd.to_datetime(df["时间"], format="%H:%M:%S").dt.hour
return df
df = get_data_from_excel()
print(df)
成功读取数据,结果如下。
现在您可以编写页面了。
02.网页标题和图标
我们都知道,当浏览器打开一个网页时,会有一个标题和一个图标。
所以我们需要先设置这个网页的名称、图标、布局等。
这也是第一个使用Streamlit构建页面的Streamlit命令web大屏数字变化,只能设置一次。
# 设置网页信息
st.set_page_config(page_title="销售数据大屏", page_icon=":bar_chart:", layout="wide")
page_icon 参数可以使用 emoji 代码来显示图标。
03.侧边栏和复选框
st.sidebar(侧边栏),传递给st.sidebar的每一个元素都会固定在左边web大屏数字变化,让用户专注于首页的内容。
multiselect 是一个交互式小部件,通过它可以过滤数据。
# 侧边栏
st.sidebar.header("请在这里筛选:")
city = st.sidebar.multiselect(
"选择城市:",
options=df["城市"].unique(),
default=df["城市"].unique()
)
customer_type = st.sidebar.multiselect(
"选择顾客类型:",
options=df["顾客类型"].unique(),
default=df["顾客类型"].unique(),
)
gender = st.sidebar.multiselect(
"选择性别:",
options=df["性别"].unique(),
default=df["性别"].unique()
)
df_selection = df.query(
"城市 == @city & 顾客类型 ==@customer_type & 性别 == @gender"
)
结合Pandas查询查询,可以过滤数据。
通过以上代码构建成功,如下图左侧所示。
点击侧边栏右上角的关闭符号隐藏侧边栏。
页面将显示主页。
04.主页信息
接下来,编写主页信息,包括主页标题、总销售额、平均评分和平均销售额信息。
类似于网页图标,通过表情符号代码实现。
# 主页面
st.title(":bar_chart: 销售数据大屏")
st.markdown("##")
# 核心指标, 销售总额、平均评分、星级、平均销售额数据
total_sales = int(df_selection["总价"].sum())
average_rating = round(df_selection["评分"].mean(), 1)
star_rating = ":star:" * int(round(average_rating, 0))
average_sale_by_transaction = round(df_selection["总价"].mean(), 2)
# 3列布局
left_column, middle_column, right_column = st.columns(3)
# 添加相关信息
with left_column:
st.subheader("销售总额:")
st.subheader(f"RMB {total_sales:,}")
with middle_column:
st.subheader("平均评分:")
st.subheader(f"{average_rating} {star_rating}")
with right_column:
st.subheader("平均销售额:")
st.subheader(f"RMB {average_sale_by_transaction}")
# 分隔符
st.markdown("""---""")
完成核心指标数据的处理,并在布局中展示。
05.主页图表
包含两张图表,一张表示每小时销售额,一张表示各种商品的总销售额。图表是通过 Plotly Express 绘制的。
Plotly Express 是一个新的高级 Python 可视化库,它是 Plotly.py 的高级包装器,为复杂图形提供简单的语法。
受 Seaborn 和 ggplot2 的启发,它经过专门设计,具有干净、一致且易于学习的 API。通过一次导入,可以在一个函数调用中创建丰富的交互式绘图。
# 各类商品销售情况(柱状图)
sales_by_product_line = (
df_selection.groupby(by=["商品类型"]).sum()[["总价"]].sort_values(by="总价")
)
fig_product_sales = px.bar(
sales_by_product_line,
x="总价",
y=sales_by_product_line.index,
orientation="h",
title="每种商品销售总额",
color_discrete_sequence=["#0083B8"] * len(sales_by_product_line),
template="plotly_white",
)
fig_product_sales.update_layout(
plot_bgcolor="rgba(0,0,0,0)",
xaxis=(dict(showgrid=False))
)
# 每小时销售情况(柱状图)
sales_by_hour = df_selection.groupby(by=["小时"]).sum()[["总价"]]
print(sales_by_hour.index)
fig_hourly_sales = px.bar(
sales_by_hour,
x=sales_by_hour.index,
y="总价",
title="每小时销售总额",
color_discrete_sequence=["#0083B8"] * len(sales_by_hour),
template="plotly_white",
)
fig_hourly_sales.update_layout(
xaxis=dict(tickmode="linear"),
plot_bgcolor="rgba(0,0,0,0)",
yaxis=(dict(showgrid=False)),
)
left_column, right_column = st.columns(2)
left_column.plotly_chart(fig_hourly_sales, use_container_width=True)
right_column.plotly_chart(fig_product_sales, use_container_width=True)
添加数据、设置图表配置和页面布局。
结果如下。
06.隐藏部分
当我们通过Streamlit构建界面时,默认会出现红线、菜单、末尾的“Make with Streamlit”。
为了美观,可以隐藏在这里。
# 隐藏streamlit默认格式信息
hide_st_style = """
"""
st.markdown(hide_st_style, unsafe_allow_html=True)
这样一个交互式销售数据板的搭建就完成了!
# 安装依赖库
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple plotly==4.14.3
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pandas==1.1.0
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple streamlit==0.86.0
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple openpyxl==3.0.6
# 运行
streamlit run app.py
安装相关依赖,在命令行终端运行程序。
请登录后发表评论
注册
社交帐号登录