1.import要用的包
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
2.读取数据
data = pd.read_csv('model_datas.csv')
data
表结构:
字段名称 字段描述 User_ID 顾客ID Product_ID 商品ID Gender 顾客性别 Age 顾客年龄 Occupation 顾客从事职业ID City_Category 城市类别 Stay_In_Current_City_Years 在现城市呆的年数 Marital_Status 婚姻状况 Product_Category_1 商品类别1 Product_Category_2 商品类别2 Product_Category_3 商品类别3 Purchase 消费金额
3.处理数据
分析不同年龄段对消费金额的贡献。要用的字段:顾客年龄,消费金额。
Age_Purchase = data.groupby('Age')['Purchase'].sum()
Age_Purchase
4.画图
plt.bar(Age_Purchase.index,height=Age_Purchase['Purchase'])
所以可以下结论:年龄段在26-35岁的用户是贡献消费金额的主力人群。
文章出处登录后可见!
已经登录?立即刷新