分析客户行为,进行客户细分
使用 user_logs 数据集,包含用户登录、购买、消费等信息。
先加载数据,了解数据结构和字段。
了解数据的基本统计信息。
计算总消费、平均消费等统计指标。
比较不同性别用户的消费行为。
找出消费金额高于平均值的用户。
计算登录次数和购买次数的相关性。
avg_logins = df['logins'].mean() print(f'平均登录次数: {avg_logins:.2f}')
max_purchases = df['purchases'].max() top_buyer = df[df['purchases'] == max_purchases] print(top_buyer)
print(df['total_spent'].describe())
gender_age = df.groupby('gender')['age'].mean() print(gender_age)
no_purchase = df[df['purchases'] == 0] print(f'无购买用户数: {len(no_purchase)}') print(no_purchase.head())
total_purchases = df['purchases'].sum() print(f'总购买次数: {total_purchases}')
top_users = df.sort_values(['logins', 'total_spent'], ascending=[False, False]).head(5) print(top_users[['user_id', 'logins', 'total_spent']])
# 可以用布尔索引分组分析 young = df[df['age'] < 30]['total_spent'].mean() older = df[df['age'] >= 30]['total_spent'].mean() print(f'30岁以下平均消费: {young:.2f}') print(f'30岁及以上平均消费: {older:.2f}')