解析日期,按时间维度聚合,分析趋势与波动
使用 retail_orders 数据集,包含订单日期等时间信息。
将 order_date 列转换为日期时间格式。
使用 dt 访问器提取时间组件。
计算每个月的总销售额。
确保数据按时间顺序排列。
将日期列设置为索引,便于时间序列操作。
import pandas as pd df = pd.read_csv('retail_orders.csv')
df['order_date'] = pd.to_datetime(df['order_date'])
df['year'] = df['order_date'].dt.year
df['month'] = df['order_date'].dt.month
df['total'] = df['quantity'] * df['price']
monthly_sales = df.groupby('month')['total'].sum() print(monthly_sales)
df_sorted = df.sort_values('order_date') print(df_sorted.head())
df.set_index('order_date', inplace=True) print(df.head())