✏️ 编程练习题(8道)
使用 groupby 按 'product' 列分组,并计算各列的总和。
参考答案
product_group = df.groupby('product').sum()
print(product_group)
按 'region' 列分组,并计算 'quantity' 列的平均值。
参考答案
region_mean = df.groupby('region')['quantity'].mean()
print(region_mean)
按 'product' 分组,计算 'quantity' 列的中位数。
参考答案
product_median = df.groupby('product')['quantity'].median()
print(product_median)
按 'product' 和 'region' 两个列进行分组,并计算总和。
参考答案
multi_group = df.groupby(['product', 'region']).sum()
print(multi_group)
按 'product' 分组并求和,然后按 'quantity' 列降序排序。
参考答案
product_group = df.groupby('product').sum()
sorted_product = product_group.sort_values('quantity', ascending=False)
print(sorted_product)
使用 agg() 函数,按 'region' 分组并计算 'quantity' 的 sum 和 mean。
参考答案
region_agg = df.groupby('region')['quantity'].agg(['sum', 'mean'])
print(region_agg)
按 'product' 分组,对 'quantity' 列计算 sum,对 'price' 列计算 mean。
参考答案
product_stats = df.groupby('product').agg({
'quantity': 'sum',
'price': 'mean'
})
print(product_stats)
计算各产品的总销量,并按总销量降序排序,只显示销量最高的3个产品。
参考答案
product_group = df.groupby('product')['quantity'].sum()
sorted_product = product_group.sort_values(ascending=False)
print(sorted_product.head(3))