c语言sscanf函数的用法是什么
271
2022-08-17
刚过去的520,大家都在送什么礼物,Python用可视化图告诉你
前言
一年一度的520刚刚过去。
由于受疫情影响错过了今年的2月14日情人节,2020年5月20日,这个谐音为“爱你爱你我爱你”的 “世纪520”,对情侣们来说显得格外有吸引力。
其中,最大的狗粮来自民政局!全国各地的民政局都爆满了!
想在这天领证的新人们把民政局围得水泄不通,有人甚至凌晨4点就前往排队。
一、“世纪520”送礼物 ,大家都在买什么?
除了领证的,对于情侣们来说,关于520要怎么度过,改送什么礼物给心爱的ta也是关注度非常高的话题。
首先,看到知乎上关于“520送什么的话题”,我们经过分析整理发现:
知乎数据
给女朋友送什么
关于给女朋友的礼物,广大网友都提到了口红、香水、项链、手表、还有玫瑰巧克力等礼物;
给男朋友送什么
送男朋友方面,剃须刀、键盘、鼠标、游戏机等也频频被提到。
淘宝数据
那么事实究竟是怎样的呢?接下来让我们看到淘宝天猫的数据,真正做到用数据来说话。
我们搜集整理了淘宝网关于520礼物的100页商品数据,使用Python进行整理分析,经过预处理之后,一共得到3854条数据。
520大家都在买什么礼物?
我们在淘宝搜索520礼物,对得到的数据进行分析整理,从中发现:
永生花、玫瑰花占了很大的比重,可以看到节日送花还是广大男性的统一选择;
除此之外可以发现,施华洛世奇、潘多拉等首饰也是不错的选择;
同时还有音乐盒、巧克力等礼物。
分析发现,彩妆品牌果然是妥妥的王者。
Mac名列第一,果然是小姐姐们人手一支的口红,没毛病。其次阿玛尼、ysl、Tomford、纪梵希全都榜上有名。有意思的是第二名的店铺是一家主营创意礼物的店kufire,当中从创意灯、按摩枕等礼物还不少。这也可能跟这家店搜索时页面比较靠前有关吧。
520哪些省份的人最喜欢买买买
那么520期间哪些省份的人最喜欢买买买呢?数据整理发现,广东人民拔得头筹,其次浙江、上海位列二三。
520商品价格都是多少钱
那么520期间商品的价格都是怎么分布的呢?从图中可以看到50元以下的并不多,50-200元内的商品最多。
什么价位的商品销量最好
看完了520商品的价格区间,再看看什么价位的商品销量最好。分析可以发现,200元以内的商品最受人青睐。其中0-50元销量占比达到19.21%,50-100占比20.13%。100-150和150-200的占比也不错,分别为15.88%到17.12%。
最后再看到520大家最喜欢买什么。我们分析整理了520商品的标题,得出词云发现,主要可以分为这几类;
送女生
永生花、玫瑰花是广大男同胞的首要选择;
彩妆、化妆品占了很大的比重,比如阿玛尼粉底液、纪梵希等等
首饰、项链也是很多人的选择;
送男生
打火机、手表、电动牙刷是许多人会选择购买的商品。
看来送什么礼物这方面跟知乎得出的结论类似,从中我们也发现到在520情人节,主要男生给女生买礼物占比较大,当然也不排除许多小姐姐们趁着520淘宝活动给自己买买买的。
二、Python教你分析,淘宝520商品数据
我们搜集整理了淘宝网关于520礼物的100页商品数据,使用Python进行整理分析。整个数据分析的过程分为以下三步:
数据获取
数据预处理
数据可视化
部分关键代码如下:
1. 数据获取
此部分代码之前文章已经放过,此处暂不做赘述,爬取出来的数据以数据框的形式存储,结果如下图所示。
df.head()
2. 数据预处理
此处我们对数据进行以下的处理以方便后续的数据分析和可视化工作:
删除重复值
purchase_num字段:删除购买人数为空的记录
purchase_num字段:提取数值型数据
计算销售额 = price*purchase_num
location字段:提取省份数据
goods_name字段:分词,提取关键词
经过预处理之后,数据一共有3854条,如下所示:
df.head()
3. 数据可视化
数据可视化部分我们主要对以下几个方面信息进行分析:
代码实现:
# 计算top10店铺
shop_top10 = df.groupby('shop_name')['purchase_num'].sum().sort_values(ascending=False).head(10)
# 绘制柱形图
bar1 = Bar(init_opts=opts.InitOpts(width='1350px', height='750px'))
bar1.add_xaxis(shop_top10.index.tolist())
bar1.add_yaxis('', shop_top10.values.tolist())
bar1.set_global_opts(title_opts=opts.TitleOpts(title='520礼物商品销量Top10店铺'),
xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=-15)),
visualmap_opts=opts.VisualMapOpts(max_=shop_top10.values.max()))
bar1.render()
520礼物商品销量省份排名Top10
代码实现:
代码实现:
520不同价格区间的商品数量
520礼物不同价格区间销量占比
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。
发表评论
暂时没有评论,来抢沙发吧~