python pandas 实战百度音乐歌单数据分析-APISpace

python pandas 实战百度音乐歌单数据分析

是《Python 网络爬虫实战与机器学习应用》12章的例子，地址在 = df3.sort_values('playCount', ascending=False).drop_duplicates('name')plt.figure(figsize=(14, 6))plt.title('baidu chart')plt.xlabel('rank')plt.ylabel('play count')plt.plot(range(len(chart1['playCount'])), chart1['playCount'])plt.show()

使用sort_values进行排序

可以看到少数播放量巨大，但是大部分的播放量太低。

下面是用sql语句来，还是字符串，所以这里转一下

SELECT * FROM `gedan` ORDER by CAST(playCount AS SIGNED) DESC

收藏次数和分享次数是类似的就不贴了。

2. 歌单里哪个歌手的歌曲数量最多

先看sql的版本：

SELECT COUNT(song_name),song_author FROM gedan_detail GROUP by song_author ORDER by COUNT(song_name) DESC

陈奕迅最多，接下来是周杰伦啥的。。。

pandas版本：

df3.groupby('song_author')['song_name'].count().reset_index().sort_values('song_name',ascending=False)

chart3=df3.groupby('song_author')['song_name'].count().reset_index().sort_values('song_name',ascending=False).head(10)x = range(len(chart3))plt.figure(figsize = (14, 8))plt.title(u'top 10')plt.bar(x, chart3['song_name'], color='dodgerblue') plt.xticks(x, chart3['song_author'])plt.show()

3. 根据名字group

df3.groupby('song_name')['name'].count().reset_index().sort_values('name',ascending=False)

<当爱已成为往事> 出现在129个歌单中，接下来是海阔天空，因为爱情。。。

4. 播放次数和收藏次数之间的关系

df3['playCount'].corr(df3['favCount'])

0.6828233850419526

plt.figure(figsize=(14, 8))plt.title('chart')plt.xlabel('playCount')plt.ylabel('favCount')plt.scatter(df3['playCount'], df3['favCount'], alpha=0.8)plt.show()

参考文章：

http://codeblogbt.com/archives/146399

c语言sscanf函数的用法是什么

267 2022-12-01

python pandas 实战百度音乐歌单数据分析

c语言sscanf函数的用法是什么

c语言一维数组怎么快速排列

php怎么获取input输入的值

推荐文章

api接口有哪几种分类及功能

什么是API接口?API接口简单介绍

短信API接口概述，短信API接口的优势

7款快递物流的物流查询API工具，物流快递查询API接口怎么对接？

企业四要素: 了解企业经营成功的关键

什么是语音验证码?,语音验证码平台有哪些

全国工商查询系统怎么查企业名录

哪些平台提供实名认证的接口？

PHP如何调用API接口?

如何使用百度天气预报API接口?

最近发表

热评文章

数据接口api（数据接口API开发平台）

数据开放接口api（数据服务api开发）

Python爬虫教程：爬取酷狗音乐（python爬取

hbuilder怎么更改字体大小和颜色

直播平台api接口 - 构建卓越的直播平台

实时股票数据api接口（股票实时行情api接口）

python pandas 实战 百度音乐歌单 数据分析

推荐文章

最近发表

热评文章

python pandas 实战百度音乐歌单数据分析