python pandas 实战 对时区进行计数,用pyplot绘制前10

网友投稿 271 2022-09-02

python pandas 实战 对时区进行计数,用pyplot绘制前10

import pandasimport matplotlib.pyplot as pltimport numpy as npimport jsonfrom pandas import DataFrame, Seriespath = 'ch02/usagov_bitly_data2012-03-16-1331923249.txt'#从文件中读取records = [json.loads(line) for line in open(path)]frame = DataFrame(records)#对空替换Missingclean_tz = frame['tz'].fillna('Missing')#对''用Unknow来替代clean_tz[clean_tz == ''] = 'Unknown'#也可以这样写# clean_tz = clean_tz.apply(lambda x: x if x != '' else 'Unknown')# value_counts 来返回得到每个计数从大到小排序tz_counts = clean_tz.value_counts()print(tz_counts[:10])#绘制前10, kind 为barh,tz_counts[:10].plot(kind = 'barh', rot = 0)plt.show()

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:scrapy CrawlSpider 爬全站数据
下一篇:python pandas 实战 显示时区按照windows和非windows进行分解
相关文章

 发表评论

暂时没有评论,来抢沙发吧~