通过Python抓取天猫评论数据-APISpace

通过Python抓取天猫评论数据

天气逐渐寒冷，觉得应该给自己添加几件保暖的衣服了，于是想到了天猫，搜寻了一番，觉得南极人的保暖内衣还是不错的。到低怎么选择这么多的衣服呢？我一般选择按销量排序，毕竟销量也能侧面反映商品的受欢迎度和口碑状况，所以我来到了这个页面= re.I）;

上菜：

# 导入所需的开发模块

import requests

import re

# 创建循环链接

urls = []

for i in list(range(1,100)):

urls.append('%i)

# 构建字段容器

nickname = []

ratedate = []

color = []

size = []

ratecontent = []

# 循环抓取数据

for url in urls:

content = requests.get(url).text

# 借助正则表达式使用findall进行匹配查询

nickname.extend(re.findall('"displayUserNick":"(.*?)"',content))

color.extend(re.findall(re.compile('颜色分类:(.*?);'),content))

size.extend(re.findall(re.compile('尺码:(.*?);'),content))

ratecontent.extend(re.findall(re.compile('"rateContent":"(.*?)","rateDate"'),content))

ratedate.extend(re.findall(re.compile('"rateDate":"(.*?)","reply"'),content))

print(nickname,color)

# 写入数据

file = open('南极人天猫评价.csv','w')

for i in list(range(0,len(nickname))):

file.write(','.join((nickname[i],ratedate[i],color[i],size[i],ratecontent[i]))+'\n')

file.close()

最终呈现的爬虫结果如下：

今天的爬虫部分就介绍到这里，本次的分享目的是如何解决网页信息的异步存储。在之后的分享中我将针对这次爬取的评论数据进行文本分析，涉及到切词、情感分析、词云等。

每天进步一点点2015

学习与分享，取长补短，关注小号！

长按识别二维码马上关注

c语言sscanf函数的用法是什么

293 2022-09-01

通过Python抓取天猫评论数据

c语言sscanf函数的用法是什么

c语言一维数组怎么快速排列

php怎么获取input输入的值

推荐文章

api接口有哪几种分类及功能

什么是API接口?API接口简单介绍

短信API接口概述，短信API接口的优势

7款快递物流的物流查询API工具，物流快递查询API接口怎么对接？

企业四要素: 了解企业经营成功的关键

什么是语音验证码?,语音验证码平台有哪些

全国工商查询系统怎么查企业名录

哪些平台提供实名认证的接口？

PHP如何调用API接口?

如何使用百度天气预报API接口?

最近发表

热评文章

数据接口api（数据接口API开发平台）

数据开放接口api（数据服务api开发）

Python爬虫教程：爬取酷狗音乐（python爬取

hbuilder怎么更改字体大小和颜色

直播平台api接口 - 构建卓越的直播平台

实时股票数据api接口（股票实时行情api接口）