企业不会做全网营销?(全网营销推广好做吗)
381
2022-08-06
抖音美女千千万,想用Python爬爬看(爬虫爬取抖音视频)
目 标 场 景
相信大家平时刷抖音短视频的时候,看到颜值高的小姐姐,都有随手点赞关注的习惯。
如果一条条去刷确实很耗时间,如果 Python 能帮忙筛选出颜值高的小姐姐那就省了很多事。
本篇文章是借助「百度人脸识别」API,帮我们识别出抖音上颜值高的小姐姐,然后下载到手机相册中。
准 备 工 作
首先,项目需要对页面元素进行一些精准的操作,需要提前准备一部 Android 设备,激活开发者选项,并在开发者选项中打开 「USB 调试和指针位置」两处设置。
为了确保 adb 命令能正常使用,需要提前配置好 adb 开发环境。
页面元素中的部分元素没法利用 name 等常用属性获取到,可能需要获取到完整的「UI 树」,再利用 Airtest 判断是否存在某个 UI 元素。
# 安装依赖
pip3 install pocoui
另外,项目中会对视频进行人脸识别,获取到出现的所有人脸,再进行性别识别及颜值判断。
然后利用官网提供的 API 文档即可获取到「access token」,由于 ak 的有效期为一个月,所以只需要初始化一次,后面就可以利用人脸识别接口进行正常的识别了。
编 写 脚 本
在上面已经配置好了 adb 环境的情况下,可以直接借助 python 中的 os 模块执行 adb 命令打开抖音 App。
现在可以使用百度提供的 API 获取到上面截图的人脸列表。
从上述的人脸列表中筛选出性别为女,年龄为 18-30 岁之间,颜值超过 70 的小姐姐。
由于视频是连续播放的,很难通过截取视频某一帧,判断视频有出现颜值高的小姐姐。
另外,大部分短视频播放时长为「10s+」,这里需要对每一个视频多次截图去做人脸识别,直到识别到颜值高的小姐姐。
一旦当前播放的视频识别出有颜值高的小姐姐,就需要模拟保存视频到本地的操作。
获取「分享」和「保存本地」两个按钮的坐标位置,依次利用 adb 执行点击操作即可下载视频到本地。
另外,由于下载视频的过程是一个耗时操作,在下载进度对话框还未消失之前,需要做一个「模拟等待」的操作。
在视频保存到本地之后,就可以模拟向上滑动的操作,跳到播放「下一条视频」。 循环上面的操作,即可筛选出所有颜值高的小姐姐,并保存到本地。
在脚本一条条刷视频的过程中,可能会遇到一下广告,我们需要对这类视频进行过滤。
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。
发表评论
暂时没有评论,来抢沙发吧~