闲鱼APP爬虫
off999 2024-12-06 18:13 18 浏览 0 评论
写在前面:实现闲鱼APP的特定关键字商品检索
实现思路:首先使用appium驱动app实现数据获取和订单生成,而后通过app抓包分析获取接口
1.appium实现
首先是搭建环境,此前进行工作时,搭建过环境,积累了一定经验,现总结如下
1.1前言知识
参考链接:http://www.testclass.net/appium/appium-base-summary/
appium 是一个自动化测试开源工具,支持 iOS 平台和 Android 平台上的原生应用,web应用和混合应用。
“移动原生应用”是指那些用iOS或者 Android SDK 写的应用(Application简称app)。
“移动web应用”是指使用移动浏览器访问的应用(appium支持iOS上的Safari和Android上的 Chrome)。
“混合应用”是指原生代码封装网页视图——原生代码和 web 内容交互。比如,像 Phonegap,可以帮助开发者使用网页技术开发应用,然后用原生代码封装,这些就是混合应用。
重要的是,appium是一个跨平台的工具:它允许测试人员在不同的平台(iOS,Android)使用同一套API来写自动化测试脚本,这样大大增加了iOS和Android测试套件间代码的复用性。
appium类库封装了标准Selenium客户端类库,为用户提供所有常见的JSON格式selenium命令以及额外的移动设备控制相关的命令,如多点触控手势和屏幕朝向。
appium客户端类库实现了Mobile JSON Wire Protocol(一个标准协议的官方扩展草稿)和W3C WebDriver spec(一个传输不可预知的自动化协议,该协议定义了MultiAction 接口)的元素。
appium服务端定义了官方协议的扩展,为appium 用户提供了方便的接口来执行各种设备动作,例如在测试过程中安装/卸载App。这就是为什么我们需要appium特定的客户端,而不是通用的Selenium 客户端。当然,appium 客户端类库只是增加了一些功能,而实际上这些功能就是简单的扩展了Selenium 客户端,所以他们仍然可以用来运行通用的Selenium会话。
1.2环境配置
1)安装Node.js,直接下载安装即可因为appium是基于node.js实现的,需要提前安装
下载链接如下:https://nodejs.org/zh-cn/
通过node -v 查看版本,确定是否安装成功
2)安装JDK,及配置环境变量
JDK为java开发环境,网上教程较多,可以参考如下链接:
https://blog.csdn.net/qq_38125058/article/details/82890856
3)安装SDK,及配置环境变量
SDK时andriod开发的工具包,是安卓开发必备的,在appium测试中需要使用其中的一些资源程序,并配置环境变量以便调用
参考文章:https://zhuanlan.zhihu.com/p/49193525
下载链接:https://www.androiddevtools.cn/
下载界面如下:
注意下载后打开SDK Mansger.exe并安装资源库,注意安装与android版本一致的API
而后配置ANDROID_HOME环境变量为android-sdk文件夹
并添加
%ANDROID_HOME%\tools
%ANDROID_HOME%\platform-tools
输入adb version测试
4)安装Appium桌面版本
下载链接:http://appium.io/
最新版appium没有appium-doctor程序进行检查,可以通过nodejs下载,进行检查是否配置成功
1.3开始测试
使用python进行测试,首选需要安装python的appium-python-client库
首先打开雷电模拟器,使用adb devices查看是否连接成功
成功后,启动appium,运行python程序
# 导入webdriver
from appium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
import time
# 初始化参数
desired_caps = {
'platformName': 'Android', # 被测手机是安卓
'platformVersion': '5.1.1', # 手机安卓版本
'deviceName': 'emulator-5554', # 设备名,安卓手机可以随意填写
'appPackage': 'com.taobao.idlefish', # 启动APP Package名称
'appActivity': 'com.taobao.fleamarket.home.activity.MainActivity', # 启动Activity名称
'noReset': True, # 不要重置App,如果为False的话,执行完脚本后,app的数据会清空,比如你原本登录了,执行完脚本后就退出登录了
}
# 连接Appium Server,初始化自动化环境
driver = webdriver.Remote('http://localhost:4723/wd/hub', desired_caps)
wait = WebDriverWait(driver, 30)
search_entry = wait.until(EC.presence_of_element_located((By.ID, 'com.taobao.idlefish:id/search_bar_layout')))
search_entry.click()
search_name = wait.until(EC.presence_of_element_located((By.CLASS_NAME, 'android.widget.EditText')))
search_name.set_text('redmik30')
search_button = wait.until(EC.presence_of_element_located((By.XPATH, "//*[@text='搜索']")))
search_button.click()
wait.until(EC.presence_of_element_located((By.CLASS_NAME, "android.widget.ScrollView")))
# time.sleep(10)
while True:
driver.swipe(500, 1900, 500, 300, 300)
items = wait.until(EC.presence_of_all_elements_located((By.XPATH, "//*[@class='android.widget.ScrollView']/android.view.View")))
for item in items:
print(item)
由于前期没有android基础,对于desired_caps参数不了解,走了很多弯路
appPackage和appActivity通过adb命令可查看
通过命令:adb shell dumpsys window w |findstr \/ |findstr name=查看相关属性
2.APP抓包分析
2.1使用代理抓包
通过fildder代理抓包,开始fildder后,在雷电模拟器设置系统代理
经测试浏览器流量成功被代理、但app流量代理失效
经过查阅资料治app自动忽略系统代理,通过下载全局代理软件proxyDroid实现全局代理,进而绕过
下载链接如下:https://download.csdn.net/download/weixin_43906500/16634072
成功获取数据包
2.2分析接口
查看请求,发现闲鱼搜索请求参数存在加密,难以分析,如果要进行后续分析需要学习安卓逆向知识,进行源码分析
————————————————
版权声明:本文为CSDN博主「金鳞本鲤」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_43906500/article/details/115623201
相关推荐
- 让 Python 代码飙升330倍:从入门到精通的四种性能优化实践
-
花下猫语:性能优化是每个程序员的必修课,但你是否想过,除了更换算法,还有哪些“大招”?这篇文章堪称典范,它将一个普通的函数,通过四套组合拳,硬生生把性能提升了330倍!作者不仅展示了“术”,更传授...
- 7 段不到 50 行的 Python 脚本,解决 7 个真实麻烦:代码、场景与可复制
-
“本文整理自开发者AbdurRahman在Stackademic的真实记录,所有代码均经过最小化删减,确保在50行内即可运行。每段脚本都对应一个日常场景,拿来即用,无需额外依赖。一、在朋...
- Python3.14:终于摆脱了GIL的限制
-
前言Python中最遭人诟病的设计之一就是GIL。GIL(全局解释器锁)是CPython的一个互斥锁,确保任何时刻只有一个线程可以执行Python字节码,这样可以避免多个线程同时操作内部数据结...
- Python Web开发实战:3小时从零搭建个人博客
-
一、为什么选Python做Web开发?Python在Web领域的优势很突出:o开发快:Django、Flask这些框架把常用功能都封装好了,不用重复写代码,能快速把想法变成能用的产品o需求多:行业...
- 图解Python编程:从入门到精通系列教程(附全套速查表)
-
引言本系列教程展开讲解Python编程语言,Python是一门开源免费、通用型的脚本编程语言,它上手简单,功能强大,它也是互联网最热门的编程语言之一。Python生态丰富,库(模块)极其丰富,这使...
- Python 并发编程实战:从基础到实战应用
-
并发编程是提升Python程序效率的关键技能,尤其在处理多任务场景时作用显著。本文将系统介绍Python中主流的并发实现方式,帮助你根据场景选择最优方案。一、多线程编程(threading)核...
- 吴恩达亲自授课,适合初学者的Python编程课程上线
-
吴恩达教授开新课了,还是亲自授课!今天,人工智能著名学者、斯坦福大学教授吴恩达在社交平台X上发帖介绍了一门新课程——AIPythonforBeginners,旨在从头开始讲授Python...
- Python GUI 编程:tkinter 初学者入门指南——Ttk 小部件
-
在本文中,将介绍Tkinter.ttk主题小部件,是常规Tkinter小部件的升级版本。Tkinter有两种小部件:经典小部件、主题小部件。Tkinter于1991年推出了经典小部件,...
- Python turtle模块编程实践教程
-
一、模块概述与核心概念1.1turtle模块简介定义:turtle是Python标准库中的2D绘图模块,基于Logo语言的海龟绘图理念实现。核心原理:坐标系系统:原点(0,0)位于画布中心X轴:向右...
- Python 中的asyncio 编程入门示例-1
-
Python的asyncio库是用于编写并发代码的,它使用async/await语法。它为编写异步程序提供了基础,通过非阻塞调用高效处理I/O密集型操作,适用于涉及网络连接、文件I/O...
- 30天学会Python,开启编程新世界
-
在当今这个数字化无处不在的时代,Python凭借其精炼的语法架构、卓越的性能以及多元化的应用领域,稳坐编程语言排行榜的前列。无论是投身于数据分析、人工智能的探索,还是Web开发的构建,亦或是自动化办公...
- Python基础知识(IO编程)
-
1.文件读写读写文件是Python语言最常见的IO操作。通过数据盘读写文件的功能都是由操作系统提供的,读写文件就是请求操作系统打开一个文件对象(通常称为文件描述符),然后,通过操作系统提供的接口从这个...
- Python零基础到精通,这8个入门技巧让你少走弯路,7天速通编程!
-
Python学习就像玩积木,从最基础的块开始,一步步搭建出复杂的作品。我记得刚开始学Python时也是一头雾水,走了不少弯路。现在回头看,其实掌握几个核心概念,就能快速入门这门编程语言。来聊聊怎么用最...
- 一文带你了解Python Socket 编程
-
大家好,我是皮皮。前言Socket又称为套接字,它是所有网络通信的基础。网络通信其实就是进程间的通信,Socket主要是使用IP地址,协议,端口号来标识一个进程。端口号的范围为0~65535(用户端口...
- Python-面向对象编程入门
-
面向对象编程是一种非常流行的编程范式(programmingparadigm),所谓编程范式就是程序设计的方法论,简单的说就是程序员对程序的认知和理解以及他们编写代码的方式。类和对象面向对象编程:把...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)