只会用Selenium爬网页?Appium爬App了解一下

16,482 阅读10分钟

Appium是一个跨平台移动端自动化测试工具,可以非常便捷地为iOS和Android平台创建自动化测试用例。它可以模拟App内部的各种操作,如点击、滑动、文本输入等,只要我们手工操作的动作Appium都可以完成。在前面我们了解过Selenium,它是一个网页端的自动化测试工具。Appium实际上继承了Selenium,Appium也是利用WebDriver来实现App的自动化测试。对iOS设备来说,Appium使用UIAutomation来实现驱动。对于Android来说,它使用UiAutomator和Selendroid来实现驱动。

Appium相当于一个服务器,我们可以向Appium发送一些操作指令,Appium就会根据不同的指令对移动设备进行驱动,完成不同的动作。

对于爬虫来说,我们用Selenium来抓取JavaScript渲染的页面,可见即可爬。Appium同样也可以,用Appium来做App爬虫不失为一个好的选择。

下面我们来了解Appium的基本使用方法。

一、本节目标

我们以Android平台的微信为例来演示Appium启动和操作App的方法,主要目的是了解利用Appium进行自动化测试的流程以及相关API的用法。

二、准备工作

请确保PC已经安装好Appium、Android开发环境和Python版本的Appium API。另外,Android手机安装好微信App。

三、启动App

Appium启动App的方式有两种:一种是用Appium内置的驱动器来打开App,另一种是利用Python程序实现此操作。下面我们分别进行说明。

首先打开Appium,启动界面如下图所示。

直接点击Start Server按钮即可启动Appium的服务,相当于开启了一个Appium服务器。我们可以通过Appium内置的驱动或Python代码向Appium的服务器发送一系列操作指令,Appium就会根据不同的指令对移动设备进行驱动,完成不同的动作。启动后运行界面如下图所示。

Appium运行之后正在监听4723端口。我们可以向此端口对应的服务接口发送操作指令,此页面就会显示这个过程的操作日志。

将Android手机通过数据线和运行Appium的PC相连,同时打开USB调试功能,确保PC可以连接到手机。

可以输入adb命令来测试连接情况,如下所示:

adb devices -l

如果出现类似如下结果,这就说明PC已经正确连接手机。

List of devices attached
2da42ac0 device usb:336592896X product:leo model:MI_NOTE_Pro device:leo

model是设备的名称,就是后文需要用到的deviceName变量。我使用的是小米Note顶配版,所以此处名称为MI_NOTE_Pro。

如果提示找不到adb命令,请检查Android开发环境和环境变量是否配置成功。如果可以成功调用adb命令但不显示设备信息,请检查手机和PC的连接情况。

接下来用Appium内置的驱动器打开App,点击Appium中的Start New Session按钮,如下图所示。

这时会出现一个配置页面,如下图所示。

需要配置启动App时的Desired Capabilities参数,它们分别是platformNamedeviceNameappPackageappActivity

  • platformName:它是平台名称,需要区分Android或iOS,此处填写Android。

  • deviceName:它是设备名称,此处是手机的具体类型。

  • appPackage:它是App程序包名。

  • appActivity:它是入口Activity名,这里通常需要以 . 开头。

在当前配置页面的左下角也有配置参数的相关说明,链接是https://github.com/appium/appium/blob/master/docs/en/writing-running-appium/caps.md。

我们在Appium中加入上面4个配置,如下图所示。

点击保存按钮,保存下来,我们以后可以继续使用这个配置。

点击右下角的Start Session按钮,即可启动Android手机上的微信App并进入到启动页面。同时PC上会弹出一个调试窗口,从这个窗口我们可以预览当前手机页面,并可以查看页面的源码,如下图所示。

点击左栏中屏幕的某个元素,如选中登录按钮,它就会高亮显示。这时中间栏就显示了当前选中的按钮对应的源代码,右栏则显示了该元素的基本信息,如元素的id、class、text等,以及可以执行的操作,如Tap、Send Keys、Clear,如下图所示。

点击中间栏最上方的第三个录制按钮,Appium会开始录制操作动作,这时我们在窗口中操作App的行为都会被记录下来,Recorder处可以自动生成对应语言的代码。例如,我们点击录制按钮,然后选中App中的登录按钮,点击Tap操作,即模拟了按钮点击功能,这时手机和窗口的App都会跳转到登录页面,同时中间栏会显示此动作对应的代码,如下图所示。

接下来选中左侧的手机号文本框,点击Send Keys,对话框就会弹出。输入手机号,点击Send Keys,即可完成文本的输入,如下图所示。

我们可以在此页面点击不同的动作按钮,即可实现对App的控制,同时Recorder部分也可以生成对应的Python代码。

下面我们看看使用Python代码驱动App的方法。首先需要在代码中指定一个Appium Server,而这个Server在刚才打开Appium的时候就已经开启了,是在4723端口上运行的,配置如下所示:

server = 'http://localhost:4723/wd/hub'

用字典来配置Desired Capabilities参数,代码如下所示:

desired_caps = {
    'platformName': 'Android',
    'deviceName': 'MI_NOTE_Pro',
    'appPackage': 'com.tencent.mm',
    'appActivity': '.ui.LauncherUI'
}

新建一个Session,这类似点击Appium内置驱动的Start Session按钮相同的功能,代码实现如下所示:

from appium import webdriver
from selenium.webdriver.support.ui import WebDriverWait

driver = webdriver.Remote(server, desired_caps)

配置完成后运行,就可以启动微信App了。但是现在仅仅是可以启动App,还没有做任何动作。

再用代码来模拟刚才演示的两个动作:一个是点击“登录”按钮,一个是输入手机号。

看看刚才Appium内置驱动器内的Recorder录制生成的Python代码,自动生成的代码非常累赘,例如点击“登录”按钮的代码如下所示:

el1 = driver.find_element_by_xpath("/hierarchy/android.widget.FrameLayout/android.widget.LinearLayout/android.widget.FrameLayout/android.view.View/android.widget.FrameLayout/android.widget.LinearLayout/android.widget.FrameLayout/android.widget.RelativeLayout/android.widget.RelativeLayout/android.widget.Button[1]")
el1.click()

这段代码的XPath选择器路径太长,选择方式没有那么科学,获取元素时也没有设置等待,很可能会有超时异常。所以我们修改一下,将其修改为通过ID查找元素,设置延时等待,两次操作的代码改写如下所示:

wait = WebDriverWait(driver, 30)
login = wait.until(EC.presence_of_element_located((By.ID, 'com.tencent.mm:id/cjk')))
login.click()
phone = wait.until(EC.presence_of_element_located((By.ID, 'com.tencent.mm:id/h2')))
phone.set_text('18888888888')

综上所述,完整的代码如下所示:

from appium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

server = 'http://localhost:4723/wd/hub'
desired_caps = {
    'platformName': 'Android',
    'deviceName': 'MI_NOTE_Pro',
    'appPackage': 'com.tencent.mm',
    'appActivity': '.ui.LauncherUI'
}
driver = webdriver.Remote(server, desired_caps)
wait = WebDriverWait(driver, 30)
login = wait.until(EC.presence_of_element_located((By.ID, 'com.tencent.mm:id/cjk')))
login.click()
phone = wait.until(EC.presence_of_element_located((By.ID, 'com.tencent.mm:id/h2')))
phone.set_text('18888888888')

一定要重新连接手机,再运行此代码,这时即可观察到手机上首先弹出了微信欢迎页面,然后模拟点击登录按钮、输入手机号,操作完成。这样我们就成功使用Python代码实现了App的操作。

四、API

接下来看看使用代码如何操作App、总结相关API的用法。这里使用的Python库为AppiumPythonClient,其GitHub地址为https://github.com/appium/python-client,此库继承自Selenium,使用方法与Selenium有很多共同之处。

1. 初始化

需要配置Desired Capabilities参数,完整的配置说明可以参考https://github.com/appium/appium/blob/master/docs/en/writing-running-appium/caps.md。一般来说,配置几个基本参数即可,如下所示:

from appium import webdriver

server = 'http://localhost:4723/wd/hub'
desired_caps = {
    'platformName': 'Android',
    'deviceName': 'MI_NOTE_Pro',
    'appPackage': 'com.tencent.mm',
    'appActivity': '.ui.LauncherUI'
}
driver = webdriver.Remote(server, desired_caps)

这里配置了启动微信App的Desired Capabilities,这样Appnium就会自动查找手机上的包名和入口类,然后将其启动。包名和入口类的名称可以在安装包中的AndroidManifest.xml文件获取。

如果要打开的App没有事先在手机上安装,我们可以直接指定App参数为安装包所在路径,这样程序启动时就会自动向手机安装并启动App,如下所示:

from appium import webdriver

server = 'http://localhost:4723/wd/hub'
desired_caps = {
    'platformName': 'Android',
    'deviceName': 'MI_NOTE_Pro',
    'app': './weixin.apk'
}
driver = webdriver.Remote(server, desired_caps)

程序启动的时候就会寻找PC当前路径下的APK安装包,然后将其安装到手机中并启动。

2. 查找元素

我们可以使用Selenium中通用的查找方法来实现元素的查找,如下所示:

el = driver.find_element_by_id('com.tencent.mm:id/cjk')

在Selenium中,其他查找元素的方法同样适用,在此不再赘述。

在Android平台上,我们还可以使用UIAutomator来进行元素选择,如下所示:

el = self.driver.find_element_by_android_uiautomator('new UiSelector().description("Animation")')
els = self.driver.find_elements_by_android_uiautomator('new UiSelector().clickable(true)')

在iOS平台上,我们可以使用UIAutomation来进行元素选择,如下所示:

el = self.driver.find_element_by_ios_uiautomation('.elements()[0]')
els = self.driver.find_elements_by_ios_uiautomation('.elements()')

还可以使用iOS Predicates来进行元素选择,如下所示:

el = self.driver.find_element_by_ios_predicate('wdName == "Buttons"')
els = self.driver.find_elements_by_ios_predicate('wdValue == "SearchBar" AND isWDDivisible == 1')

也可以使用iOS Class Chain来进行选择,如下所示:

el = self.driver.find_element_by_ios_class_chain('XCUIElementTypeWindow/XCUIElementTypeButton[3]')
els = self.driver.find_elements_by_ios_class_chain('XCUIElementTypeWindow/XCUIElementTypeButton')

但是此种方法只适用于XCUITest驱动,具体可以参考:https://github.com/appium/appium-xcuitest-driver。

3. 点击

点击可以使用tap()方法,该方法可以模拟手指点击(最多五个手指),可设置按时长短(毫秒),代码如下所示:

tap(self, positions, duration=None)

其中后两个参数如下。

  • positions:它是点击的位置组成的列表。

  • duration:它是点击持续时间。

实例如下所示:

driver.tap([(100, 20), (100, 60), (100, 100)], 500)

这样就可以模拟点击屏幕的某几个点。

对于某个元素如按钮来说,我们可以直接调用cilck()方法实现模拟点击,实例如下所示:

button = find_element_by_id('com.tencent.mm:id/btn')
button.click()

4. 屏幕拖动

可以使用scroll()方法模拟屏幕滚动,用法如下所示:

scroll(self, origin_el, destination_el)

可以实现从元素origin_el滚动至元素destination_el

它的后两个参数如下。

  • original_el:它是被操作的元素。

  • destination_el:它是目标元素。

实例如下所示:

driver.scroll(el1,el2)

可以使用swipe()模拟从A点滑动到B点,用法如下所示:

swipe(self, start_x, start_y, end_x, end_y, duration=None)

后面几个参数说明如下。

  • start_x:它是开始位置的横坐标。

  • start_y:它是开始位置的纵坐标。

  • end_x:它是终止位置的横坐标。

  • end_y:它是终止位置的纵坐标。

  • duration:它是持续时间,单位是毫秒。

实例如下所示:

driver.swipe(100, 100, 100, 400, 5000)

这样可以实现在5s时间内,由(100, 100)滑动到 (100, 400)。

可以使用flick()方法模拟从A点快速滑动到B点,用法如下所示:

flick(self, start_x, start_y, end_x, end_y)

几个参数说明如下。

  • start_x:它是开始位置的横坐标。

  • start_y:它是开始位置的纵坐标。

  • end_x:它是终止位置的横坐标。

  • end_y:它是终止位置的纵坐标。

实例如下所示:

driver.flick(100, 100, 100, 400)

5. 拖曳

可以使用drag_and_drop()将某个元素拖动到另一个目标元素上,用法如下所示:

drag_and_drop(self, origin_el, destination_el)

可以实现将元素origin_el拖曳至元素destination_el

两个参数说明如下。

  • original_el:它是被拖曳的元素。

  • destination_el:它是目标元素。

实例如下所示:

driver.drag_and_drop(el1, el2)

6. 文本输入

可以使用set_text()方法实现文本输入,如下所示:

el = find_element_by_id('com.tencent.mm:id/cjk')
el.set_text('Hello')

7. 动作链

与Selenium中的ActionChains类似,Appium中的TouchAction可支持的方法有tap()press()long_press()release()move_to()wait()cancel()等,实例如下所示:

el = self.driver.find_element_by_accessibility_id('Animation')
action = TouchAction(self.driver)
action.tap(el).perform()

首先选中一个元素,然后利用TouchAction实现点击操作。

如果想要实现拖动操作,可以用如下方式:

els = self.driver.find_elements_by_class_name('listView')
a1 = TouchAction()
a1.press(els[0]).move_to(x=10, y=0).move_to(x=10, y=-75).move_to(x=10, y=-600).release()
a2 = TouchAction()
a2.press(els[1]).move_to(x=10, y=10).move_to(x=10, y=-300).move_to(x=10, y=-600).release()

利用以上API,我们就可以完成绝大部分操作。更多的API操作可以参考:https://testerhome.com/topics/3711。

五、结语

本节中,我们主要了解了Appium的操作App的基本用法,以及常用API的用法。



本资源首发于崔庆才的个人博客静觅: Python3网络爬虫开发实战教程 | 静觅

如想了解更多爬虫资讯,请关注我的个人微信公众号:进击的Coder

weixin.qq.com/r/5zsjOyvEZ… (二维码自动识别)