selenium获取元素信息常用方法_selenium获取元素文本-程序员宅基地

技术标签： Python+Selenium自动化测试自学笔记 python selenium 测试工具

selenium获取元素信息常用方法

如何使用 Selenium 获取网页元素的信息

Selenium 是一个用于 Web 应用程序测试的工具，可以使用它来模拟用户在浏览器中的操作，并进行自动化测试。其中最常见的任务之一就是获取网页元素的信息，我们可以使用 Selenium 提供的方法来获取元素的文本内容、大小、属性值等信息，进而对页面进行分析和处理。

方法名	方法解析
size()	返回元素的大小，即高度和宽度，返回值类型为字典。
text()	获取元素的文本内容。
get_attribute(attr_name)	获取元素的指定属性值，如获取超链接的 href 属性，可以通过 get_attribute(‘href’) 实现。
is_displayed()	判断元素是否可见，返回 True 或 False。
is_enabled()	判断元素是否可用，即是否被禁用，返回 True 或 False。
is_selected()	判断元素是否被选中，如单选框或复选框，返回 True 或 False。
current_url	返回当前页面的 URL。
title	返回当前页面的标题（即 < title > 标签中的内容）。

️实例讲解️

案例一

# 导入必要的库
from selenium import webdriver
from selenium.webdriver.common.by import By

# 创建一个新的 Chrome 浏览器实例
d = webdriver.Chrome()

# 打开京东首页
d.get('https://www.jd.com')

# 通过 CSS 选择器查找元素，并使用 size 方法获取了元素的大小（即高度和宽度）
jd_supermarket = d.find_element(By.CSS_SELECTOR, '[aria-lable="京东超市"]')
print(jd_supermarket.size)

# 通过 XPath 查找元素，并使用 text 方法获取了超链接的文本内容
jd_seckill = d.find_element(By.XPATH, '//div/a[4]')
print(jd_seckill.text)

# 通过 XPath 查找元素，并使用 get_attribute 方法获取了超链接的 href 属性值
jd_vipshop = d.find_element(By.XPATH, '//div/div/div[4]/ul/li/a')
print(jd_vipshop.get_attribute('href'))

# 关闭浏览器
d.quit()

案例二

判断元素是否可点击

判断元素在页面上是否可以点击，WebElement对象调用 is_enabled() 方法。

is_enabled()方法返回一个布尔值，若可点击返回： True 。若不可点击则返回： False 。

# 导入需要的模块
from selenium import webdriver  # 导入webdriver模块
import time  # 导入time模块
from selenium.webdriver.common.by import By  # 导入By模块

# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()

# 打开百度首页
driver.get('https://www.baidu.com/')

# 定位百度首页的地图按钮
elm = driver.find_element(By.XPATH, '//*[@id="s-top-left"]/a[3]')

# 判断元素是否可点击
answer = elm.is_enabled()

# 打印结果
print(answer)  # 执行结果：True，故可以点击。

# 等待3秒
time.sleep(3)

# 关闭浏览器
driver.quit()

案例三

判断元素是否可见

判断元素在页面上是否可见，WebElement对象调用 is_displayed() 方法。

# 导入selenium模块中的webdriver和By模块
from selenium import webdriver
from selenium.webdriver.common.by import By

# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()

# 最大化浏览器窗口
driver.maximize_window()

# 打开百度首页
driver.get('https://www.baidu.com/')

# 定位到百度地图按钮
elm = driver.find_element(By.XPATH,'//*[@id="s-top-left"]/a[3]')

# 判断百度地图按钮是否可见
answer = elm.is_displayed()
print(answer)

# 关闭浏览器
driver.quit()

案例四

判断元素是否可被选中

判断元素在页面上是否被选中，WebElement对象调用 is_selected() 方法。

is_selected() 方法返回一个布尔值，若被选中则返回：True 。若没被选中则返回：False 。

# 导入selenium模块中的webdriver和By模块
from selenium import webdriver
from selenium.webdriver.common.by import By

# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()

# 最大化浏览器窗口
driver.maximize_window()

# 打开百度首页
driver.get('https://www.baidu.com/')

# 定位到百度地图按钮
elm = driver.find_element(By.XPATH,'//*[@id="s-top-left"]/a[3]')

# 判断百度地图按钮是否被选中
answer = elm.is_selected()
print(answer)

# 关闭浏览器
driver.quit()

执行结果：False，说明未被选中。

问题：有一个选项框，本身就是选中状态，如果再点击一下，它就反而变成了未被选中的状态，期望结果是该选项框处于选中状态；当该选项框为未选中状态时，判断去点击选中该选项框；当该选项框处于选中状态时，不做任何操作。

解决思路： is_selected() 检查是否选中该元素，一般针对单选框，复选框，返回的结果是bool 值，元素处于未选中状态的时候返回 False，元素处于选中状态时返回 True。

# 导入selenium模块中的webdriver和By模块
from selenium import webdriver
from selenium.webdriver.common.by import By

# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()

# 最大化浏览器窗口
driver.maximize_window()

# 打开百度高级搜索页面
driver.get("https://www.baidu.com/gaoji/preferences.html")

# 定位到“仅简体中文”这个选项
element = driver.find_element(By.XPATH,"//*[text()='仅简体中文']")

# 判断“仅简体中文”这个选项是否被选中
if element.is_selected():
    print("元素已经被选中")
else:
    print("元素没有被选中")

# 关闭浏览器
driver.quit()

获取url地址

在 Web 应用自动化测试中，获取当前页面的 URL 地址是一个非常基础的操作。Selenium 提供了多个获取方法来获取当前页面的 URL，下面将分别介绍这些方法的使用。

使用 current_url 属性

使用 current_url 属性可返回当前页面的 URL。

# 导入selenium库中的webdriver模块
from selenium import webdriver

# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()

# 访问百度首页
driver.get('https://www.baidu.com')

# 获取当前页面的URL并打印出来
current_url = driver.current_url
print(current_url)

# 关闭浏览器
driver.quit()

使用 `execute_script()` 方法

使用 execute_script() 方法可获取当前页面的URL。

# 导入selenium库中的webdriver模块
from selenium import webdriver

# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()

# 访问百度首页
driver.get('https://www.baidu.com')

# 使用JavaScript语言获取当前页面的URL并打印出来
current_url = driver.execute_script("return window.location.href")
print(current_url)

# 关闭浏览器
driver.quit()

使用 `window_handles` 属性和 `switch_to.window()` 方法

如果浏览器中只有一个标签页，可以直接通过 current_url 属性获取当前URL。

如果打开了多个标签页，此时获取的是当前活动标签页的URL。如果需要获取其他标签页的URL，则可以使用 window_handles 属性获取所有的标签句柄，然后通过 switch_to.window() 方法切换到对应的标签页，再获取URL。

# 导入selenium库中的webdriver模块
from selenium import webdriver

# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()

# 访问百度首页
driver.get('https://www.baidu.com')

# 在新的标签页中打开Google首页
driver.execute_script('''window.open("https://www.google.com")''')

# 获取当前标签页的URL并打印出来
current_url = driver.current_url
print(current_url)

# 获取所有标签页的句柄
handles = driver.window_handles

# 切换到新标签页
driver.switch_to.window(handles[1])

# 获取当前标签页的URL并打印出来
current_url = driver.current_url
print(current_url)

# 关闭浏览器
driver.quit()

使用 `page_source` 属性

使用 page_source 属性可获取当前页面的源代码，然后通过正则表达式或其他方法解析出URL。

# 导入selenium库中的webdriver模块
from selenium import webdriver

# 导入re库中的正则表达式模块
import re

# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()

# 最大化浏览器窗口
driver.maximize_window()

# 访问百度首页
driver.get('https://www.baidu.com')

# 获取页面源代码
page_source = driver.page_source

# 通过正则表达式解析出URL
url_pattern = re.compile(r'https?://(?:[-\w.]|(?:%[\da-fA-F]{2}))+')
urls = url_pattern.findall(page_source)

# 遍历所有的URL地址，并打印出来
for url in urls:
    print(url)

# 关闭浏览器
driver.quit()

获取网页title

在 Web 应用自动化测试中，获取网页 Title 是一个基础的操作，Selenium 提供了多个获取方法来获取网页 Title，下面将分别介绍这些方法的使用。

使用 title 属性

使用 title 属性可直接获取当前页面的 Title。

# 导入selenium库中的webdriver模块
from selenium import webdriver

# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()

# 访问百度首页
driver.get('https://www.baidu.com')

# 获取当前页面的标题并打印出来
title = driver.title
print(title)

# 关闭浏览器
driver.quit()

使用 execute_script() 方法

使用 execute_script() 方法也可以获取当前页面的 Title。

# 导入selenium库中的webdriver模块
from selenium import webdriver

# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()

# 访问百度首页
driver.get('https://www.baidu.com')

# 使用execute_script方法执行JavaScript代码，并返回当前页面的标题
title = driver.execute_script("return document.title")
print(title)

# 关闭浏览器
driver.quit()

使用 find_element(By.TAG_NAME,tag_name)方法

使用 find_element(By.TAG_NAME,tag_name) 方法可实现寻找 head 标签，然后进一步找到 title 标签，从而获取当前页面的 Title

# 导入selenium库中的webdriver模块和By类
from selenium import webdriver
from selenium.webdriver.common.by import By

# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()

# 访问百度首页
driver.get('https://www.baidu.com')

# 使用find_element方法定位页面元素，并获取元素的textContent属性值
title = driver.find_element(By.TAG_NAME, "title").get_attribute("textContent")
print(title)

# 关闭浏览器
driver.quit()

使用 page_source 属性

使用 page_source 属性可获取当前页面的源代码，然后通过正则表达式或其他方法解析出 Title。

# 导入re模块和selenium库中的webdriver模块
import re
from selenium import webdriver

# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()

# 访问百度首页
driver.get('https://www.baidu.com')

# 获取页面源代码
page_source = driver.page_source

# 使用正则表达式解析出页面标题
title_pattern = re.compile(r'<title>(.*?)</title>') # 创建一个正则表达式对象，用于匹配页面标题
title = title_pattern.findall(page_source)[0] # 通过findall方法获取页面标题
print(title)

# 关闭浏览器
driver.quit()

本文链接：https://blog.csdn.net/m0_67268191/article/details/131094009

原作者删帖不实内容删帖广告或垃圾文章投诉

智能推荐

while循环&CPU占用率高问题深入分析与解决方案_main函数使用while(1)循环cpu占用99-程序员宅基地

文章浏览阅读3.8k次，点赞9次，收藏28次。直接上一个工作中碰到的问题，另外一个系统开启多线程调用我这边的接口，然后我这边会开启多线程批量查询第三方接口并且返回给调用方。使用的是两三年前别人遗留下来的方法，放到线上后发现确实是可以正常取到结果，但是一旦调用，CPU占用就直接100%(部署环境是win server服务器)。因此查看了下相关的老代码并使用JProfiler查看发现是在某个while循环的时候有问题。具体项目代码就不贴了，类似于下面这段代码。while(flag) {//your code;}这里的flag._main函数使用while(1)循环cpu占用99

【无标题】jetbrains idea shift f6不生效_idea shift +f6快捷键不生效-程序员宅基地

文章浏览阅读347次。idea shift f6 快捷键无效_idea shift +f6快捷键不生效

node.js学习笔记之Node中的核心模块_node模块中有很多核心模块,以下不属于核心模块,使用时需下载的是-程序员宅基地

文章浏览阅读135次。Ecmacript 中没有DOM 和 BOM核心模块Node为JavaScript提供了很多服务器级别，这些API绝大多数都被包装到了一个具名和核心模块中了，例如文件操作的 fs 核心模块，http服务构建的http 模块 path 路径操作模块 os 操作系统信息模块// 用来获取机器信息的var os = require('os')// 用来操作路径的var path = require('path')// 获取当前机器的 CPU 信息console.log(os.cpus._node模块中有很多核心模块,以下不属于核心模块,使用时需下载的是

数学建模【SPSS 下载-安装、方差分析与回归分析的SPSS实现(软件概述、方差分析、回归分析)】_化工数学模型数据回归软件-程序员宅基地

文章浏览阅读10w+次，点赞435次，收藏3.4k次。SPSS 22 下载安装过程7.6 方差分析与回归分析的SPSS实现7.6.1 SPSS软件概述1 SPSS版本与安装2 SPSS界面3 SPSS特点4 SPSS数据7.6.2 SPSS与方差分析1 单因素方差分析2 双因素方差分析7.6.3 SPSS与回归分析SPSS回归分析过程牙膏价格问题的回归分析_化工数学模型数据回归软件

利用hutool实现邮件发送功能_hutool发送邮件-程序员宅基地

文章浏览阅读7.5k次。如何利用hutool工具包实现邮件发送功能呢？1、首先引入hutool依赖<dependency> <groupId>cn.hutool</groupId> <artifactId>hutool-all</artifactId> <version>5.7.19</version></dependency>2、编写邮件发送工具类package com.pc.c..._hutool发送邮件

docker安装elasticsearch，elasticsearch-head，kibana，ik分词器_docker安装kibana连接elasticsearch并且elasticsearch有密码-程序员宅基地

文章浏览阅读867次，点赞2次，收藏2次。docker安装elasticsearch，elasticsearch-head，kibana，ik分词器安装方式基本有两种，一种是pull的方式，一种是Dockerfile的方式，由于pull的方式pull下来后还需配置许多东西且不便于复用，个人比较喜欢使用Dockerfile的方式所有docker支持的镜像基本都在https://hub.docker.com/docker的官网上能找到合..._docker安装kibana连接elasticsearch并且elasticsearch有密码

随便推点

Python 攻克移动开发失败！_beeware-程序员宅基地

文章浏览阅读1.3w次，点赞57次，收藏92次。整理 | 郑丽媛出品 | CSDN（ID：CSDNnews）近年来，随着机器学习的兴起，有一门编程语言逐渐变得火热——Python。得益于其针对机器学习提供了大量开源框架和第三方模块，内置..._beeware

Swift4.0_Timer 的基本使用_swift timer 暂停-程序员宅基地

文章浏览阅读7.9k次。//// ViewController.swift// Day_10_Timer//// Created by dongqiangfei on 2018/10/15.// Copyright 2018年飞飞. All rights reserved.//import UIKitclass ViewController: UIViewController { ..._swift timer 暂停

元素三大等待-程序员宅基地

文章浏览阅读986次，点赞2次，收藏2次。1.硬性等待让当前线程暂停执行，应用场景：代码执行速度太快了，但是UI元素没有立马加载出来，造成两者不同步，这时候就可以让代码等待一下，再去执行找元素的动作线程休眠，强制等待 Thread.sleep(long mills)package com.example.demo;import org.junit.jupiter.api.Test;import org.openqa.selenium.By;import org.openqa.selenium.firefox.Firefox.._元素三大等待