网站首页 > 知识剖析 正文
1. 介绍
1.1 介绍
福哥在使用selenium实现页面爬取的时候发现遇到包含框架(frame)的网页时候就无法通过find_xxx方法得到页面上的元素,这可真是麻烦了啊!
福哥在使用F12调试前端的时候发现在调试面板的控制台栏里就可以选择页面上面的任意一个框架(frame)作为当前框架,如果selenium也可以选择页面上面的框架就好了!
经过一番折腾,福哥找到了答案!
2. 框架页面
这是一个包含多级框架的页面,下面的代码都是以抓取这个页面作为示例的。
3. 通过id定位
如果页面内的frame有id的话,可以直接定位。
chrome.get("http://192.168.2.168/tfams/test.html")
chrome.switch_to_frame("top")
print(chrome.find_element_by_tag_name("h3").text)
4. 通过name定位
如果页面内的frame有name的话,可以直接定位。
chrome.get("http://192.168.2.168/tfams/test.html")
chrome.switch_to_frame("content")
print(chrome.find_element_by_tag_name("h3").text)
5. 通过元素定位
如果页面的frame既没有id也没有name的话,只能通过标签选择了。
chrome.get("http://192.168.2.168/tfams/test.html")
iframes = chrome.find_elements_by_tag_name("iframe")
chrome.switch_to_frame(iframes[0])
print(chrome.find_element_by_tag_name("h3").text)
6. 多级嵌套框架
selenium的寻找元素是在“当前”框架内进行的,如果我们要定位的框架在“当前”框架的子级框架里面(也就是孙级框架),那么就需要一级一级地进行定位了。
chrome.get("http://192.168.2.168/tfams/test.html")
chrome.switch_to_frame("content")
chrome.switch_to_frame("sub1")
print(chrome.find_element_by_tag_name("h3").text)
7. 返回上级框架
上一例当中我们将“当前”框架移动到了最里面的sub1上,如果要定位sub2框架就需要先回到content框架,这个时候就需要使用返回上级框架的功能了。
返回上级框架功能通过switch_to.parent_frame方法实现。
chrome.get("http://192.168.2.168/tfams/test.html")
chrome.switch_to_frame("content")
chrome.switch_to_frame("sub1")
print(chrome.find_element_by_tag_name("h3").text)
chrome.switch_to.parent_frame()
chrome.switch_to_frame("sub2")
print(chrome.find_element_by_tag_name("h3").text)
8. 返回顶级框架
如果框架层级很多,我们希望一下回到最外层的框架,可以使用switch_to.default_content方法实现。
chrome.get("http://192.168.2.168/tfams/test.html")
chrome.switch_to_frame("content")
chrome.switch_to_frame("sub1")
print(chrome.find_element_by_tag_name("h3").text)
chrome.switch_to.default_content()
chrome.switch_to_frame("top")
print(chrome.find_element_by_tag_name("h3").text)
9. 切换框架的两种方法
selenium切换框架提供了两种方法,福哥分别介绍一下。
9.1 通过switch_to_frame方法
一个是通过Chrome实例的switch_to_frame方法实现。
chrome.get("http://192.168.2.168/tfams/test.html")
chrome.switch_to_frame("top")
print(chrome.find_element_by_tag_name("h3").text)
9.2 通过switch_to.frame方法
一个是通过Chrome实例的switch_to属性对象的frame方法实现。
chrome.get("http://192.168.2.168/tfams/test.html")
chrome.switch_to.frame("top")
print(chrome.find_element_by_tag_name("h3").text)
10. 总结
今天福哥带着大家学会了在selenium里面切换“当前”框架的方法,无论是一级框架结构,还是多级框架结构,我们都可以游刃有余地定位它们了。
框架设计在管理系统里面出现的比率还是非常高的,越是功能强大的系统使用的框架结构就会越复杂,要能够模拟用户操作这样的系统需要灵活掌握切换框架的技巧才行。
https://m.tongfu.net/home/35/blog/513253.html
猜你喜欢
- 2025-06-13 热血动漫番太好看了!用Python爬取了1T的动漫,内存都爆了
- 2025-06-13 前端实用技术分享—用Vue实现打印指定区域
- 2025-06-13 JSONP安全攻防技术(web安全攻防)
- 2025-06-13 七爪源码:在 Anvil 应用程序中嵌入网页的 3 个简单步骤
- 2025-06-13 IDM、Portal 、ESB如何与钉钉进行集成
- 2025-06-13 layui中弹出层的保存按钮绑定为iframe中表单的按钮
- 2025-06-13 填坑:frame和iframe 你所不知道的!
- 2025-06-13 页面渲染优化的几点建议(页面渲染的顺序)
- 2025-06-13 让我们来看看常见的网页挂马方式(网站挂马一般在什么位置)
- 2025-06-13 【Python大语言模型系列】使用dify云版本开发一个智能客服机器人
- 最近发表
- 标签列表
-
- xml (46)
- css animation (57)
- array_slice (60)
- htmlspecialchars (54)
- position: absolute (54)
- datediff函数 (47)
- array_pop (49)
- jsmap (52)
- toggleclass (43)
- console.time (63)
- .sql (41)
- ahref (40)
- js json.parse (59)
- html复选框 (60)
- css 透明 (44)
- css 颜色 (47)
- php replace (41)
- css nth-child (48)
- min-height (40)
- xml schema (44)
- css 最后一个元素 (46)
- location.origin (44)
- table border (49)
- html tr (40)
- video controls (49)