网站首页 > 知识剖析 正文
前两天因为工作原因,需要将网页上的表格转换为excel表格,用deepseek搜了一下,搜出以下五种方法。自己使用感受,推荐方法二。方法一的话复制过去单元格会比较乱,需要合并单元格等操作。方法二的话存在空行问题,但可以通过全选表格,筛选空白单元格删除的方式删除(具体见方法二)。其他三种方法怎么说呢,对大多数像我一样的人来说可以操作,但不愿尝试,放在这里,就做补充吧,希望能帮到大家。
方法一:手动复制粘贴
- 选择表格:在网页上选中表格内容。
- 复制:右键点击选择“复制”或按 Ctrl+C(Windows)或 Cmd+C(Mac)。
- 粘贴到Excel:打开Excel,右键点击单元格选择“粘贴”或按 Ctrl+V(Windows)或 Cmd+V(Mac)。
方法二:使用Excel的“从网页获取数据”功能
- 打开Excel:启动Excel并创建一个新工作簿。
- 数据选项卡:点击“数据”选项卡,选择“从网页”。(我自己用的WPS,这一步用的是“数据”选项课,在“获取数据”选项下拉菜单点击“自网站连接”)
- 输入URL:在弹出的对话框中输入网页URL,点击“确定”。(wps中这一步是在“新建web查询”对话框的地址栏粘贴表格网页的网址,然后点击“转到”,下边预览窗口就会转到相应网页)
- 选择表格:在导航器窗口中选择要导入的表格,点击“加载”。(wps中是点击“导入”按钮,在弹出的“导入数据”对话框一般选默认位置“$A$1”就可以了,等待一会,就能在表格里看到数据了)
导出的表格中我的这边是有一些空行,影响筛选结果,需要删除。删除做法如下:第一步选中整个表格,一定要选中,不然筛选空行时只会出现个位数的空行,选中整个表格你就会看到筛选中的空行有很多,然后筛选确定,就会出现一个只有筛选行(标题行)和所有空行的表格,此时记住按住“ctrl键”,双击筛选行,然后直接右键删除就能删除所有表格内的空行了。删除前双击左键是为了在删除时不删除标题行,左键双击后应为如下情况:
方法三:使用浏览器扩展
- 安装扩展:在浏览器中安装如“Table Capture”等扩展。
- 捕获表格:打开网页,点击扩展图标,选择要捕获的表格。
- 导出到Excel:选择“导出为Excel”或类似选项,下载文件后打开。
方法四:使用在线工具
- 访问在线工具:打开如“Convert CSV”或“Table2Excel”等在线工具。
- 上传或输入URL:根据工具要求上传表格文件或输入网页URL。
- 转换并下载:按照提示操作,完成后下载Excel文件。
方法五:使用编程脚本(如Python)
- 安装库:使用 pandas 和 requests 库。
- 编写脚本:
- python
- 复制
- import pandas as pd import requests from bs4 import BeautifulSoup url = '网页URL' response = requests.get(url) soup = BeautifulSoup(response.text, 'html.parser') table = soup.find('table') df = pd.read_html(str(table))[0] df.to_excel('output.xlsx', index=False)
- 运行脚本:保存并运行脚本,生成Excel文件。
注意事项
- 格式检查:转换后检查格式是否正确。
- 数据验证:确保数据完整无误。
- 隐私保护:处理敏感数据时注意隐私安全。
选择适合你的方法进行操作即可。
- 上一篇: 前端面试:如何写出高性能的 HTML?
- 下一篇: 7 行代码 3 分钟:从零开始实现一门编程语言
猜你喜欢
- 2025-06-24 HTTP/3 黑科技:三次握手如何进阶 QUIC?30 年通信细节揭秘
- 2025-06-24 Markdown 语法速查手册与教程(markdown语法是什么意思)
- 2025-06-24 二 计算机网络 前端学习 物理层 链路层 网络层 传输层 应用层 HTTP
- 2025-06-24 计算机网络之HTTP协议(http网络协议原理)
- 2025-06-24 零基础学习网站必知—http协议等资料大全
- 2025-06-24 Python文件操作:读写txt/csv/json的终极方案
- 2025-06-24 Tomcat处理HTTP请求流程解析(tomcat如何解析http参数)
- 2025-06-24 一日一技:如何正确渲染大模型返回的Markdown?
- 2025-06-24 从零开始,30天学会在Shopify上开店之店铺设置–Day5
- 2025-06-24 壹起航:网站优化之网站代码优化(网站代码优化工具)
- 最近发表
-
- HTTP/3 黑科技:三次握手如何进阶 QUIC?30 年通信细节揭秘
- Markdown 语法速查手册与教程(markdown语法是什么意思)
- 二 计算机网络 前端学习 物理层 链路层 网络层 传输层 应用层 HTTP
- 计算机网络之HTTP协议(http网络协议原理)
- 零基础学习网站必知—http协议等资料大全
- Python文件操作:读写txt/csv/json的终极方案
- Tomcat处理HTTP请求流程解析(tomcat如何解析http参数)
- 一日一技:如何正确渲染大模型返回的Markdown?
- 从零开始,30天学会在Shopify上开店之店铺设置–Day5
- 壹起航:网站优化之网站代码优化(网站代码优化工具)
- 标签列表
-
- xml (46)
- css animation (57)
- array_slice (60)
- htmlspecialchars (54)
- position: absolute (54)
- datediff函数 (47)
- array_pop (49)
- jsmap (52)
- toggleclass (43)
- console.time (63)
- .sql (41)
- ahref (40)
- js json.parse (59)
- html复选框 (60)
- css 透明 (44)
- css 颜色 (47)
- php replace (41)
- css nth-child (48)
- min-height (40)
- xml schema (44)
- css 最后一个元素 (46)
- location.origin (44)
- table border (49)
- html tr (40)
- video controls (49)