不学网络爬虫,用Excel抓取数据,可以吗?

问答分类: 技能证书不学网络爬虫,用Excel抓取数据,可以吗?
0

做数据挖掘(分析)懂python。但是不想学习爬虫,想直接用Excel去抓取数据(文本数据),可行吗?

5 回复
0
用户1255108131677 回复于 2021-11-24 之前

当然是可以的,但是使用起来不是很灵活,没有python等语言抓取数据好处理,下面我大概介绍一下excel抓取数据的过程,实验环境win7+office2013,主要内容如下:

1.新建一个excel文件,双击打开这个文件,分别选择“数据”->“自网络”,如下:

2.在弹出的子窗口输入所要抓取的页面,这里以抓取http://www.pm25.in/rank页面的数据为例,分别点击“转到”->“导入”,如下:

3.成功导入后,数据如下,已经成功抓取到我们所需要的数据:

4.如果想定时刷新数据的话,这里可以点击“全部刷新”->“连接属性”,自定义刷新的频率,默认是60分钟:

在弹出的“选择属性”窗口,设计刷新频率,定时刷新数据:

至此,我们就完成了利用excel抓取数据。总的来说,整个过程挺简单的,只不过灵活性不是很高,而且如果页面比较复杂,抓取的数据量又比较多,后期直接在excel处理起来不是很方便,题主已经都会python了,建议还是用python直接抓取,更灵活,python提供了许多爬虫包和框架,像requests,bs4,lxml,scrapy等,可以快速的抓取数据,也方便后期的处理(像pandas,numpy等),学的话,很快就能上手,网上也有相关资料和教程,希望以上分享的内容能对你有所帮助吧。

0
乐居网 回复于 2021-11-24 之前

我是大海,微软认证Excel专家,企业签约Power BI顾问,喜欢研究无需VBA的Excel报表自动化及数据分析问题。

对于数据抓取的问题,一般来说得看数据源本身的情况,如果数据源本身没有防爬,那用Excel抓取完全没有问题,而且也不需要VBA,因为现在Excel的新功能Power Query提供了网抓的基本功能。具体用法举例如下:

一、抓取imdb网站电影数据

二、抓取国际燃油价格信息

本例中虽然用的是Power BI,实际上跟Excel里用Power Query操作是完全一样的。

三、相关知识及其他案例

另外,我还在一个关于Power Query和Power Pivot的视频课程里录制了一个用Excel进行网络数据抓取的内容。有兴趣的朋友也可以了解一下。


欢迎在评论中发表不同观点,共同学习,一起进步。

私信“材料”下载系列文章配套材料100+份

0
不客气怪舒坦 回复于 2021-11-24 之前

可以的,既然楼主已经懂Python相关的代码,说明已经了解了爬虫的基本原理,而楼主的主要诉求是不想写代码就可简单实现数据爬虫,并完成数据分析,换句话说就是:使用界面操作代替爬虫代码去实现数据爬取。

目前Excel可以实现简单的数据爬取,在菜单栏的数据栏下有自网站功能,可以输入目标网页进行数据爬取(对于一些顽固的网站,可以在高级功能中选择浏览器的标头参数并设置响应时间来完成数据爬取)

最后获取的数据在Power Query中清洗后,可以在Excel内设置定时刷新的时间,全程不需要额外的操作及代码的编写

其次,Excel的升级版Power BI可以实现翻页网页的数据爬虫,整个环节更为简单(全程界面操作,无需编写代码)、也可下钻到具体的详情页内进行数据或文本的爬取,就看楼主的具体需求了

Excel完成数据爬虫

如果对这方面感兴趣的话,可以关注:憨憨少年小木木

憨憨少年小木木(戳我了解详情)

后面会有完整的爬虫系列,全部是非代码完成,同时获取数据后可直接进行数据清洗及数据可视化仪表盘的制作哦

0
雨润沐 回复于 2021-11-24 之前

可以 啊,但是灵活性不高了,可以参考网上的文章。用Excel抓取数据什么的,整体的过程也是十分简单,记得联网噢

0
心愿军师梁涛 回复于 2021-11-24 之前

有时需要从某个网站获(爬)取一些数据,并且能够时时更新,这是后就需要 爬虫了,不会敲代码用 Excel 也可以简单实现这个功能,步骤也很简单,可别小瞧了 Excel!

基本步骤:

1. 双击图标,打开 Excel

2. 依次点击,数据 >> 从网站(自网站)

3. 在弹出的对话框中,输入目标网址,Games sales ,点击转到,go

4. 等待网页加载,点击你需要的数据区域,点击导入,import

5,然后会弹出一个数据存放区域的对话框,随便找个地方,点击 ok

6. 等待数据加载(本次无需点击)

7. 大约等待 10 秒钟,可以看到了,大概爬取了 600 行的数据

利用Excle自动获取网页数据,譬如从网页中自动获取基金净值数据,取得所关注基金的净值,列出当日涨幅最高的基金。其他用处还有很多,看你怎么解放双手了。