财经新闻网

您现在的位置是:首页 > 财经热点 > 正文

财经热点

爱数课实验 | 利用Python爬取股票交易数据(股票首页)爬取股票数据并分析,

品牌世界 2024-06-13财经热点
爱数课: http://idatacourse.cn领域:金融 简介:股票交易市场每天都会产生数据量巨大的交易信息,对于想要从事量化分析,或者想要自己挖掘感兴趣的股票交易数据背后所包含的信息的人来说,获取这些数据并进行分………

 

爱数课:http://idatacourse.cn

领域:金融

简介:股票交易市场每天都会产生数据量巨大的交易信息,对于想要从事量化分析,或者想要自己挖掘感兴趣的股票交易数据背后所包罗的信息的人来说,获取这些数据并进行分析是十分有意义的。在本案例中,我们将使用爬虫技术,对股票交易信息公开网站上的一些股票交易数据进行爬取。

数据:

./dataset/data1.csv

./dataset/data2.csv

1 数据源信息介绍

1.1 数据来源网站

股票市场交易信息在网络上随处可查,但有的网站将数据流放在js中,相对来说难以统一处置惩罚;有的网站域名结构不敷清晰,无效字符比力多。经过对比,本案例选用股城网来进行股票交易数据的爬取。

1.2 选取目标数据

在股城网上,有着各种板块的行情信息,诊断信息,各个股票的行情走势,基本资料,高管介绍,资金流向等各类信息。我们需要在这些信息中,筛选出我们所需要的。选取某一只个股,我们可以检察其个股首页所展示的信息。

红色方框内包罗了这只股票今日的一些行情信息。在本案例中,我们将这些信息列为获取的对象之一。

注意到在行情信息的下方,还存在关于股票的更多方面的信息链接。在本案例中,我们进入到财政分析页面,并将其中所展示的近五日的资金流向组成表格(如下)也列为我们要获取的信息对象。我们想要通过爬虫实现的目标,便是将股城网上每只上海深圳交易所股票的上述两种信息都获取下来,并以表格的形式将这些信息储存在DataFrame中。

1.3 定位目标数据

由于我们想要爬取股城网上所有股票的信息,我们需要一份股城网上所有股票名称或代码的清单。我们打开股城网的股票代码一览页面 (https://hq.gucheng.com/gpdmylb.html) ,页面中展示了上海深圳所有股票的名称和代码,每个股票名称对应一个链接,链接即为该股票的个股首页。但这些并不是我们所能直接直接用到的数据。每个网页的构建包罗html,css,js等模块,我们如果想要获取目前展现在我们眼前的数据,需要访问构成网页前端界面的这些基本组件。我们按F12,打开网页的开发者页面。