财经新闻网

您现在的位置是:首页 > 财经人物 > 正文

财经人物

股票数据爬虫进阶:免费、开源的股票爬虫Python库,实测真香(新浪财经 股票)股票数据爬取与预处理惩罚处罚处罚处罚处罚处罚处罚处罚处罚处罚处罚处罚处罚处罚处罚处罚处罚处罚处罚处罚处罚处罚处罚处罚处罚

生活网 2024-06-11财经人物
免费、开源的股票爬虫Python库:Easyquotation我们在此前的文章中,向大家分享了如何用Python爬虫,从新浪财经获取实时的股票数据:(文章链接)。本期文章,我们将介绍一个股票数据爬虫的进阶工具:一个叫做Easyq………

 

免费、开源的股票爬虫Python库:Easyquotation

我们在此前的文章中,向各人分享了如何用Python爬虫,重新浪财经获取实时的股票数据:(文章链接)。本期文章,我们将介绍一个股票数据爬虫的进阶工具:一个叫做Easyquotation的Python三方库,这个py三方库内置了爬取多个差别的股票数据源的功能,数据源包罗

新浪财经:全部A股实时行情(snapshot)集思录:分级基金、ETF、QDII实时数据腾讯财经:A股日内分时行情、港股日k线行情、港股实时行情(snapshot)

新浪财经的实时行情,我们不再赘述。对于集思录,这是一个提供偏重债息相关的投资品种,例如新股、可转债、分级基金、债券、封闭基金、QDII、ETF、LOF 等资产标的数据的专业平台,投资者可以通过集思录数据,分析理论价值及其偏差,找到各种低风险的套利机会,而Easyquotation支持我们从集思录上爬取其公布的数据,进而可以使用Python跟踪套利机会。对于腾讯财经,它不但提供A股的日内行情,还提供港股的日K线数据以及实时行情数据,对于有港股交易需求的朋友来说,爬取腾讯财经的免费港股数据,不失为一个经济的方案。

使用准备

接下来,我们介绍在使用Easyquotation前,需要做的准备工作,大抵可以分为两步:

首先,我们需要安装Requests三方库。Requests库可以说是所有爬虫的”标配“,Requests是用python语言基于urllib编写的,接纳的是Apache2 Licensed开源协议的HTTP库。与urllib相比,Requests更加方便,可以节约我们大量的工作。由于easyquotation的爬虫依赖Requests库,所以我们必须先确保电脑中安装好Requests库。

第二步,安装Easyquotation。Easyquotation有两种安装方式,我们既可以通过pip install的方式进行一键安装,也可也从github上clone对应的库文件,进行手工安装。安装完Easyquotation库,我们就可以开始使用它了。

简要介绍

在实测代码使用Easyquotation之前,我们先对其主体逻辑,做一个简单介绍:

首先,Easyquotation的Api提供了一个入口,允许我们在使用时,选择爬取哪个数据源,Easyquotation支持的数据源包罗:新浪、集思录、腾讯以及中国银行(汇率),中国银行的数据源主要为了读取美元人民币等主流外汇的汇率,我们平时用的比力少,所以文章重点介绍前3个爬虫数据源的使用:新浪财经、集思录、腾讯财经。

其次,Easyquotation有一个名为Basequotation基类,这个基类各人不需要特别理解它的技术细节,只需要知道它的总体功能,包罗两方面:一是定义爬虫获取数据的基础函数,二是创建查询线程池。

最后,是各个扩展子类,子类有三大功能:继承基类函数、重载自定义行情源、接收数据的处置惩罚函数。而我们后续要做的实测,就是将子类进行实例化。好比我们用新浪财经的爬虫数据,就是实例化Sina的子类,而如果我们用集思录的爬虫数据,就是实例化jsl的子类,其他子类,皆可以此类推。

实测:新浪财经爬虫

示例1:新浪财经爬取全市场股票实时数据(snapshot)。Ea