基于函数型数据分析的股票市场板块划分及板块
基于函数型数据分析的股票市场板块划分及板块指数构建摘? 要:作品要紧基于函数型主因素剖析商量了沪深300指数238支因素股2012-2018年的颠簸率的顺序,凭据计算的载荷因 子函数对其举行聚类剖析,将其划分为六大板块,以期处分方今金融商场以行业、区域和观念等划分板块的主观性的题目;并利 用股票价值均匀指数编制各式板块指数,基于板块指数剖析分别板块的危急及投资战术,为每个板块举行定名。其余,基于频 数剖析法修筑分别板块内部随期间变更的联动比率目标以及个股的分裂度目标,咨议板块内部股票的全部联动性及板块的更新 题目。
要害词:函数型主因素剖析;沪深300;聚类剖析;板块指数 基金项目:广西自然科学基金共同资助培养项目“神速贝叶斯随机颠簸筑模手段及其正在危急处理中的利用” (2018GXNSFAA294131) 中图分类号:F830.91???? 文献标识码:A 作品编号:1674-537X(2019)03.0060-06
一、弁言 “板块”一词出处于地质构制假说,地质学家以为因为地 壳运动及火山喷发等自然外象,岩石圈并非一个全部,而是由 分别巨细的板块所组成,每个板块具有配合的或者宛如的地质 地貌特质等。后“板块”一词被引入金融周围,用以呈现分别 的股票群体。守旧的股票商场板块基于行业的划分:如道琼斯 分类法将股票商场分为三类:工业、运输业和公用行状 [1];或 基于区域划分板块:如浦东经济区、珠三角经济区、京津冀经 济区等;或基于观念划分:应用资产重组、罕睹金属、新能源 以及节能环保等观念题材举行划分。其余,跟着金融商场的发 展及炒作,金融商场上还存正在着很众划分板块的手段,如基于 市值划分为大盘股、小盘股等,基于交往价值的崎岖划分为一、 二、三线股等等。总而言之,这些股票的划分都是基于某种特 征(如行业、区域、观念等等)举行划分,往往都带有肯定的 主观性。面临纷纷庞杂及许许众众的商场划分,投资者特别是 初学者将会目炫狼籍,很难从股票商场入选出己方得意的股票 从而到达肯定的收益。 基于此,能否忽视股票的区域特征、行业特征、观念特征 以及其他特质,仅从股票的史册数据举行剖析,开掘分别股票 正在肯定功夫内的颠簸特质,并将具有好像或宛如颠簸顺序的股 票划分为统一板块、咨议板块内部之间的联动效应、同时为投 资者资产装备供给决议,具有极大的实际旨趣。 目前,基于数据对股票举行板块划分的咨议较少,周立 敏、朱家明等人应用分别商场个股之间的合系系数和最佳阈值 设立筑设股票收集,基于收集对商场内的一共股票举行板块划分并 赢得较好的结果 [2];朱邦燕、朱家明等人通过随机抽取沪深主 板、创业板、中小企业板一面股票,通过咨议分别股票的对数 收益率的合系性巨细和目标修筑股票收集举行板块划分 [3];海
沫等人选择上市公司的 15 项财政目标,应用面向大数据的并 行聚类算法对 A 股商场 2600 支股票举行聚类以便对股票板块 划分,并剖析每一板块的投资价钱,为投资决议供给参考 [4]; 袁泽波正在其博士论文中基于实体经济增进和行业周期属性将股 票商场分为周期板块和非周期板块,并对两类板块的联动效应 和轮动效应举行剖析 [5]。以上合于商场板块的划分都是将数据 目标动作离散的数据举行治理,但股票的收益率等数据是跟着 期间一贯变更的以是属于继续型数据,而函数型数据剖析刚巧 又是处分这一题目的最好手段。隋钰冰应用函数型主因素剖析 剖析了上证 50 因素股的主因素函数,并基于载荷因子函数进 行 Kmeans 聚类剖析并取得较好的分类结果 [6]。固然,古人正在 板块划分上也举行了合系咨议,但古人大一面都从开荒更精准 的聚类的角度来探讨,且未探讨聚类后各个板块的指数修筑、 板块的危急与投资以及板块内部的联动性强弱等,以是,本文 以函数型数据剖析和聚类剖析为根本,剖析和商量股票商场板 块划分的手段、板块指数的修筑以及板块内部联动性的胸怀等 题目。
二、商场板块划分及板块指数修筑咨议思绪 作品的要紧目标是为了咨议股票商场的板块划分题目。邦 内股票商场的股票品种繁众,对股票的史册数据举行聚类所面 临的直接题目便是高维数据聚类的题目。浅显聚类算法正在面临 高维数据时成果不佳。以是降维是板块划分必弗成少的本事; 守旧的主因素剖析正在治理横截面数据时可以阐明很好的成果, 而作品中每支股票数据(如对数收益率)都为期间序列数据, 特别是股票数据颠簸性较强,以是,作品将股票数据看做函数 型数据举行治理,将函数型主因素剖析引入股票商场举行板块 划分。函数型数据与守旧的数据分别,素质是将每个股票样本 数据作为是一条润滑弧线即函数,而非是极少离散点,即能够
依照函数的性子、特色及导数来剖析咨议股票的颠簸情状。所 以要念举行函数型数据剖析务必将原始数据函数化,外 1 给出 作品的周详咨议思绪。
个中,i 呈现第 i 支股= 票, i 1,= , n, n 238 ;rit 呈现第 i 支股票正在 t 日的对数收益率。本文随机挑选 4 支股票的日对数
Step2: 应用润滑手段将原始数据函数化;(囊括确定基函 数的阶数、区间的内点个数、修筑基函数、粗疏责罚项,广
指数剖析危急及投资战术并对板块定名 Step6: 基于频数剖析法修筑板块的联动比率目标和分裂度