计算机程序化系统策略交易又分为半智能系统交易的主流手法

目前,程序化交易已经成为外资银行和金融机构的主流交易方式,因为程序化交易是追求稳定、持续的盈利模式,可以稳定交易,从而消除人工交易中的诸多不确定性,避免人为情绪。虽然程序化交易本身只是一个工具,但使用人类思维和计算机执行,真正专业的程序化模型的设计过程并不是那么简单。

就交易策略而言,一般分为两类,一类是手动策略交易,即手动下单交易;另一种是系统策略交易。系统策略交易一般分为手动系统策略交易和计算机程序系统策略交易。

计算机程序系统策略交易又分为半智能程序系统交易和全智能程序系统交易。本文探讨后者,即数学建模的神经网络如何在完全智能编程系统的策略中发挥作用。

神经网络:我们这里所说的神经网络一般是指人工神经网络,一种旨在模拟人脑结构和功能的信息处理系统。人工神经网络是一种数学模型,它应用类似于大脑神经连接的结构进行信息处理。在工程和学术界,通常简称为神经网络或类神经网络。神经网络是一种操作模型,由大量节点(或神经元)之间的互连连接组成。每个节点代表一个特定的输出函数,称为激活函数。每两个节点之间的连接表示通过该连接的信号的一个加权值,称为权重,相当于人工神经网络的记忆。网络的输出根据网络的连接方式、权重值和激励函数的不同而不同。网络本身在本质上通常是某种算法或函数的近似,也可能是一种逻辑策略的表达。人工神经网络通常通过基于数理统计类型的学习方法进行优化,因此人工神经网络也是数理统计方法的一种实际应用。用函数表示的局部结构空间,另一方面,在人工智能的人工感知领域,我们可以通过数理统计的应用(即通过统计方法,

神经网络的基本组成:神经网络主要由神经元组成,神经元按照一定的拓扑结构广泛互连,并按照一定的学习规则,通过大量样本数据的学习和训练,掌握所掌握的知识由网络以神经元之间的连接权重和阈值的形式存储,利用这些知识可以实现一定的人脑功能推理引擎,该引擎通过机械运算来发挥作用。人工神经元是对生物神经元的正式描述。它抽象出生物神经元的信息处理过程,用数学语言描述,模拟生物神经元的结构和功能,并用模型图表示。. 单个人工神经元的功能很简单。只有通过一定的拓扑结构将大量人工神经元广泛连接起来,形成一个庞大的人工神经网络,才能实现对复杂信息的处理和存储,才能发挥各种优势。特征。

人工神经网络图:

神经网络结构:就数学模型而言,神经网络结构一般分为两类,即层次结构和互连结构。层次结构的神经网络根据神经元的功能将神经元分成若干层。一般有输入层,中间层和输出层依次连接。输入层接受外部输入信号并将它们从每个输入单元传递给直接连接的中间层单元。中间层是网络的内部处理单元,与外部没有直接联系。神经网络的模式转换能力,如模式分类、模式改进、特征提取等,主要在中间层进行。根据处理功能,中间层可以有多个层或简单层。因为中间层单元不直接处理外部输入输出。因此,神经网络的中间层通常被称为隐藏层。输出层是网络输出运行结果的部分,与显示设备或执行器相连。

典型的神经网络结构图:

人工神经网络的特点和优势主要表现在几个方面:一是具有自学习功能。例如,在实现图像识别时,只需将许多不同的图像模板和相应的待识别结果输入人工神经网络,网络会通过自学习功能逐步学习识别相似的图像。自学习功能对于预测尤为重要。预计未来人工神经网络计算机将为人类提供经济预测、市场预测和效益预测,其应用前景十分广阔。其次,它具有联想存储功能。这种关联可以使用人工神经网络的反馈网络来实现。第三,它具有高速找到最佳解决方案的能力。寻找复杂问题的最佳解决方案通常需要大量的计算。使用针对某一问题设计的反馈式人工神经网络,发挥计算机的高速计算能力,可以快速找到最优解。第四,应用领域非常广泛,这些领域主要包括:模式识别、信息处理、知识工程、专家系统、优化组合、自动控制以及本文所讨论的金融市场程序量化交易模型的构建等。随着神经网络理论本身及相关理论和相关技术的不断发展和深入发展,未来神经网络的应用将更加深入和广泛。就金融领域的自动交易模型而言,笔者只是尝试探讨一下,希望读者多了解其中的不足之处。第五,神经网络可用于分类、聚类、预测等。通过对历史数据的训练,神经网络可以学习数据中的隐含知识,在问题和相应的评价数据中找到某些特征,并利用这些数据。训练神经网络,进而实现自适应功能,应用比较广泛的是BP神经网络。神经网络可用于分类、聚类、预测等。通过对历史数据的训练,神经网络可以学习数据中的隐含知识,在问题和相应的评价数据中找到某些特征,并利用这些数据. 训练神经网络,进而实现自适应功能,应用比较广泛的是BP神经网络。神经网络可用于分类、聚类、预测等。通过对历史数据的训练,神经网络可以学习数据中的隐含知识,找到问题中的某些特征和相应的评价数据,并利用这些数据. 训练神经网络,进而实现自适应功能,应用比较广泛的是BP神经网络。

数学模型中常用的两类神经网络:在数学建模中,神经网络主要有两类:一类是基于误差反演算法的前馈神经网络,即BP神经网络,主要用于实现非线性映射; 另一种是SOM自组织特征映射神经网络(SOM),主要用于聚类和模式识别。两者的内部结构不同,下面简要说明:

BP神经网络:人工神经网络的模型很多,但应用最广的是前馈神经网络中的误差反向传播学习算法(Error Back Propagation),简称BP神经网络。它是前馈神经网络的核心部分。基本算法包括两个方面,即信息的正向输入和误差的反向输入。在计算实际输出时,是从输入到输出的方向进行的,而权重和阈值的修正是从输出到输入的方向进行的。其结构图如下:

BP神经网络基本结构图

BP网络结构是引入信号前向传播,前向传播是通过输入层到中间隐藏层实现的。如果输出层获得期望值,则学习算法结束。如果没有得到期望值,则反向传播,按照原连接路径反向计算误差信号,并按照误差梯度下降法调整前几层的权重和阈值。信息变量的不断输入总是处于动态调整中,目的是使修正网络的最终输出接近最优期望值。一个简单的比喻,类似于一个人的成长经历,不断改正错误,吸取教训,并在成长过程中不断总结成功经验,以免下一次犯同样的错误。其模型结构图如下:

BP网络结构

这里我想强调一下权重和阈值的概念,因为它们非常重要,关系到网络的最终结果。权重和阈值是神经元之间的连接,将输入的数据计算到一个输出,然后与实际输出进行比较,反向误差,不断调整权重和阈值。理论上,BP神经网络由于其优异的非线性逼近性能,在模式识别、智能控制、非线性优化等领域有大量应用。近年来,很多人在股指期货的日内空头模式自动化中使用了BP神经网络。交易上。BP网络的理论优势主要体现在学习速度和泛化能力上。它甚至不需要太多的样本,更适合非线性特性。根据训练集的表现,未训练样本的逼近度不仅可以高度拟合未来数据,即预测函数。这是对神经网络好坏的基本检验。BP神经网络似乎完全能够进行理论推导。

但真的是这样吗?为什么用BP网络神经模型构建的很多交易模型的实际效果不如训练集效果,甚至误差很大?

泛化能力没有得到充分体现,是什么原因?以下是我对此的个人看法:

1、 很多人过于盲目地相信BP神经网络的数据自适应纠错、数据容错和数据泛化能力,尤其是对历史样本数据的收集、分层筛选和识别数据的内在本质一无所知。数据不足,缺乏研究对象。样本数据所蕴含的内在规律被挖掘和体验,导致样本数据噪声过大、结构不合理、不科学。一般来说,随着样本数据 M 的增加,泛化能力会增加。

样本数据的训练效果很好,泛化效果也更好。但是,这种趋势是有限度和程度的。当达到一定限度时,随着训练能力的提高,预测能力反而会下降,会陷入两个极端。要么是样本数据存在严重的不足和缺陷,要么是样本数据太多太少。过拟合。

这两种现象都是学习过多的数据样本细节,过分关注数据现象,而没有反映样本所包含的本质规律。这也是BP神经网络的缺陷。由于数据过分强调预测数据,放大倍数过大适应预测,却不注意挖掘样本数据固有性质的内在规律,自然容易出错,甚至拟合错误规律在某些特定阶段,尤其不适合构建中线趋势带交易模型。

2、 使用BP网络设计程序化交易模型,容易陷入构建“自下而上”模型概念的陷阱,导入过多的数据噪声,这是程序化交易模型设计者应尽量避免的.

一般来说,程序模型的主要设计理念分为“自顶向下和自底向上”,前者是概念优先,后者是数据优先。它们之间的区别将在后面讨论。

3、 由于学习率是固定的,网络收敛慢,训练时间长。对于一些复杂的问题,BP算法需要的训练时间可能会很长,这主要是由于学习率太小造成的。

4、 其次,BP算法可以使权重收敛到某个值,但不保证是误差平面的全局最小值,因为梯度下降法可能会产生局部最小值。

5、 网络隐藏层的层数和单元的选择没有理论指导,一般根据经验或反复实验确定。因此,网络往往具有很大的冗余,这也在一定程度上增加了网络学习的负担。

6、 网络学习和记忆不稳定。也就是说,如果添加了学习样本,训练好的网络需要从头开始训练,对于之前的权重和阈值没有记忆。但是您可以为预测、分类或聚类保存更好的权重。

基于以上原因,单纯使用BP神经网络构建金融市场程序化交易模型的主体还是有一定局限性的,如果需要与其他神经网络结合使用效果应该会更好。

SOM 自组织特征映射神经网络:生物学研究表明,人类大脑皮层中存在许多具有不同功能的神经网络区域。反应,特定细胞对特定信号的特定反应不是先天的,而是通过训练形成的。

自组织特征映射神经网络模拟大脑神经系统的功能。它是用于无监督竞争性试验学习的前馈网络。它可以在训练期间学习无监督的自组织。它可以通过学习从一组数据中提取重要特征或某些类型的数据。内在规则,以离散的方式分类,网络可以将任何高维输入映射到低维空间,并使输入数据内的相似属性表现为相邻的特征图,并保持其拓扑结构不变。这种分类反映了样本集的本质差异被大大简化,一致性准则中的人为因素也被大大简化。

大多数情况下,人们在认知过程中并没有正确的预测方式,人们往往通过“无师自通”的方式获得大量知识,即通过对客观事物的反复观察、分析和比较,自己揭示它们的内在规律。并对具有共同特征的事物进行分类。对于这种人类学习方式,基于辅导学习策略的神经网络(BP)是无能为力的。

因此,自组织神经网络的无监督学习方法更类似于人脑中生物神经网络的学习。,这种学习方法极大地拓宽了神经网络在模式识别、分类和聚类中的应用。自组织网络结构属于层次网络结构,种类很多。

自组织特征图就是其中之一,它们的共同特征是竞争层。一般的自组织神经网络具有输入层、竞争层和输出层结构。输入层接受外部信号并将它们传输到竞争层。竞争层负责对输入的模式进行分析比较,找出规律,进行正确分类。

SOM自组织神经网络结构图

模型过拟合的常见原因:

A.数据采样过程中没有适当考虑市场的基本特征,使得提取的数据样本不能有效地代表市场运行逻辑或基本特征(市场运行规律),BP网络模型往往忽略了这一点;

B. 数据样本噪声 数据干扰太大,使模型记住噪声特征太多,而忽略了输入和输出之间的真实关系,即忽略本质,模型设计从未把握核心价值;

C、在决策树模型的构建中,如果我们不对决策树的生长进行合理的限制和剪枝,决策树的自由生长可能只包含简单的事件数据(事件)或非事件数据(没有事件)在每片叶子中。事件),可以想象这个决策树当然可以完美匹配(拟合)训练数据,但是一旦应用到新的业务真实数据上,效果就不理想了。样本训练集,尤其是关键条件,不宜过细,应适当限制和剪枝。

D. 应用模型时,建模中的“逻辑假设”不再成立。常用的模型只能在假设的基础上建立和应用。常见的假设包括:假设“历史数据可以预测未来,市场历史会重演”,假设业务环节没有重大变化,假设建模数据与后续应用数据相似,等等. 如果上述假设违反业务场景或环境发生变化,则基于这些假设构建的模型可能无法有效应用。

BP和SOM的优缺点:金融市场量化模型的构建应该使用BP还是SOM?这取决于投资对象、交易理念和模型构建者的投资经验。笔者个人认为,SOM神经网络特征映射应该更适合有一定投资经验和交易观念的人,更有利于思考市场走势的本质。无需在特定阶段进行数据拟合,可以提前避免数据陷阱过拟合,更贴近实战和适应性。

因此,SOM神经网络一般需要一定的投资理念和经验作为模型构建者的基础,即先有概念,后建模。具体来说,SOM神经网络首先在数学建模中基于广泛的历史样本,对特征进行物理化学识别,对样本进行正确的分类和分类,学习和提炼已知样本中包含的分类知识。一些基本的规则和特征,然后用这个分类规则和特征来验证交易概念。

SOM网络直接从提供的样本中学习分类知识,提取样本中包含的相关知识,并将知识存储在网络的连接处,即拓扑互连中。利用这些知识,可以对未知样本进行分类。为了防止数据陷阱和过拟合,提取的样本特征规则应在不同的训练集中进行测试,并具有广度和深度。

全智能程序化交易模型系统的构建思路:全智能程序化交易模型的设计,绝对离不开神经网络知识的应用。今天的市场趋势更加复杂多变。面对当今复杂的市场,如果想用一个过于简单的某种突破性概念来赚取利润已经成为过去式。精明的交易者越来越多,波动特征也越来越复杂多变。面对当今更加复杂多变的市场,需要使用更加复杂的Knowledge工具程序化交易用什么语言好,才能不断适应市场。因此,神经网络知识在数学模型中的应用至关重要。

只是单纯使用BP神经网络建立模型有一定的局限性。它的作用主要体现在样本训练集的阶段。SOM 网络可以更多地实现对概念进行测试和优化的功能,因为概念必须是必不可少的(见下文)。具体来说),如果程序化的模型完全依赖数学模型神经网络,而忽略了市场运动的本质,很容易陷入过拟合和数据陷阱的状态,真实的市场效果普遍不尽如人意,这是另一个劣势程序化交易。.

因此,如何在运用数学模型神经网络知识的同时避免陷入数据陷阱应该是程序化模型设计的主要方向。

程序主体设计理念:解决以上问题,首先要解决程序设计理念的问题,也就是确定模型方向的问题,否则很容易陷入数据陷阱。就程序化主体的设计理念而言,一般分为“自上而下”的概念构建和“自下而上”的概念构建。“自上而下”的概念是基于现有的交易概念。这种交易理念往往是基于多年的实战。它是通过反复的市场观察、经验、理解和实践而获得的初步经验。这种经验是普遍的。以模型的本质和本质作为模型概念的主要结构,

例如,索罗斯的交易系统就是从他的反射理论衍生出来的交易程序。相反,没有经验的新手很容易陷入数据陷阱和过拟合状态,因为他们普遍不具备构建模型概念“自上而下”的能力和经验,即缺乏深刻的理解,对市场的了解和经验。只能一味地“自下而上”地构建模型概念。

“自下而上”的建模理念往往不具备未来的适应性或在真实市场中存在较大的误差。只是所谓的知识和训练集,纯粹是基于一定时期的一堆数据。往往导入过多不相关、非本质的数据变量,偏离模型的核心价值,导致数据噪声过大程序化交易用什么语言好,没有考虑模型的关键本质特征和信息以及由此构建的投资理念。在实际应用场景中很容易表现不佳,因为市场波动特征和数据模板会随着时间的推移变得复杂多变,市场不会出现两个完全相同的趋势。历史会重演,但绝不会简单重复。

交易系统的优化:一些程序化交易者反对优化,因为过度优化会使交易系统为过去工作而不是为未来工作,这是优化陷阱。其实这也是一个“度”的问题。过于简单的模型不再适用于当前和未来的市场,过于复杂的模型可能会陷入过拟合的陷阱。所以,我个人认为这里的关键是看你用什么数据优化还是idea优化。自下而上的模型思想设计往往是数据优化。

比如一个交易系统设计的概念就是用趋势来突破交易方式,比如海龟交易方式(突破20个周期的高低点),数据优化就是找到最合适的值突破N个循环,概念优化不仅仅是寻找简单的突破。更好、更有效的交易思维或想法或组合。

任何模型交易概念的雏形首先是基于个人实战经验、观察和逻辑思维,而这个概念需要通过海量数据来检验,进一步检验交易概念的优劣,而这个过程离不开数学楷模。神经网络,尤其是SOM网络知识的应用,如合理抽样、样本理化、特征提取、知识抽取、分类等,在这个过程中,可以进一步检验交易概念的原型是否正确,进行必要的修正和优化。

使用“分层拓扑和SOM神经网络”应该可以达到这个目的,发现交易理念的短板和优缺点,去渣取精,进而进一步检验和确认交易理念的核心理念价值。模型。交易理念是确定模型是否具有未来适应性和稳健性的保证,因为市场波动的特征虽然多变,但密不可分。人类的本质特征几百年来没有改变,市场也是如此。

系统集成:成熟优秀的程序化交易模型,必然是系统集成的结果。交易过程是一个完整的有机系统,包括:模型构建、交易策略、方向识别、信息处理、信号传递和执行的基本概念和方法。、止盈止损、退出市场策略、风控/稳控等,每个子系统并不孤单,单个子系统设计不合理也会影响整个交易系统的性能,整体系统性能往往依靠各个子系统最佳协调组合的结果,形成一个完整的运行交易系统。这个系统是否优秀,可以从“外推、性质、量化”三个方面来检验,而“外推”则是检验模型是否在实践中。上市前是否具有盈利前景和未来适应性的重要方法一般分为时间外推和品种外推。对多个品种进行多品种程序回测;所谓“自然”,就是避免三个方向,一是尽量避免超高频交易;二是尽量避免自下而上建立模型交易理念;三是模型设计的内容要贴近实战,信号执行最好使用收盘价模型,必须考虑实际市场情况、滑点损失和交易成本。说到指标,

如:年化收益率、利润率、本金回撤、动态权益回撤、动态盈亏回撤、胜率、盈亏比、夏普比率、交易成本和滑点估算。回测阶段是否有明显变化等。如果任何模型都无法通过历史数据回测,那么以后肯定不适合。虽然通过回测并不一定意味着它会适应未来,但是一个成熟优秀的模型一般在设计阶段就可以提前过滤和避免现实市场中可能面临的错误,也能经受得住真正的市场。

交易系统的实际使用和维护:市场波动的特征也会发生变化,主要体现在波动特征和交易环境上。比如2002年到2005年,只要你有最简单最简单的移动平均线系统,你就可以发财。2005年以后,这么简单的系统盈利就变得不稳定了,2009年以后,基本不可能用来盈利了。

再比如2015年2月之前,股指盘中跳价单位一般不低于1个点,止损控制很容易实施,不会出现过度滑点,但2015年5月之后,盘中交易就很常见了价格跳跃单位甚至变为5点或10点,势必会大大增加盘中高频交易的滑点成本。如果模型不修改,它就不会适应。几年前,做股指高频交易的人发了财,一年十次,但现在,高频交易已经是自杀了。

为什么?

因为市场上精明的交易员越来越多,当你的对手还在肉搏战时,你可以用手枪称王,但现在,其他人都在飞机上。以前套利很容易赚钱,现在赚钱越来越难,套利空间越来越小,因为越来越多的人参与套利,都是电脑自动识别的程式。如果有一点套利空间,就会有交易者立即尽快修复差价的不合理性,差价空间会被市场快速修复,获利机会越来越少。

另一个重要问题是交易环境也会发生变化。比如,今年期货夜盘交易的大规模推出,导致不同时段的交易分布不均,开盘和收盘时间被扭曲。许多交易系统无法适应。因此,交易系统必须时时跟踪、维护和修复模型效果,甚至在必要时宣布其死亡。毫无疑问,市场的历史会重演,但它的表现并非完全简单和可重复。性能会发生变化。不同的环境会导致局部差异。所以对交易系统的跟踪和维护是绝对有必要的,而且模型也不是万能的,

进入【新浪金融股】讨论

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论