且慢!阿尔法狗还驾驭不了我大A股_观点_评论频道首页_财经网 - CAIJING.COM.CN
当前位置:评论频道首页 > 观点 >
个股查询:
 

且慢!阿尔法狗还驾驭不了我大A股

本文来源于阿尔法工场 2016-03-22 10:20:37 我要评论(0
字号:

pic001

本文为华泰证券研究所计算机行业首席分析师、研究组组长高宏博,在阿尔法工场线上分享活动的录音整理。整理人:贺清

最近进行的阿尔法狗和世界围棋冠军李世石的对战引起了全世界对人工智能的关注,结果更是超乎了许多人的预期。包括我本人和著名风险投资人、人工智能领域的专家李开复先生等事先都预测机器不会战胜人类。

然而结果却是相反。事后分析AlphaGo的技术原理,其运用的是“神经网络(深度学习)”技术,这个技术在这场比赛中发挥了核心作用,这也是目前人工智能领域一个核心的技术。

至于什么叫“深度神经网络算法(DNN算法)”,简单描述就是把变量作为输入的参数,输入的参数会往中间层做一个函数映射,一层一层地传导下去。

目前比较复杂的神经网络都可以达到十几层的深度。从图形上看它很像一个神经网络的结构,它的原理就是模仿人脑的神经元相互作用的过程。

这就好比细胞,单个的细胞结构、功能都比较简单,但是很多细胞组织在一起就能实现比较复杂的功能。同样的,单个的神经元处理信息的能力是比较有限的,但是很多神经元相互作用、互相传导就能实现一个复杂的人类思维过程。

当然,这其中具体的原理目前还未完全探索出来,这是一个非常有难度的学科。计算机网络其实也是在模仿这一点。我们可以把深度学习网络理解成一个“黑盒子”,里面上千万的参数都是经过大量的数据模型的培训,可以进行自我调整和学习的。

单个的参数,无论是从数学还是物理的角度都很难给它一个合理的解释,但是大量的参数整合在一起后,无论输入的参数还是输出的结果都能达到一个非常好的匹配效果。

那么一个训练得当的“深度神经网络”或者说“黑盒子”能达到什么样的效果呢?比方说,针对语音培训的网络,它能通过大量的语音输入或者输出的匹配之后很好地识别语音。相对于传统的语音识别模型来说,它能够大幅提高识别的准确率。类似的应用还有人脸识别等等。

而谷歌的AlphaGo也是这样一个经过培训的深度网络学习的应用,它相对于原有模型的优点就在于它对于参数模型的定义,它可以处理大量的数据,而且可以自动找出一些数据的相关性。

那么就金融领域而言,人工智能以及DNN算法能否实现一些相关的功能呢?就我看来,之前的金融工程往往是根据我们对金融目标的描述(经过对大量历史数据的统计和回归分析所得出的模型,这时我们一般假设历史可以重演)去预测市场未来的变化。

而DNN算法则可以自动提取一些相关性,我们可以把大量的数据(例如宏观经济指标、相关行业数据等)放入其中,同时匹配结果(例如当天股价涨跌情况)去培训这个网络。在数据量非常大的情况下,理论上可以培训出一个比较理想的模型。

它的优点在于,之前的金融从业者建立模型时往往是基于经验,由于影响市场的变量非常多且一些变量容易被忽略,这样的金融模型是很容易失效的。而机器学习相对来说就可以弥补这个缺点,因为它能够处理大量的数据。

很多时候,我们仅依靠经验分析或者肉眼观察很难发现这些数据的关联性或者对结果影响的重要程度,这个时候可以通过相关的神经网络去解决。

未来,AlphaGo的算法可能会被完全公开,其技术也可能被应用于医疗、机器人、智能手机助手以及无人驾驶等领域,但是还没有人提到这种技术在金融领域的应用。对此我认为,出于利益的考量,一般的量化投资公司不会轻易公开自己开发的适用性较强的模型。

而且,在实际金融市场的操作下有这样一个简单的规律——如果大量的人都在使用同一个交易策略,就算这个策略再有效也将失效,这也是这些公司不公开自己开发的模型的原因。

目前国际上几个大的投行和量化公司已经开始尝试在自己的交易算法和市场策略模型里加入DNN算法,原因就在于DNN算法可以处理大量看似不相关的数据并从中找出规律。

量化的策略都具有一定的时效性,一旦市场发生变化或者使用同一个交易策略的人越来越多,交易的策略也会失效,所以量化投资公司需要经常更新自己的模型。通过DNN算法,机器根据市场的反馈不断自我学习并且调整最优策略,可以实现动态的变化,保持时效性。

当然话又说回来,我也始终认为人工智能在金融领域的应用也有一定的局限性。金融市场本身存在着大量变量、大量信息和大量影响因素的共同作用,而且市场参与方由大量的机构和个人组成,是十分复杂且开放的。

相对来说,围棋是一种单一目标、固定规则的“完美策略”游戏,理论上来说是存在最优解的,因此DNN算法可以发挥比较理想的作用。但是对于稍微开放的游戏(例如多人对战的棋牌),机器暂时是无能为力的。

所以对于金融市场这个大量的人参与博弈、受到大量变量影响的对象来说,人工智能几乎是不可能“打遍天下无敌手”的。它只能作为一个金融从业者的辅助工具,在必要的时候给人做参考和提示。

总的来说,从现在人工智能的进展来看,所谓的“智能学习”或者说“深度学习”程序可以在一个单一目标、固定策略的环境下不断优化自己的策略,通过不断地跟自己博弈寻找最优解,这在一定程度上体现了“学习”。

但现在的机器还远远没有达到真正人类学习的状态,而且目前也没有特别理想的路径去实现这件事。所以说,真正的人工智能或者说“强人工智能”的发展还有非常漫长的路要走。

其实人工智能已经在一些领域得到了比较好的应用,例如刚才提到的语音就是一个非常经典的DNN算法的应用,上市公司“科大讯飞”一直在做这方面的研究。

在医疗领域,IBM公司的Watson处于领先地位。(需要说明的是,Watson的技术路径和AlphaGo是不同的,它更像是一个经过精心梳理的庞大的专家知识库,把你出现的症状和它已有的病例进行匹配从而找到解决方案。)

当然Watson在医疗上也只是起到辅助作用,它没有完全替代医生去进行诊疗,它只提供一些可能的结果,最后还是由医生进行判断。

教育领域,人工智能已经在智能阅卷上得到了比较好的应用。(此处的“智能阅卷”并非我们常见的识别答题卡,而是更高级别的应用,例如用人工智能批改作文。)

另外一个比较重要的应用领域就是安防,通过DNN算法实现人脸的识别。由于人脸存在一定的规律性,人脸识别通常运用“卷积智能网络”。具体的应用场景有人脸打卡、锁定通缉犯、识别危险动作。

A股上市公司“东方网力”就是与国内人工智能团队合作进行公安视频安防平台的开发,目前来看在人工智能领域还是前景看好的。

还要特别提到的是,在搜索领域,像研发AlphaGo的Google和国内的百度都有比较好的技术布局。一方面,利用人工智能能够大幅提高搜索的准确率,另一方面,也可以提高广告投放的精准度。

在无人驾驶汽车领域,Google和百度也在进行相关的尝试。与金融行业类似的,无人驾驶是一个开放式的场景,实现起来的难度比较大。

总之,随着时间的推移和技术的进步,经过大量数据的学习训练加之机器处理数据的能力越来越强,再过三到五年,人工智能在上述领域都能得到比较好的应用。

当然,上述领域的应用还停留在一个“弱人工智能”的前提下,未来,随着理论和算法上的突破,“强人工智能”也许也能有所突破。

这里引入一个“奇点”的概念,一些人工智能领域的专家认为,在达到“奇点”以前,人工智能的发展是一个平缓向上的线性过程,一旦突破“奇点”,人工智能可能就能够实现爆发式的上升,甚至有可能超出人类的想象范围。

因此,人工智能在未来会不会对人类的生存造成威胁,这也是一个非常值得探讨的问题。许多人工智能领域的专家都发出过倡议,认为对人工智能的研究还是要保持谨慎,防范未来可能产生的风险。

未来的三到五年都将是一个“弱人工智能”的时期,相应的研究都是为了提升人类生产和生活的效率和质量,把人类从繁重的体力劳动和一定程度上的脑力劳动中解放出来,这也是人工智能发展的初衷。

当然,在发展人工智能的同时我们也要做好相关的防范工作。根据Elon Musk的观点,最好的办法就是“开源”。也就是说,当人工智能可能产生威胁的时候,如果所有人都掌握人工智能,就可以达到一个制衡的效果,这可能是预防未来可能存在的风险的最佳策略。

问答环节:

Q:请问嘉宾对‘Kensho’有了解吗?怎样看待其在金融市场中的表现?Kensho在您的分析框架下算是金融人工智能吗?另外,您对‘Palantir’是怎么看的?

A:‘Kensho’之前已经被高盛高价收编,我们无法看到其具体算法,据我理解,该公司早期进行的还是金融建模。

这个公司其实已经存在了十多年,公司成立之初神经网络算法还不是很普及,所以还是用的传统建模的方法。

当然,它的模型比较复杂,运用了大量的数据。现在随着人工智能的普及,它可能引入了DNN算法以纳入更多的变量、处理更复杂的情况。

至于人工智能和非人工智能的界定,我认为如果预设的程序只是根据历史的数据和知识去建模,再根据一些未来交易的信息去做模型计算,这并不能算作人工智能。

人工智能需要有一个根据历史数据培训的神经网络,并且它可以根据之后更新的数据进行不断的自我优化。‘Kensho’公司符合我之前提到的一种情况,它并未向全市场公开自己的算法和模型,而是将它们卖给了一些指定的机构。

而至于‘Palantir’,其背后推动人Peter Thiel在他的《从零到一》中提到这个公司的成立是基于对大数据分析追踪和防范金融诈骗和网络欺诈的需求。通过大数据分析以及机器和人脑的结合,比较完美地解决了如何判断欺诈行为的问题。

这也说明了人工智能更多还是作为辅助的工具,必须跟人脑结合才能呈现最好的效果。

Q:目前A股中哪些公司在人工智能领域比较领先?

A:就整个国内市场来说,我把该行业的上市公司划分为三个层次,第一层是平台级(有技术并且进行了综合应用),这类公司以BAT为代表,而百度更是目前国内人工智能领域最大的平台。

第二层是纯人工智能技术平台,以讯飞、Face++为代表,而讯飞相对Face++在技术上更为全面,它也是目前A股中技术最领先、投入最坚决的公司。

第三层是细分后的应用领域,例如安防领域的东方网力、医疗领域与Watson有合作的思创医惠、人脸识别方面有川大智胜、汉王科技。

Q:如何看待人工智能芯片在国内的应用和发展前景?

A:中科院计算所的陈云霁研究员是目前国际上人工智能芯片领域的专家,他开发的智能芯片已经处于流片阶段,日后也可能会孵化为企业。我之后可能也会约陈研究员探讨一下这个行业宏观的一些情况。

陈研究员研发的芯片从效果上说是专门针对DNN算法来设计,就量化的指标来说,这种芯片通过DNN算法的运算效率比普通的芯片效率提高了100倍,这也是未来一个很有前景的产业。

如果该芯片实现量产,之后可以针对深度神经网络研发专门的服务器,这样可以节省大量的资源。未来一些大的平台都可能采用这种DNN服务器。所以我个人认为如果陈研究员研发的成果可以实现产业化的话前景是非常看好的,而且目前国际上对这种技术也非常认可。

Q:AlphaGo这次表现突出,一是因为其运用了DNN算法,二是因为学习了大量人类棋谱,是否可以说大数据是该阶段人工智能的基础之一?那么该如何获取金融领域的高价值数据?目前此类数据的政策监管力度如何?

A:确实在一些开放的较为复杂的场景下数据的数量和质量对最后训练出的结果的准确率有较大的影响,所以DNN出现之前对于算法和建模的要求是很高的。DNN算法出现之后对于模型和数据的控制没有之前那么严格,它会自动对信息进行筛选和调整。

而对于像AlphaGo这样的单一目标对于数据的要求并不太高,它甚至可能脱离数据。而对于像医疗、金融领域这样存在大量可能变量的领域是不可能脱离数据的。

由于现在的交易数据都是相对公开的,而且经济数据也有大量的第三方公司提供,所以这些数据的获取不存在监管问题。当然这不包括一些涉密数据和敏感数据。

当然,如果将一些变量的维度扩大并把数据的颗粒度变小,并且设计DNN模型去做模型的培训,可能会获取一些用传统建模方法无法得到的结果或者没有想到的规律。

【作者:阿尔法工场 (编辑:lvqiang)
关键字: 阿尔法
分享到:

财经网微评论0人参与)

查看更多>>
匿名评论
  • 全部评论(0条)
查看更多>>

热门文章

热点商讯

编辑推荐

要闻

更多>>

编辑推荐

  • 宏观
  • 金融
  • 产经
  • 地产
  • 政经
  • 评论
  • 生活
  • 海外

排行榜

  • 热文
  • 本周热文
  • 热图
  • 热评
  • 博客