极验发布全国首个图数据建模平台,新引擎助力企业告别AI马车时代

时间:2019-07-23 来源:www.24107.cn

2019年7月11日,由贵宾主持的图形学习创新大会和2019年图形数据建模平台会议在北京泰富大酒店举行。会议邀请了203位业界领袖,媒体和嘉宾与最热门的神经网络进行讨论和交流,见证了该国首个自主开发的数据建模平台的首次启动。

RVz96LZ86djkP1

中国第一个图形数据建模平台覆盖

中国需要技术创新

这是一个工业智能时代。企业的发展与数据的关系越来越密切。标题算法创造了bytebeat的兴起,而Deepmind使用AlphaGo来克服李世石引爆机器智能的无限可能性。阿里与华为分别推出AI芯片,底层支持也将迎来变革。

有很多方法可以实现智力。过去,企业通过深度学习训练神经网络,但在关系数据挖掘方面,它们仍然缺乏。图神经网络在关系数据挖掘中具有巨大的潜力,正在成为学术界和工业界研究和开发的热点。

人工智能时代企业成长的关键

从2012年到2018年,仅仅6年,AI技术带来了巨大的变化。例如,CNN的出现,电脑视觉突破,刷脸付款,刷脸进站,自动驾驶发展非常迅速; RNN在自然语言处理方面取得了很大进步,如机器翻译,智能助理应用等日趋成熟。

但是,这个世界产生的数据不仅包括图像或语音,还包括具有特定关系的关系数据。根据BCG报告,进入互联网时代后,企业产生的数据急剧增加,但只有40%得到有效利用。

RVz96LyCA98quo

其中一个重要原因是关系数据没有得到有效利用。使用数据作为人工智能的燃料并不是公司未能实现增长的关键。

图神经网络的出现将充分发挥关系数据的能量,这是企业在AI领域竞争的又一大机遇。

图数据建模平台

如何解决降落难度

图神经网络出现得很晚,是一种相对较新的技术。它具有强大的功能,包括适应多种类型数据的能力,了解关系的能力以及逻辑推理的能力。如何将这些强大的功能应用于业务?实际上很难真正实现这项技术的落地。

首先是系统的可扩展性。在工业场景中,图形数据大约为数亿,系统必须具有处理大规模数据的能力。其次,GNN模型对分布式具有高度适应性。今天大数据的分布式开发非常成熟,但处理图形数据存在两个问题。第一个是图形数据不容易切割,第二个是图形数据库的起源。很长一段时间,设计开始时的主要考虑因素是添加和删除,但更多的是关于GNN的分布式建模,数据特定操作的效率和数据提取的吞吐量。

花了很多时间进行测试和研究。经过对实际业务的探索和思考,我发现为了解决这个问题,我们必须从底层调整数据的存储方案和运行方式。

定制技术架构

可扩展性和高效率是系统真正设计的必要条件。在图形数据建模的探索中,它完全集成了图形数据建模的特点和难点。模型所需的基础数据引擎。技术框架:

RVz96MIExMiJss

整个技术框架的核心是中间三层,即存储层,操作层和建模层,它们是专门针对图形数据的特征而开发的。

存储层和操作层统称为图存储引擎,主要完成图数据分布式存储和图数据操作的抽象接口。在这一层设计中,他们围绕图的分区,图形数据的结构设计和存储,以及整个数据系统的索引设计和优化进行了大量的开发工作,以支持上层数据操作的效率,比如随机化。步行,子图采样等。

在模型级别,采用消息传递机制,并且由于较低层支持数据的有效操作,因此非常有必要有更多空间来完成GCN对属性映射的调整。

绩效指标显示:

RVz96MZ10rEUCW

在不到20年的时间内,您就可以完成一百万个节点组合。对于1亿个节点和5亿个辅助数据,10个工作人员只需要150秒的时间。在读取的性能中,测试子图采样的性能。在此指示器上,时间控制在100毫秒以下。为了实现这样的效率,图形卡将没有计算延迟。

产品为企业带来的价值

Overlay是第一个支持深度学习企业级图形数据的建模平台,为企业提供一站式建模服务。今天,SAAS服务模式正变得越来越流行。从事金融,零售和医疗保健的企业无需花费大量精力从底部逐步建立平台。资源,劳动力和时间的成本不小。注意。完善分工,让专业人士做专业,是我们整个社会不断进步,生产力不断提高的重要前提。

降低企业的应用门槛

叠加集成了大规模图形数据的分布式建模功能,提供了公司可以直接使用的Web端操作,无需专家进行建模。其次,整个建模过程在平台上得到巩固,后期模型的维护成本大大降低。

叠加层有许多不同的场景

如今,几乎所有企业都是多线业务开发,可能在一个主要业务下,并且有几个子业务场景。叠加可以完全支持企业的多场景需求。

图数据建模业务非常有效

今年,一个非常受欢迎的概念被称为技术中间平台,数据处于中间位置。它意味着从企业的各种业务和各种场景中收集数据以进行数据生成。这是未来两年的一个大趋势。图形建模可以集成来自数据关联的各种类型数据的建模,这将极大地改善业务结果。

应用场景

图表数据是可以最好地描述关系的数据。可以应用的业务场景非常丰富,主要包括风险控制和营销的两个主要业务场景,并赋予整个行业权力。

RVz96Mn9Qalbpz

?风险账户识别

在知识渊博的产品中,GCN模型已用于风险账户识别。使用帐户,设备,IP及其关联的数据,然后将图形导入模型,GCN将学习一些模式,如高密度二分图(如下所示)。

RVz96XXUD8qjY

GCN将AUC指标提高了1.2倍,稳健性提高了1.5倍,这是模型在更新周期中的作用。这表明使用GCN进行风险识别是一种安全且可持续的对抗手段。

?汽车保险反欺诈

图形数据建模也非常适用于汽车保险欺诈检测。关于车辆事故的数据很多,例如车辆损坏数据,包括皱纹,凹痕,裂缝,划痕等;车辆属性信息,如每辆车是来自不同的制造商,不同的年份,不同的版本。这些数据之间存在非常复杂的关系,例如当车辆的发动机损坏时,通常伴随着对其他部件的损坏。

RVz96Xs78WQabB

图表是可以描述关系的最多数据形式。通过构建汽车保险索赔图,使用图神经网络,我们可以找到一些风险模型,如在线风险,二手车风险,人体伤害,瓷器,索赔等等。

在实践过程中,基本上可以将生产效率提高百倍并实现大量的减损。

?企业风险识别

在金融行业,实时判断贷款公司的风险,及时调整贷款,降低风险也是非常重要的。根据公司的舆情信息,相关企业信息,股东信息,产业链信息等,建立地图数据,利用图形计算进行热点分析,企业动态分析,及时改变企业贷款政策。

下半场的AI门票

在当前和未来的数据扩展中,利用地图数据来提升企业的技术实力将是实现行业整体效率飞跃的重要解决方案。

图形计算正在快速增长。世界上的所有数据都可以表示为图形结构。对图形卷积神经网络,图形注意机制,图形自动编码器,时空图形网络和图形嵌入等新兴技术的研究也在不断深入。图结构与因果网络相结合的关联特征有望证明神经网络结构的可解释性。

“图”也继续赋予各行业权力。如金融反欺诈,银行反洗钱,保险反欺诈,企业风险控制等领域应用大量地图技术,研究医药开采,图像识别,智慧城市等方向。地图技术可广泛用于挖掘行为场景,例如异常,构建知识地图和推断节点关系。

技术驱动的开发,需求创建和应用以及图形技术领域的技术挑战都很大。遗憾的是,公司可以实现“地图”的价值,但从零开始研发的资金,人力和时间成本是不可承受的。叠加层的发布将为构建地图生态系统提供关键环节。