鲁南快报以新闻宣传业务为主的综合性资讯网站

ATEC现场直击:公开情报+AI 助力企业数据化风控

在过去一年,风报新增全网企业相关公开数据突破15亿条。公开数据在IT时代到DT时代的变革中将发挥越来越重要的作用,如何有效处理及利用这些数据并实现价值转化是企业现今面临的最大挑战。


    2018年9月21日,在杭州举办的ATEC大会上,风报高级算法专家赵迎宾先生应邀发表了“公开情报+AI 助力企业数据化风控”的演讲,深入探索了风报在公开情报分析与智能风控领域的技术实践。 

    从公开数据到情报 

    风控是蚂蚁金服的核心能力,对公开情报的获取和挖掘能力是其中重要的组成部分。 

    从2007年到2017年,在互联网上的企业公开信息数量增长超过了40倍。现在,企业公开信息分布在超过50000个政府部门网站,3000多家法院网站,超过10万家媒体和自媒体门户以及不计其数的企业官方网站和第三方平台。


    在面向小微企业的金融服务中,由于传统征信数据的缺失,公开数据成为了金融服务机构和企业控制风险的必要手段。 

    要把公开数据转化为风控能力和商业价值,需要跨越这三个挑战。 

    第一,数据孤岛。虽然公开数据的数量大,但是它们分散在互联网的各个角落,而且重要的风险线索存在于网上的时间也有限,例如,有些法院的开庭公告只会在开庭前在网站上可查,开庭后就不再公示了。 

    第二,结构化程度低。例如,有大量不同的来源可以获取到诉讼的信息,格式、结构化程度也不尽相同。但是要了解这些诉讼对企业的影响到底有多大,就需要知道每起诉讼的案由、对手方、胜败诉等一系列结构化的信息,再对结构化的信息进行统计分析。 

    第三,数据之间缺乏关联。企业与企业之间可能会发生股权、供应链、担保、业务竞争等大量不同的关联关系,评估不同的关联关系对企业的经营可能产生的影响,以及风险事件发生时的可能传导路径,需要建立在图计算的核心能力上,而一些流行的开源图数据库在面对复杂的计算任务时显得力不从心。


    风报作为蚂蚁金服科技金融智能应用的又一重磅产品,致力于借助人工智能为合作伙伴提供企业情报分析及风险管理服务。通过标准化SaaS服务的模式,风报已赋能数百家合作伙伴,赋能企业实现数据化决策,帮助金融机构实现全流程统一风控,风报希望通过消除信息差,打通传统企业与金融机构间的金融服务通道,实现更平等和普惠的金融服务。 

    每周2次以上的快速发布,历经 300多个版本的迭代,风报在应对上述挑战方面积累了丰富的经验和产品化沉淀。 

    首先,风报建立了一套成熟的分布式数据采集系统,结合人工智能技术实现了采集集群的智能调度,并支持自动化的网页结构分析,从中抽取标题、内容、发布时间、表格、图表等关键信息,实现了对全网信息的高质量覆盖。 

    接下来,基于自研的自然语言处理技术和数千万条高质量语料,风报建立了超过20个中文语义模型,将非结构化的文本进行清洗、去重、分析,经过分词、实体识别、关系抽取等多道工序,把数据分门别类,转化为结构化的企业情报信息。经过结构化处理的情报,结合风报丰富的数据可视化,使风控人员能够在大量信息中快速识别出企业的风险。 

    最后,面对海量关联图谱关系的挑战,风报建设了一套基于内存的图计算引擎,实现了在1亿节点、10亿关系的网络上的秒级关联计算能力。在传统的基于磁盘介质的图数据库中,挖掘到第4层、第5层的时间开销就已经超出了用户可以接受的极限,而风报的图计算引擎能够在1秒内挖掘10层以上的企业关联;在此基础上,风报还结合反洗钱、风控等业务场景进一步搭建了最终受益人、混业经营等识别能力,进一步丰富了图计算引擎的场景应用。 

    基于“公开数据+AI”,风报通过SaaS化的产品模式,在数据采集、中文语义、场景化服务能力等方面持续创新,探索出了一条可复制的科技赋能路线。 

    到目前为止,风报已签约了数百家合作伙伴,分布于银行、融资租赁、供应链金融、企业内控、不良资产、政府等不同的行业和企业部门,覆盖了潜在商机挖掘、风控前置、尽职调查、竞争对手情报、风险动态监控和监管合规等大量应用场景。 

    信用风险感知:从“信仰”到信评 

    与人工智能技术的深度结合,可以更大地释放公开数据的潜力。针对信用债的风险感知系统,是风报产品赋能的最新案例。


近年来信用债违约规模和数量表

    在2014年以前,对于信用债的买方而言,信用债的投资还可以依靠“信仰”,由于缺少实质违约的案例,以及行业普遍存在的刚兑预期,债券买方对于信用风险的重视程度并不高。在之后短短的四年间,民营企业、地方国企、央企、城投相继出现违约事件,违约的主体数、总规模也呈逐年上升的趋势。 

    因此,有效识别风险的能力,对于债券和债券基金的投资者会变得越来越不可或缺。传统的信用债风险管理,主要存在以下尚未解决的问题: 

    ▨ 基于财务指标的风控,不能实时反映发行主体风险; 

    ▨ 外部风险事件来源广,非结构化,难以在风险模型中应用; 

    ▨ 无法预判关联风险传导。 

    结合“公开数据+AI”,风报可以大大降低在信用债风险管理中利用公开数据的难度。依托公开数据实时、高频的特点,结合强大的数据结构化和关联分析能力,可以帮助机构更加快速地捕捉企业风险的动态变化,建立更高质量的信用债主体评价体系。 

    回到这次ATEC大会“暖科技”的主题,在未来,随着被动投资的理念得到更广泛的普及,风报的风险感知能力可以和财富管理结合,帮助个人投资者更好地基于自己的风险偏好,发现适合自己的投资标的,实现在财富管理领域的平等、普惠。 

    风报相信,通过推动公开数据和人工智能技术的广泛、平等的利用,可以为世界带来更多微小而美好的变化。 

未经允许不得转载鲁南快报 » ATEC现场直击:公开情报+AI 助力企业数据化风控
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

鲁南快报 更专业

关于我们联系我们