【技术白皮书】第四章:信息抽取技术产业应用现状及案例(上)
- 2023-04-21 09:39:00
- 刘大牛 转自文章
- 231
4.产业应用现状
4.1信息抽取技术的产业应用
信息抽取技术已发展多年,相关产业也日趋成熟,下面是几种主要的信息抽取产业应用:
- 商业信息抽取:通过开发专门的信息抽取系统,分析各渠道收集的商业信息大数据,抽取诸如有关公司工商信息、舆情现状、风险监控等信息,提供决策支持信息。
- 医疗信息抽取:医疗保健机构以及健康保险部门可以利用信息抽取系统,获取病人的症状、诊断情况、化验结果以及治疗情况,以便更好地提供医疗服务和保险服务。
- 政务信息抽取:政务部门利用信息抽取系统,获取众多的政务文件中的有效信息,使政务服务更加的准确、高效。
4.2信息抽取技术的产业应用案例
4.2.1基于深度学习的信息抽取技术的TextIn合同机器人
在企业签订合同确立合作的业务流程中,合同比对是必不可少的一个环节。合同在文本确定前,往往经历了反复修改、版本迭代,或者存在电子版与纸质版之间的增减差异。在签订合同时,需要确保用印合同与审核通过的合同文本一致,关键信息齐备,以避免范本使用、文本修改、阴阳合同、函证造假等风险。
合合信息推出TextIn合同机器人,基于STR识别和NLP算法,开发出合同关键信息识别与抽取和合同比对两大核心能力,将合同文本进行自动识别与精准智能比对,快速展示差异结果,从而帮助企业降低合同风险,避免重大损失,同时提升工作效率,减少重复劳动,降低用人成本。助力企业实现合同全生命周期管理,在银行、保险、证券、资管、融资租赁、供应链金融等泛金融业务以及企业法务合同审阅场景中都有突出应用。
在合同审阅与管理流程中,不同的合同往往需要抽取不同的关键信息,比如购销合同需要抽取甲乙方、合同金额等信息,租赁合同需要抽取承租方、出租方、租赁费用、保证金等信息,施工合同需要抽取工程名称、工程地点、开工日期等信息,基金合同需要抽取基金委托人、管理人、募集期等信息。
统一的标准化的抽取字段无法满足所有类型合同的抽取需求,故此,TextIn合同机器人推出了“按合同分类抽取信息”的新功能。用户可在“关键信息配置”中,对合同类型进行分类,并针对每一种合同类型自定义创建所需的抽取字段。
将合同按照分类上传后,合同机器人即可自动抽取出所配置的关键信息及印章信息。
核心功能:
- 智能抽取关键信息与印章信息
支持识别图片(png、jpg、jpeg、tif、tiff)、Word、PDF、Excel格式合同,智能抽取关键信息与印章信息。支持按合同分类自定义设置关键信息字段。印章信息涵盖印章类型与主体信息,印章类型包括:公章、合同专用章、法定代表人章、财务专用章、发票专用章、业务专用章。
- 关键信息比对
支持对合同中抽取出的标准信息与自配置信息进行智能比对,快速定位关键信息差异项,一键导出Excel、Word、PDF差异报告。
合同中常常存在大量的表格信息,表格识别与比对也是合同比对中的一项难点。
合同机器人基于复杂的信息抽取和文字检测与识别技术,不仅可以高精度识别不同格式文档中的表格信息,显示全字段比对差异,且对表格比对样式做了优化,按照单元格对内容差异进行对齐与列表显示,便于更清晰直观地锁定合同差异。
应用场景
- 保险合同管理
帮助保险企业将OA系统中通过审核的合同与风险系统中上传的用印版合同进行比对,如存在差异,发出预警,规避合同伪造风险;将承办人提交的合同与同类型合同模板条款比对,提醒差异、缺少情况,如合同模板由对方提供,则提取关键信息,与后台规则进行匹配。
- 银行信贷审批
帮助银行对租赁合同、经营实地场所、农村产权承包证等材料进行印章存在性判存、手写签字判存,对待审议合同与合同模板进行比对,判断条款是否有增、删、改。
- 企业法务审核
帮助企业法务部门对各文档版本的迭代进行管控,便于在双方法务反复修改合同环节提高效率、减少人为错误。
- 采购防范风险
帮助企业采购部门在前期洽谈合同环节中,防范“阴阳合同”、函证造假风险,识别纸质合同上的差异并展示。
4.2.2融合基于深度学习的信息抽取的知识图谱的天元大数据平台
金融风控,面临着信息过载与信息稀缺的双重困境。一方面,由于系统、数据等的孤立,普遍存在信息孤岛,很难获取高质量的信息或者容易产生信息不一致、不完整、片面化,而风控的复杂性又要求对多维度信息的系统性采集、整体性分析;另一方面,来自各外部渠道、各业务条线中的信息庞杂,很难进行数据的真实性、有效性判断,更难对大量数据进行规模化处理,挖掘数据的内在联系。
金融领域数据是典型的具有”4V”特征的大数据(海量Volume、多结构多维度Variety、价值巨大Value、及时性要求Velocity)。
知识图谱,可以通过可视化技术,挖掘、分析、构建、绘制和显示大数据之间的相互联系,很好地解决金融数据应用的难点。 合合信息深耕知识图谱领域10多年,通过复杂的基于深度学习的信息抽取技术,面向银行、证券、保险、融资租赁、供应链金融平台等机构的风控需求,推出了多种关系图谱。这些关系图谱多方位地展示了企业与自然人的投资、任职、担保、诉讼、上下游、疑似等关系,在泛金融企业的授信、投资、反洗钱、反欺诈、尽职调查、监控预警等风控场景中都有重要应用。
- (1)集团关系抽取
利用全量工商股权数据,结合《大额风险暴露管理办法》关联客户识别方法进行建模,抽取企业间的股权投资关系,分析企业集团派系。
- (2)交易关系抽取
结合客户内部交易数据,通过信息抽取和挖掘分析所有的企业交易数据信息,最终得到行内企业交易关系。
- (3)股权穿透抽取
基于大数据计算和信息抽取,精确分析企业背后的股权结构,清晰展示披露至自然人、法人层级的企业全部合伙人情况。
- (4)诉讼关系抽取
利用全量的司法诉讼数据包括立案信息、开庭公告、法院公告和裁判文书等信息,通过信息抽取技术挖掘出企业司法诉讼关系
- (5)事件关系抽取
利用信息抽取技术,根据企业的新闻动态及舆情数据,计算出企业之间的事件关系,输出负面指数高,近6个月内的14类舆情关系。
- (6)上下游关系与竞争关系抽取
利用信息抽取技术,通过供应商公告、招标、投标、中标信息等数据,展现企业与上游供应商、下游客户、竞争对手的关系。
合合信息依托旗下启信宝所汇聚的境内2.3亿家企业等组织机构的超过1000亿条实时动态商业大数据,结合多家头部企业大数据平台建设项目经验所沉淀的业务应用方案与技术方案,基于自研的融合基于深度学习的信息抽取的知识图谱技术,推出了天元大数据应用平台。
数据质量保障机制
通过多种数据采集、清洗与校验手段,依托严格的流程控制,提升数据的全面性与准确性。
数据看板
动态呈现区域内企业布局与发展情况,为金融企业提供对公营销渠道与营销决策数据支撑。
业务首页
聚合应用入口,一键搜索企业与关键人员信息。
核心应用
客户案例
- 某股份制银行
某股份制银行携手合合信息,搭建大数据风险门户,将行内信贷、担保等数据与合合信息旗下启信宝大数据相结合,实现了企业多维搜索、风险智能关联、舆情信息分析、图谱关联分析、信息智能视图、内外风险评估等应用。
上线后,行内有近万名员工使用了风险门户,其中客户经理4500人,风险经理2200人,共有55家分行、子公司通过风险门户排查企业风险情况。员工反馈,风险门户使得业务人员不再需要通过外部第三方平台查询企业相关信息,效率更高,数据维度更丰富,且通过融合行内大数据,使得隐性担保圈链、企业间交易关系等得以跨分行全景呈现,打破了信息孤岛。
- 某经济强市头部农商行
某经济强市头部农商行与合合信息合作,搭建大数据应用门户,满足统一业务部门、经营部门、管理部门、风控部门各业务条线获取数据的平台、渠道、标准,赋能全行数字化转型核心战略。
该大数据应用门户搭载了企业画像、企业图谱、风险监控、数据可视化驾驶舱等知识图谱应用与TextIn财报机器人等智能文字识别应用,满足了多部门的风控、反洗钱合规、营销需求,例如合规法务部的对公客户背景深度透视、反洗钱合规审查、分支行对公业务合规监管,普惠金融事业部的区域对公客户营销、贷前综合审查、贷后综合管理、政策解读与对应产品规划,授信审批部的关联方识别与统一授信、多维度授信核查、监管法规解读与重大风险事项洞察等业务场景中,都能通过该大数据应用门户,获得多维度内外部数据支撑。
4.2.3供应链金融解决方案
供应链金融是指从供应链产业链整体出发,运用科技手段,整合物流、资金流、信息流等信息,在真实交易背景下,构建供应链中占主导地位的核心企业与上下游企业一体化的金融供给体系和风险评估体系,提供系统性的金融解决方案,以快速响应产业链上企业的结算、融资、财务管理等综合需求,降低企业成本,提升产业链各方价值。
合合信息基于智能文字识别技术、启信宝大数据挖掘与知识图谱等能力,已助力多家供应链金融企业在证件单据识别录入、融资企业授信风控、产业链供应链分析上,实现了业务流程自动化、智能化,并有效提升了对上下游融资企业的信用风险控制能力。
证照票据智能识别录入
有融资需求的上下游企业通过供应链金融平台自主提交融资申请时,需要提交企业证照、承兑汇票等资料,便于平台审核。
合合信息提供100+种卡证照识别模块,覆盖金融场景下常见证照类型,如:身份证、银行卡、房产证、营业执照等。其中,身份证识别支持自动判断正反面,自动判断原件、彩色件、复印件;银行卡识别支持全球不同国家、不同行业的借记卡与信用卡,VISA、JCB、银联卡、Master卡、美国运通卡等国内外银行卡皆可准确识别;营业执照识别支持新旧不同版式,自动区分是否为副本、是否为电子营业执照,还可通过API接口调用启信宝大数据,对营业执照进行自动验真,防范证照造假、失效风险。
另外,合合信息还支持对不同版式的电子银行承兑汇票与商业承兑汇票、增值税发票等多类型票据进行智能分类,并高精度识别后自动录入系统,增值税发票支持自动验真,极大地提升了业务效率,释放人力。
平台数据结合外部数据,灵活授信
不同企业提交的融资申请金额不同,供应链金融平台需要根据企业资信对融资金额进行评定。供应链金融中对企业资信的评估,一方面依赖上下游融资企业与核心企业间的交易数据,由此解决了上下游中小微企业信用信息少、信息相对不透明的困境,这些交易数据由供应链金融平台进行采集与标准化,是核心授信数据,另一方面,也要结合外部大数据,对融资企业的工商、司法涉诉、经营风险等进行尽职调查。
企业风险全景尽调
合合信息旗下启信宝汇聚境内2.3亿家企业等组织机构的超过1000亿条实时动态商业大数据,助力供应链金融平台透视企业客户全景信息,多维度风险扫描,覆盖企业工商、司法涉诉、经营、税务、资质、知识产权、企业关系、负面舆情等信息。
供应链金融平台尤其需要重点关注上下游中小微企业的税务风险、司法诉讼、行政处罚等信息,由于中小微企业的抗风险能力较弱,遇到合同纠纷败诉赔款或者停业整顿的行政处罚等,都会对企业经营产生重大影响。
合合信息旗下启信宝提供行政处罚、环保处罚、严重违法失信、立案信息、开庭公告、被执行人、欠税信息等多维度企业动态风险信息查询,并可对多维度风险进行7×24小时实时监控,四级风险预警机制,自定义设置风险等级划分,如发生风险信号,通过短信、邮件、微信、API接口等方式及时推送预警。
合同关键信息抽取,智能决策引擎
供应链金融中涉及到多方之间的多类型合同信息进行录入与审核,如核心企业与上下游企业间的购销合同,融资企业与供应链金融平台之间的质押合同,核心企业与供应链金融平台之间的担保合同。这些合同信息相互间需要进行一致性校验,同时也要与订单金额、应收账款金额等交易数据进行比对审核。
合同关键信息抽取
合合信息推出TextIn合同机器人,可利用基于深度学习的文字检测与识别和信息提取算法,对合同关键信息进行智能抽取。TextIn合同机器人内置预设42个标准关键信息字段抽取,并支持自定义配置抽取字段。
供应链金融平台可基于合同机器人,高效抽取出业务所需的合同信息,如购销合同中的买方名称、卖方名称、合同有效期、合同金额等。供应链金融平台可依照审核项目,对抽取出的合同信息进行“买方是否是核心企业、卖方是否是融资企业、合同金额是否大于等于应收账款金额”等智能决策审批,由此对交易背景的真实性进行审核判断。
除了审核合同文本信息,供应链金融平台对合同印章也要进行审核。首先要确保合同签约主体全部加盖了印章,且印章清晰可辨识,另外需要核对印章名称是否与合同签约主体名称一致。
4.2.4银行信贷业务全流程解决方案
当前,银行信贷业务呈现出客户主体多元化、集团客户跨区域、业务范围跨行业的特征。企业信息识别不充分、客户信用状况层次不齐、企业关联关系日趋错综复杂、贷后风险管理存在时滞,对银行大数据应用能力提出了更高的挑战。
由于银行内多业务条线使用多个独立系统,行内数据存在孤岛,且缺乏外部数据的引入,数据对业务的支撑能力较弱。数据采集手段多依赖人工整理录入,数据更新存在时滞,且效率低、人力成本高。
合合信息银行信贷全流程解决方案基于智能信息提取技术、启信宝大数据挖掘与知识图谱等能力,覆盖信贷拓客、贷前准入调查、贷中授信审批、贷后预警监控四大环节,全流程辅助银行信贷业务。
(1). 信贷拓客
- 专项信贷拓客
在大力发展绿色金融、普惠金融、科创金融、供应链金融的背景下,监管层对绿色信贷、小微企业信贷等专项信贷有考核指标要求。合合信息旗下启信宝基于2.3亿家企业大数据与产业研究,通过精准的信息提取技术,推出多类型优质企业库,帮助银行精准挖掘专项信贷潜客。
新兴产业库:涵盖新农业、新能源、新一代信息技术、节能环保等14大类、1000+细分行业的新兴产业企业名录及地域分布。
绿色产业库:涵盖基础设施绿色升级、绿色服务、清洁能源产业、节能环保产业、生态环境产业、清洁生产产业6大类、30+小类的绿色产业企业名录及地域分布。
科技认定企业库:涵盖工信部、科技部、发改委等发布的科技认定企业名单库,包括高新企业、专精特新、科技小巨人、小微企业、科技型中小企业、火炬计划项目、技术创新示范企业、企业技术中心、科技企业孵化器9大类企业库。
产业链:提供200+产业链专题,涵盖7万多个标准产品,800万家公司,以及产品-产品上下游关系、企业-产品关系和企业-企业上下游关系等1亿条各类产业链关联关系。
- 实时捕捉信贷需求信号
招投标、拟建项目、投融资等企业利好事件都可能成为优质信贷需求信号。在传统对公营销中,这些事件信息的获取依赖与企业高层面谈、实地考察、多方打听,线索获取效率低。
合合信息旗下启信宝“潜客订阅”,提供行业、业务等关键词所覆盖的招投标、拟建项目、投融资信息等订阅服务,并且支持按照地域、注册资本、启信分、空壳风险、违约风险、主体企业风险、关联人员风险、关联企业风险等10个维度进行筛选。在获取信贷线索的同时,完成对潜在目标企业的风控初筛。
存量客户也会持续产生新的信贷需求。但是由于客户经理手上管理维护着大量客户,很难关注到每个客户尤其是长尾客户的潜在需求变化。
启信宝“存客拓新”,通过对银行客户的注册资本变更、新增分支机构、新增融资信息、房地产拿地和资质证书等线索信息的推送,帮助银行及时发现、跟进存量客户的新信贷需求。
(2)贷前准入调查
- KYC查询
KYC即了解你的客户,既是反洗钱合规要求,也是贷前尽职调查的目的。合合信息旗下启信宝推出“KYC”功能,提供场景化的客户信息视图,关键信息一览无余,帮助银行快速了解主体企业及关联人员、关联企业信息,覆盖企业工商、涉诉、经营、资质,人员对外投资任职、涉诉、股权质押等多维度信息。
- 关联关系尽调
在贷前尽调阶段,银行需要对企业的股权结构、股东背景、实控人、最终受益人、关联方、董监高任职等进行多方位识别认定,排查关联风险。
合合信息基于大数据分析挖掘与知识图谱能力,推出股权穿透、控制人关系、受益所有人识别、关联方认定、人员图谱等知识图谱,并可结合行内大数据,跨分行业务信息统一梳理分析,进一步完善担保关系、交易关系、供应链上下游关系等图谱。
基于多维度关系图谱,银行可层层穿透复杂的公司股权结构,准确认定实控人、受益所有人、股东、关联方,识别客户身份,符合监管合规要求;深度掌握企业基本情况、经营情况、信誉情况、担保情况等,为授信审批提供更全面的信息维度。
集团客户统一授信
集团企业需要进行统一授信,集团家谱内的所有企业共享授信额度,防止多头重复授信、过度授信,风险敞口扩大。
银行在集团客户认定实务中,往往存在两类风险情况:1.由于集团关系难以判定,成员企业游离于集团授信之外。2.成员企业发生了股权大额转让,由此导致所属集团变更,银行获取变更信息滞后,导致企业划分至原集团。
合合信息可以基于股权投资、董事任职、银行内部客户数据构建集团关系图谱,当股权等数据发生变化时,系统自动调整集团关系,规避信息获取时滞产生的风险,推进银行集团家谱治理,辅助集团客户统一授信。
贷前审查报告
客户经理在完成贷前尽调后,需要将线上线下调查所得的信息汇总整理成报告。这些信息的渠道来源、可信度、呈现样式可能都不一致,需要进行统一梳理。客户经理往往花费大量时间案前工作。
合合信息旗下启信宝可自动化生成多种尽调报告,包含:企业增值信用报告、企业基础信用报告、KYC报告、董监高投资及任职报告、企业股权结构报告、股权穿透报告、企业商业数据报告、企业动产抵押报告等,系统化梳理庞杂信息,全面提升调查效率。
(3)贷中授信审批
- 财报识别
授信审批需要关注企业财务信息,财报是财务信息的首要来源。银行信贷要求企业提供最近三年的财报,通过分析财报揭示企业一定时期的财务状况、经营成果和现金流量。 合合信息基于自研的智能文字识别、表格识别、自然语言处理技术,推出Textin财报机器人,智能采集、校验、结构化输出财报数据,识别一页财报信息平均仅需2-3秒。 Textin财报机器人操作简便,识别准确率高,支持断表接续,少表格线、无表格线的财务报表也能准确识别。通过智能识别并匹配内置财务准则、科目匹配、试算平衡校验,能高效地将不同文件格式、报表格式的财务数据以统一的标准格式输出,大幅度缩短财报录入时长,规范数据输出格式。
- 企业关系核实与探寻
贷中授信审批,需要对客户经理提交的客户资料与调查报告进行审查,规避因贷前调查不尽职引发的操作风险、道德风险。合合信息旗下启信宝提供企业全景关系图谱——企业链图,360度全景透视企业关系,识别呈现股东、高管、对外投资、裁判文书、法院公告、历史股东、疑似关系等多种维度的企业关系,便于核实调查报告所述的企业关系。
许多企业可能存在隐性关联关系。隐性关联,是企业之间一种表面上不显露关联关系而实际上隐含有投资关系或在经营决策、资金调度或生产活动上存在控制或影响关系的关联方式。隐性的关联风险由于关联性隐蔽、刻意被遮掩,往往很难识别,且涉及到一对多、多对多的排查,排查效率很低。
合合信息旗下启信宝提供“找关系”功能,可批量添加企业或人名,快速获取目标企业、自然人之间基于任职、投资、疑似、上下游关系构建出来的关系图谱,呈现多种关联路径,深度挖掘隐性关联关系。
- 企业信用评级
在综合尽职调查与授信审查中获取到的企业基本信息、资信信息、经营信息、财务信息等各项信息后,银行可以对客户进行评级与授信额度的评定。
合合信息旗下启信宝推出通过对全景全量企业大数据的清洗、挖掘,建立企业评分模型,综合发展潜力、知识产权、企业规模、风险状况、经营质量、资本背景等数据计算得出启信分与行业内综合排名,量化企业风险等级,并给出风险评估建议,辅助信审员进行企业评级。
合合信息还支持将启信宝的企业工商、司法、经营等数据与银行内部客户数据(如订单数据、流水数据、财务数据等)相融合,定制评级授信模型,综合计算评分和等级,测算授信金额,并可根据企业异动情况,实时调整授信金额,防止过度授信或授信额度不足。
- 授信合同管理
为了防范由合同产生的授信风险,银行需要对授信合同进行审慎的审查与管理,避免老客户本次授信方案与前次方案混淆、授信申请人关键信息缺失等各类可能存在的合同风险。合合信息推出Textin合同机器人,基于STR识别与NLP算法,支持智能结构化抽取合同关键信息,并进行关键信息比对,还可进行合同全文比对,支持图片、PDF、word多种格式。
授信合同中抽取出的关键信息,可通过API接口传输至银行信贷系统,自动填单,高效沉淀数据资产。还可根据抽取出的授信申请企业名称字段,自动调用启信宝大数据,实时提示企业风险。
4)贷后预警监控
- 风险舆情监控
贷后管理是信贷风控流程的最后一道抓手。实践表明,客户在逾期前往往都是有征兆的,早发现风险信号,就能早做出分析决策、早采取果断行动。为了实现早期风险预警,银行需要对有贷户的动向和风险进行密切监控,不仅可以在发生逾期前提前预警,预判客户前景,风险前置;也可以在逾期发生后第一时间快速行动,根据客户实时动态判断还款意愿和还款能力,制定策略方案清收,降低不良贷款发生。
合合信息旗下启信宝支持对企业的工商变更、行政处罚、司法风险、违法违规、经营异常、负面舆情等160多个维度的风险信息进行7×24小时全天候监控,其中包含舆情信息监测、全网事件分析、主题词云分析、情感分析等在内的多方位舆情服务。所有风险类型支持自定义划分风险等级,四级预警机制,实时预警提醒。发生风险信号时,可通过短信、邮件、微信、API接口等多种方式推送预警风险经理、客户经理。
- 掌握财产线索有效清收
如若贷款发生逾期进入催收流程,或到了法院强制执行环节,掌握债务人的财产线索,将为银行债务追索提供主动。
合合信息旗下启信宝推出“财产线索”,帮助银行掌握违约客户的财产线索流向,辅助催收工作。财产线索提供企业的资本、股权、动产、不动产、商业收入、无形资产、涉诉资产、对外债权8大类资产类型的疑似流入、流出情况。同时提供财产执行难度建议,辅助催收工作,降低银行损失。
- 黑名单管理与信贷风险传染防控
合合信息旗下启信宝提供黑名单管理功能,银行可以将不良贷款户设置为黑名单客户,通过黑名单标签的形式统一数据输出口径,打造全渠道黑名单预警机制。不同业务条线都可以在行内大数据平台中获取到统一的客户信息,避免因信息孤岛导致其他业务部门与黑名单客户建立业务关系。
贷后如果发生一家企业违约,与它相关联的企业可能也会发生违约,这是典型的因果性信贷风险传染。合合信息赋能银行**基于控股关系、集团关系、产业链上下游关系、供应链关系、合作关系等塑造风险网络**,在贷后风险发生时**智能分析风险传导路径与影响力分值,及时排查风险可能传导到的行内有贷户**,量化判断企业信用风险变化,提前预警,防止大型企业信贷违约后引发大范围、多主体的违约。
(5)客户案例
- 南海农商银行
南海农商银行与合合信息合作,搭建海鹰大数据应用门户,统一业务部门、经营部门、管理部门、风控部门各业务条线获取数据的平台、渠道、标准,赋能全行数字化转型核心战略。
海鹰大数据应用门户搭载了企业画像、企业图谱、风险监控、数字化大屏等知识图谱应用与Textin财报机器人。南海农商银行可通过地图搜索、潜客订阅等批量智能拓客;通过企业画像与标签、关联关系与受益人识别、风险舆情监控等赋能风控尽调;通过财报机器人以智能的文字识别代替传统的业务人员手工整合、加工财报原始数据,提升财报录入与分析效率;数字化大屏为相关人员进行全局统筹和辅助决策提供大数据分析工具,全面支撑各条线业务展开。
- 某股份制银行
某股份制银行携手合合信息,搭建大数据风险门户,将行内信贷、担保等数据与合合信息旗下启信宝大数据相结合,实现了企业多维搜索、风险智能关联、舆情信息分析、图谱关联分析、信息智能视图、内外风险评估等应用。
上线后,行内有近万名员工使用了风险门户,其中客户经理4500人,风险经理2200人,共有55家分行、子公司通过风险门户排查企业风险情况。员工反馈,风险门户使得业务人员不再需要通过外部第三方平台查询企业相关信息,效率更高,数据维度更丰富,且通过融合行内大数据,使得隐性担保圈链、企业间交易关系等得以跨分行全景呈现,打破了信息孤岛。
4.2.5证券五大业务场景智能化
在券商内部,**合规部、风险管理部**等中台部门与**自营业务、资管业务、投行业务、经纪业务、信用业务、研究所**等前台业务部门,都有大量的目标企业信息查询、合规、风控、尽调、投研、营销、舆情监控等大数据需求。
由于各业务部门一般使用不同的系统,各业务中又存在各种角色,如上市公司、融资方、出资方、托管行等,导致大量数据在各孤立系统中产生,很难共享,无法对齐统一。
同时,**券商内部信息往往不能满足业务的全部数据需求**,还需要人工在各类第三方网站搜集汇总。**信息孤岛、信息重复搜集、过度依赖人工与专家经验**,既降低了业务效率、增加人力成本,也容易导致重要风险信息缺失、专家经验无法复用到基层风控岗等痛点。
合合信息支持将旗下启信宝2.3亿家的全景全量企业大数据与券商内部数据相结合,基于数据处理、机器学习、图存储与计算、知识工程、信息检索、信息抽取、文本检测与识别等前沿技术,将内外部数据资源整合转化为能深度利用、赋能业务的多维度知识图谱, 构建券商内部统一的风控合规大数据平台。
券商各业务部门可以高效获取统一的企业多维度数据,深度挖掘企业间关联关系,有效监控风险及舆情信息,从而实现优化风控管理技术、提升企业分析效率、精细企业客群分层、改善业务决策质量等目的。
(1) 信用风险管理
● 业务部门
风险管理部、信用业务部等
内外部数据(含风险信号)统一口径查询与展示
券商需要对经营中的信用风险进行准确识别、动态监测、及时应对及全程管理,如融资融券、股票质押等信用业务需要掌握标的证券、信用客户、交易对手方等的详细信息及动态变化。
合合信息可将券商内部的账户、交易等数据与启信宝全量工商司法税务等数据库相融合,统一业务部门查询企业数据的渠道与数据输出口径。业务人员通过企业名称搜索,也可通过关键词模糊搜索、多条件组合筛选等方式,快速定位目标企业。
搜索企业进入该企业详情页后,业务人员可以查询到企业的工商、股东、董监高、分支机构、股权投资、融资等各维度信息与券商内部信息,内外部信息一站式展示,无需切换系统汇总信息。 风险信号与客户在券商各业务中的身份属性,以标签的形式嵌入到企业详情页中展示,帮助业务人员快速掌握目标客户与本企业间的多种业务关系。详情页一站式收揽经营异常、司法诉讼、行政处罚、诚信失信、破产清算等多来源风险信号。
风险网络塑造,深度捕捉风险传导
除了关注目标企业自身的信用风险,券商业务部门也需要关注相关企业信用风险传导至目标企业的可能性。合合信息赋能券商基于控股关系、集团关系、产业链上下游关系、供应链关系、合作关系等塑造风险网络,通过风险网络,深度捕捉风险传导,当内部客户发生信用风险时,智能分析风险传导路径与影响力分值,量化判断目标企业信用风险变化。
同一客户认定
同一客户认定是券商信用风险管理的关注重点之一,尤其是风险相对突出的融资类业务,需要对集团客户进行统一授信,集团家谱内的所有企业共享授信额度,防止多头重复授信、过度授信,风险敞口扩大。
合合信息提供集团关系图谱,利用全量工商股权数据,结合《大额风险暴露管理办法》关联客户识别方法进行建模,深入挖掘企业间的股权投资关系,分析企业集团派系,助力券商精准识别集团客户。
财报智能识别,提升财务分析效率
财务分析是客户信用风险评估中必不可少的一环。财报可真实系统地揭示企业一定时期的财务状况、经营成果和现金流量,进而帮助券商分析客户的盈利能力、偿债能力、投资收益、发展前景等,为各项业务决策提供数据参考。
合合信息基于自研的智能文字识别、表格识别、自然语言处理技术,推出TextIn财报机器人,智能采集、校验、结构化输出财报数据,识别一页财报信息平均仅需2-3秒,能高效地将不同文件格式、报表格式的财务数据以统一的标准格式输出,大幅度缩短财报录入时长,规范数据输出格式,还可通过对财务指标公式的配置,自动化输出资本结构、偿债能力、盈利能力、现金流量等指标分析,提升财务分析效率。
企业信用报告自动生成
合合信息旗下启信宝支持自动化生成企业信用报告,包含企业的工商、股东、对外投资、司法、风险、年报、知识产权、经营等数据,帮助券商系统化梳理庞杂信息,减少案头工作,全面提升信用评估效率。
02合规监管
● 业务部门
合规法务部、风险管理部等
实控人与受益所有人识别
根据《反洗钱法》与央行《关于加强反洗钱客户身份识别有关工作的通知(235号文)》要求,金融机构需要对建立业务关系的客户有效开展客户身份识别,特别是穿透核查非自然人客户的股权结构,了解客户实际控制人与受益所有人信息。
对于业务较复杂的外商投资企业,尤其是大型跨国企业集团在中国设立的子公司或者合资公司,其境外股东及其关联方之间的相互持股关系往往密如蛛网,要搞清这层层股权结构是一个极其复杂的过程。
合合信息旗下启信宝可系统生成股权穿透、控制人/疑似实控人关系等关系图谱,并基于央行235号文件和反洗钱背景,自动识别并输出企业幕后的受益所有人,提供判定原因与路径,帮助券商准确识别、核对、监控企业实控人与受益所有人信息,并可对接报送系统,符合反洗钱合规监管要求。
异常交易、异常账户监测
《金融机构大额交易和可疑交易报告管理办法》规定金融机构需要建立大额和可疑交易报告制度,对数额达到一定标准的交易,或有合理理由怀疑与洗钱、恐怖融资等犯罪活动相关的交易,应当及时向中国反洗钱监测分析中心报送。
合合信息基于知识图谱能力,可以结合券商内部交易数据,通过挖掘分析企业账户与交易数据信息,最终得到企业交易关系图谱,帮助券商实现一人多户核查、监管账户核查、账户关联分析等合规核查,辅助合规风控人员识别判定异常交易与异常账户。
03舆情查询监测
● 业务部门
风险管理部、信用业务部、投资银行部、证券自营部、资产管理部、办公室等
舆情风险大数据智能收集
券商多个业务部门都需要对企业舆情进行侧重点不同的持续监控:投行业务需要监控保荐企业是否有重大违规、信息披露造假等负面舆情;自营、资管业务需要监控发行人是否出现股东董监高减持、高管变动等现象;融资融券业务需要重点监控影响客户还款能力的负面舆情信息……
传统舆情风险信息的收集方式是通过多个权威媒体、行业网站的关键词搜索,手工摘录信息,加上现场调查后撰写的报告,人工将线上线下所获取的信息进行整理汇集,再由专家进行信用风险判断。合合信息助力券商实现全网企业风险动态自动采集汇聚,扩大线上风险信息来源,与线下调查报告智能整合、分析,将专家经验转化为风控模型,自动研判信用风险,极大程度减少信息收集、判断、应用成本。
企业舆情一站式查询监控
合合信息为券商打造更匹配业务场景的一站式舆情查询与监控预警平台,可提供涵盖2.3亿家企业的全网舆情信息汇总与可视化分析,包含90多个维度的全网舆情监测、主题词云分析、正负情感分析、来源权威等级分析、负面舆情指数分析。
券商业务人员输入监控企业或其关联企业名称,就可以直接查询到相关企业舆情,每条舆情信息都有正负中性情感标签、来源权威标签与监测维度标签,负面舆情的负面程度指数化呈现,便于对舆情进行快速筛选与查阅。另外,还支持定制交易所处罚信息专项检索,输入关键人员姓名、股票名称查询企业舆情等功能。
当监控企业发生负面舆情时,实时预警,动态推送,通过微信、邮件、短信等多种方式推送至业务负责人,做到对客户的热点舆情、突发事件快速发现与及时应对。
券商声誉风险管理
除了监测企业客户舆情,券商也需要关注自身舆情动向,防范声誉风险。券商办公室可以将公司、分支机构、子公司添加至监控企业列表,系统7×24小时全天候监控舆情,统计分析舆情情感偏向与数量变化,负面舆情及时推送预警。
04尽职调查&投研
业务部门
投资银行部、研究所等
15+企业关系图谱穿透核查
券商的证券发行上市保荐业务中,需要对保荐企业尽职调查,控制和降低保荐风险;券商研究所发布投研报告,需要对目标上市公司进行深度调查分析。这些业务都需要对目标企业的族谱、股权关系、投资关系、高管、股东、实控人、受益所有人等多维度信息有穿透性了解。由于许多上市企业的股权、控制权结构关系错综复杂,穿透核查难度大、花费时间长。
合合信息基于大数据分析挖掘,提供多种企业关系图谱,包括:股权穿透,精确分析企业背后的股权结构,清晰展示披露至自然人、法人层级的企业全部合伙人情况。关联方认定,根据上交所、深交所、企业会计准则中对关联方的认定规则,计算得出企业关联方关系。 企业链图,根据企业工商、司法信息,计算出企业的股东、高管、对外投资、司法案件等信息,形成企业全景概览。 企业关系图,结合人员的投资任职关系、企业的投资关系数据计算得出跟目标企业有关联的企业或自然人。
此外,还有控制人关系、受益所有人关系、集团关系、交易关系、担保关系、疑似关系、上下游关系、竞争对手关系等15+种企业关系图谱,帮助尽调投研业务高效获取企业全景信息,节约深度调查时间。
个人关系图谱分析关键人员
除了构建企业关系图谱,合合信息还可助力券商对企业的实控人、受益所有人、股东、高管等关键人员构建个人关系图谱。个人关系图谱可用于尽职调查、合规风控、关键人营销等多种业务场景。
合合信息支持将关键人员的担任与历史担任法人、高管、股东的个人关系图谱与券商内部信息(如客户手机号、住址、客户号等)相结合,并且可以根据内外部信息的关联性分析展示人员间的多种推理关系(同事、亲友等)。
05营销拓客
业务部门
风险管理部、投资银行部、经纪业务部等
客户画像构建
合合信息依托大数据分析挖掘与知识图谱构建能力,可以结合内外部数据构建券商已有客户画像,通过建模挖掘、推荐相似画像的潜在客户,推荐匹配客户与产品,可用于券商客户营销分析、客群发现、薅羊毛客户甄别、潜在客户挖掘等场景。
多渠道精准拓客
券商多业务部门需要拓展不同属性特征的对公客户,比如投行的FA业务,主要服务初创企业和成长中未上市企业;债券业务,更倾向于央企国企。合合信息提供多种拓客工具,帮助券商批量、精准获取潜客名单,高效承揽展业。
4.2.6能源行业智能解决方案
随着“双碳”目标与“十四五”规划的有序推进,构建清洁低碳、安全高效的能源体系,成为我国保障能源安全和促进高质量经济发展的关键战略。“数字化+可再生能源”成为能源行业发展的主旋律,意味着能源革命与数字革命融合已是必然趋势。
数字化技术正在深刻地改变能源体系,通过优化能源生产、传输、交易和消费环节的资源配置能力、安全保障能力和智能互动能力,从而实现能源企业数字化、智能化运营管理。
近期,中广核、中国铁物、中国石化、国家电网等多家能源央企明确表示,将数字化转型工作定为“十四五”时期的重点任务,同时公布路线图,为其他能源企业做出了表率和参考。
合合信息智慧能源解决方案,基于人工智能与大数据为代表的数字技术,通过在新能源产业布局、客商管理、用户服务、内部管理等领域的数字化转型,驱动能源企业重构业务模式、变革管理模式,实现产业的转型升级和价值增长。
01调整能源结构,布局新能源
双碳目标下,光伏、风电、核电等新能源市场无疑迎来了更广阔的的发展空间。对于大型能源企业而言,需要做好提前布局和谋划,主动调整能源结构,布局新能源开发、新技术研发应用、能源服务等领域。
合合信息旗下启信宝推出240+产业链专题,其中包括了:光伏、风电、生物质发电、核电、地热能、页岩气、氢能等新能源产业链。
能源企业可通过交互方式查看各产业链的上中下游各个环节、对应企业、地域分布等情况,准确把握产业链整体布局以及产业-企业隶属关系、产品-产品上下游关系、企业-企业上下游关系。还可结合企业评分、企业标签,综合筛选出优质产业链企业,以此拓展上下游合作伙伴,赋能供应商寻源、合作项目开拓等业务。
以光伏产业链为例,产业链上游为矿产、硅料、硅产品、辅助材料、光伏设备;中游为电池片、电池片辅材、光伏组件、组件封装辅助材料;下游为光伏电站、光伏建筑、光伏发电系统集成、光伏发电系统支撑设备、光伏产品检测认证。启信宝光伏产业链专题中,共包含49997家企业,上中下游环节所涉及的企业数量依次大幅增加,产业链呈金字塔形结构。
全国范围来看,江苏省拥有7359家光伏产业链企业,占全国的14.72%,在上游环节和中游环节中占据明显优势。在下游应用环节,山东省独占鳌头,拥有3999家光伏产业链下游企业,尤其在集中式光伏发电站、太阳能发电运营维护等领域表现尤为突出。
启信宝产业链专题可全景式显示产业链各环节对应的企业名单,支持按照产业链相关度、启信分、注册资本进行排序,还可基于企业资质进行筛选,助力能源企业快速高效地锁定目标区域的潜在优质合作伙伴,降低遴选时间成本。点击企业名称即可查询企业详情:工商信息、经营信息、知识产权、风险信息等,一站式洞察企业实力与风险,在寻源拓客的同时,完成初步的准入调查。
02合作商风险管理
大型能源企业往往是综合性集团,业务覆盖范围大,这也导致了能源集团内部的系统林立,甚至可以数以千计。比如据报道中石化内部就大约有1000多套系统,一般是由业务部门提出需求后,技术部门实现,但系统建成后,就形成了一个又一个的孤岛,信息无法互通共享,成本居高不下。
多元化的业务类型使得能源企业的合作商数量众多,但缺乏统一的数据平台,又使得各部门的合作商信息难以互通,常常存在相互矛盾,难以做到统一管理、风险控制。
合合信息助力能源企业基于合作商资质证件OCR、全景企业信息查询、关系排查、风险监控等能力,实现合作商全生命周期风险管理。通过集团层面建立统一的大数据查询平台,使得各分/子公司、业务部门可以查询、获取到多维度企业商业信息,并保持信息的动态更新与全口径一致,赋能全业务场景。
准入调查与资质审查
在准入阶段,可透视合作商全景企业信息,涵盖工商、司法、税务、知识产权、资产、舆情等多个维度,高效审查准入资格,包括工商与资质信息是否满足入围要求、资质证书是否齐全、是否有潜在重大风险等。
对合作商提供的各类资质证件可进行批量OCR智能文字识别,信息自动采集录入系统,并根据企业名称调用启信宝中的企业信息,系统智能比对基本准入要求与合作商资质之间是否匹配。还可自动生成供应商/经销商准入审核报告,提升尽调效率。
招投标合规管理
在招标阶段,可对投标供应商的内外部多种关联关系进行合规排查,如:排查供应商与已有供应商关系,避免一家独大;排查供应商与黑名单企业的关系,避免黑名单企业利用关联企业投标;排查供应商与企业内部股东高管的关系,避免商业贿赂、利益输送等风险;排查多家投标供应商之间的交叉持股、董监高相互任职、同集团企业等关系,规避围标、串标、陪标等风险。
风险监控与关联风险传导
在合作商履约阶段,对供应商的工商变更、行政处罚、司法风险、经营异常、负面舆情等维度信息进行7×24小时风险监控,自定义四级风险预警,实时预警,风险前置,防止因合作商的重大风险事件导致供应链突发性断裂、企业声誉受损等。
如发生风险信号,通过微信、邮件、短信、站内信等多种方式推送至业务负责人,还可基于由多种企业关联关系构建的风险传导网络,智能判断合作商风险事件可能造成的扩散影响。
03业务线上办理,提升用户体验
为了更好地服务能源终端用户,许多能源企业推出了APP服务,在APP上用户可自主完成开通服务、缴费、查询等操作,不需要去线下营业厅排队即可完成操作,实现了线上办、一证办,大幅度提升了客户满意度,也减轻了线下服务压力。
合合信息基于自研的智能文字识别技术,助力能源企业在APP中集成对银行卡、身份证、营业执照、增值税发票等证件材料的识别能力,实现信息的快速自动提取与录入。用户只需要在APP中上传材料图像,系统即可完成图像优化、结构化提取、信息填单、真实性校验等一系列自动化操作,免去了线下办理与人工数据处理的繁琐与低效,也更符合疫情期间“无接触服务”的趋势,实现了数字化基础设施升级。
典型服务场景
- 居民场景
居民可通过身份证与银行卡上传识别、人脸识别与活体识别,注册APP实名用户,快速完成信息认证与绑卡,可在线上进行充值、缴费、查询以及衍生的投保、购物等业务办理。
- 企业场景
企事业单位可通过营业执照、票据上传识别,便捷地开通并使用企业缴费、电子发票等服务,并可提供用能分析、金融等衍生服务。
- 新能源客户场景
光伏客户可通过身份证与银行卡上传识别,获取能源企业APP提供的建站咨询、光伏报装、补贴结算等服务。 04数据资产化,内部管理更高效。
能源企业在经营中会产生大量的业务文档,包含:单据、发票、证件、合同等,这些文档如果仅以纸质版或扫描图片版的形式存在,不仅管理困难,也会因难以检索,无法发挥其数据价值,亟需电子化。
比如仅在供应商管理这一项业务中,供应商注册时,需要将供应商营业执照与资质证件信息录入系统;与供应商签约时,需要对采购合同进行审阅,用印合同电子化管理;供应商清账时,需要录入发票信息,对订单、发货单、发票信息进行三单校验与审批。
上述业务流程如果单纯依靠人工进行信息采集与录入、核对,需要耗费大量人力,效率低下且易出错。
合合信息基于自研的复杂场景文字识别、复杂表格识别技术与先进的AI算法,为能源企业提供多种成熟的OCR产品,涵盖通用文字识别、通用表格识别、100+种证件识别、票据识别、合同识别与比对等。对图片、面单、证件、文档、表格等场景中的印刷体与手写体,都有高精度识别能力。
支持一站式识别增值税发票、机打发票、定额发票、银行回单与进账单、磅单、POS小票等票据;识别身份证、银行卡、军官证、驾驶证、行驶证、营业执照等证照;识别多表格、无框线或紧密表格线等复杂表格;对于包含印章的文档,还可进行印章的存在性判断与印章强化、展平、提取、消除等处理,帮助能源企业高效实现内部文档电子化,业务证件审核与信息录入归档自动化,大幅度提升业务效率。
对于非标
联系人: | 透明七彩巨人 |
---|---|
Email: | weok168@gmail.com |