是什么
能对证券公司资产证券化发行说明书进行自动分析,提取出证券化业务关注的结构化信息。
能干啥
资产证券化发行说明书,大多以pdf格式存储,文档篇幅较长,阅读费时费力。对于证券业务分析人员来说,往往只关心发行说明书中的某些关键点。从发行说明书中自动提取分析人员关注的结构化数据、表格数据、关键图表,将大幅提高分析人员的工作效率,还可利用发行说明书建设资产证券化结构化数据库,提高数据综合分析能力。
服务实现的功能,主要包括:
1、资产证券化发行产品信息的结构化提取。从发行说明书中自动提取与发现产品相关的30多个产品属性字段,如产品名称、发行规模、原始权益人等。
2、资产证券化发行产品信息的关键图表抽取,如交易结构、现金流支付机制等。自动定位发行说明书中各类图表的位置,将图表信息自动生成为独立的图片。服务支持以图片格式保存的pdf格式的图表抽取。
3、资产证券化发现产品的关键表格数据抽取。自动定位发行说明书中各类表格的位置,自动识别表格中的行、列数据,形成key-value的数据值对,同时支持将key-value数据对还原出原始表格格式。服务支持各种格式表格提取,如无边框表格、无内线表格、只有行线表格等,支持以图片格式保存的pdf格式的表格抽取。
4、支持对资产证券化产品的模型分析。自动根据上述结构化数据实现模型推演。如证券情景分析,用于计算损失、内部收益率、损失临界值等;证券和资产池本金偿付模型;利息偿付模型;是否启动触发事件等。服务支持模型的定制输出。
还有啥
除了资产证券化发行说明书信息提取的服务以外,泰岳语义工厂还提供了PDF文档结构化、PDF表格提取、业务文档阅读理解、证券业务文档碎片化、公告分类、股票发行说明书结构化。
在哪用
资产证券化结构化数据的自动构建,可将大量证券化发行说明书,自动加工成结构化数据,提高数据库构建的自动化能力,减少人工工作量。
资产证券化分析,服务于相关的证券分析师,分析师节省了阅读发行说明书的繁琐工作,专注于对结构化结果的分析和统计比对等工作,大幅提高了分析师的工作效率。
啥特色
完善的机器学习模型,对上万篇证券业务文档进行自动学习,形成了证券文档的机器学习模型,模型对证券领域的词汇、句子均具有较高的识别能力。
发行说明书结构化提取准确率高,用户无需进行数据标注,无需进行后处理,完全一站式解决文档的自动加工,提高效率,减少人工投入。
不需拥有专业的NLP技术,掌握海量证券行业文档快、准、狠!