忽如一夜春风来,“沉睡”数据似花开。9月22日,安全环保院HSE信息中心数据分析人员,打开“QHSE文本语义识别系统”,点击“加载数据”按钮,再点击“生成智能报告”,只需5秒钟,便可生成图文并茂的报告。
“与传统的人工数据分析方式相比,‘机器’分析效率提升了近4000倍,更重要的是将安全管理人员从繁杂的数据分析工作中解脱出来,让他们有更多时间专注于提升知识、技能空间。” HSE信息中心主任吴顺成说。
吴顺成说的这种“机器”,是他们的新近攻关成果“基于大数据的石油石化行业HSE风险智能管控新模式及关键技术”。通过石油石化联合会专家鉴定,这项技术整体达到国际先进水平。
据了解,我国石油石化企业各类信息系统产生了海量、业务类型丰富的文本数据,约占数据总量的75%,由于缺乏分析手段,大多数文本数据的应用止步于数据上报、人工查阅,加上分布在不同的归口管理部门,数据“孤岛”现象突出。据分析,过去20年,65.9%的事故与风险辨识不全面有关,亟须构建集成化的全产业链“业务+安全”数据池,研发面向石油石化企业的文本挖掘技术,将非结构化的文本数据转化为结构化的风险信息。
项目组经过对“沉睡”了近20年积累的海量文本数据进行3年科技攻关,构建了石油石化领域词典构建工具,积累了14万条领域专业词典,定制化研发了系列石油石化领域语义识别模型。从“业务”和“安全”全面发力,积极构建“业务”和“安全”深度融合的HSE风险管控新生态,解决了文本数据深度挖掘的问题,实现了非结构化数据向结构化风险信息转变、由局部认知到系统认知转变、由“事故潜在风险信息”到“风险预警信息”转变。
据悉,定制化石油石化领域语义识别模型赋予机器“文本阅读理解”能力,替代安全管理人员阅读各类文本数据、提取风险信息、进行各维度风险量化分析,最后撰写分析报告。现在只要输入excel格式的问题检查表、word格式的事故事件报告等文本数据,就可以“一键”搞定。
“目前,这一成果不仅为完成单位带来上千万元的项目合同收入,还为3家应用企业每年节约人员用工成本约2000多万元。”项目主要完成人阎红巧说,更重要的是能够使管理者从安全生产“宏观”把握向“微观”运用、从严格监管向风险主动预测的转变转型升级。