摘要:
针对油田区域数据湖跨业务域数据资源集成时,需要解决数据项之间的同名异义、异名同义问题,提出基于关键字的数据元语义描述方法。利用数据元中的对象词、特性词、表示词、限定词作为关键字,采用关键字集合表达数据元的语义,描述数据模型的语义,提出基于数据元名称编辑距离相似度与关键字项集相似度相结合的数据元语义相似度计算方法,将相关方法应用到油田区域数据湖建设中,给出数据元字典构建方法和基于关键字的数据元语义的数据模型映射方法。结果表明:基于关键字的数据元语义描述方法,不需要领域本体,简单易用,可提高数据映射的效率,适合工程化应用。
基金资助:
中国石油冀东油田分公司科技攻关项目(JDYT-2020-JS-50311);
专辑:
工程科技Ⅰ辑;信息科技
专题:
计算机软件及计算机应用
分类号:
TP391.1