数据交叉融合应用
CROSS-DISCIPLINARY DATA INTEGRATION & APPLICATION
关于数据交叉融合应用

          国家基础学科公共科学数据中心(简称“国家基础数据中心”)大力促进数据分析挖掘、交叉融合应用,跨领域数据融合、数据与领域技术融合,促进不同生态系统研究与应用的合作和资源及数据整合,促进实现跨学科、跨领域的合作研究,提升科学数据对科研创新活动的支持能力。同时积极推进跨学科领域的资源融合、技术融合等,具体进展如下:


(1)跨领域数据融合,深度挖掘资源应用价值

          国家基础数据中心资源类型涉及物理、化学、材料、植物、动物等基础学科,是诸多领域研究的重要基础。中心推动基础学科数据同相关学科数据融合,形成合力,通过跨领域应用,激发出基础科学数据的深层次价值。

          核物理数据+计量。核物理主题库联合中国计量科学研究院共同提供的放射性活度计量用核素衰变数据已用于辐射防护、电离辐射计量等领域,成为重要的标准参考数据。

          光学数据+应用设计。光学主题库与国内光学学科应用和设计单位(南京理工大学、兵器205所、北京理工大学、长春理工大学、上海光机所、国防科技大学、西安电子科技大学等)、与国内光、机、热多学科联合仿真分析研究单位(索辰公司等)密切合作,实现光学数据的领域应用和提升。

          化学数据+稀土/核燃料循环/三废处理。化学主题数据库多年来,一直积极促进与稀土、核燃料循环以及三废处理等不同领域和学科的交叉融合应用,如支持服务京津冀三废处理项目。三废处理方面,以化学主题数据库为基础,结合长期形成的数据管理、分析和应用经验和技术,结合化工过程系统工程原理和方法,开展钢铁工业园区水网络全局优化研究。对国内典型钢铁园区现有供水种类、关键用水点用排水操作参数以及水处理单元操作参数调研数据的基础上,形成专题数据集,分析园区用排水特征;结合园区拟考虑的工艺过程节水、废水处理技术、废水回用及水网络结构调整等方面的情况,设计不同园区水网络优化情景案例,利用资助开发钢铁园区水网络多尺度优化模型和全局优化求解方法,对园区水系统进行优化分析,为园区水网络的优化决策提供参考和支撑,并直接服务于企业(山西安泰钢铁),取得了良好的效果。


(2)数据与领域技术融合,激发数据新价值

          射电天文数据+人卫激光测距技术。由于VLBI在测地领域中高精度测量数据的优势,通过与国家地震局合作,在中国大陆构造环境监测网络(陆态网)中,与人卫激光测距(SLR)技术联合,辅助卫星导航定位系统(GNSS),共同组成中国大陆的高精度、高时空分辨率的观测网络,可监测我国大陆岩石圈、近海、近地空间的物质结构和四维构造形态的变化,认知现今地壳运动和动力学的总体态势,以服务于地震预测预报为主,同时服务于军事测绘保障、大地测量和气象预报,兼顾科学研究、教育发展、社会减灾和经济建设。

          生物数据+深度学习技术。结合深度学习技术的物种识别一直是国家基础数据中心的特色应用,在“花伴侣”、“识花君”等植物识别工具成功的同时,动物主题数据库联合百度AI、中国科学院计算所等单位,进行学科交叉研究,利用深度学习方法对鸟类图像进行建模,目前能够识别1000多种中国鸟类、200种中国蝴蝶,开发并上线了“生物记”APP,为公众参与生物多样性调查提供平台。动物主题数据库中的物种数据也作为“生物记”中生物百科模块的一部分为公众提供服务。“生物记”APP也被新华社进行了报道,并被各大媒体进行转载。干细胞与代谢疾病数据库联合生物岛实验室共同推进国家生物信息中心粤港澳大湾区节点的建设,依托区块链、大数据、人工智能、5G等新兴信息技术,采集包括生物医学数据、临床数据、基本公共卫生数据、个人健康数据等不同类型的数据,实现医疗数据与生物数据的高度融合,为科研应用提供优质的数据资源。

          化学数据+高精尖仪器。面对保健品市场违禁添加难以判断的问题,应用化学数据库联合国家电化学和光谱研究分析中心组织精兵强将,联合使用超高效液相色谱-四极飞行时间质谱仪、高效液相色谱仪,紫外-可见分光光度计等多种科学仪器,辅以应用化学数据库中的质谱数据库、生物活性数据库终于在有限的时间内成功破解谜团,非法添加物系具有促排便功效的——乳果糖,此类添加物极性大,成分简单,极难监测,应用化学数据库助力先进仪器,凭借工作人员高超的技术能力和准确的判断力,配合公安部门让违法添加无处遁形,非法厂商受到了应有的惩罚,广大人民群众的利益得到维护。

          核数据+计量学。中国核数据中心联合中国计量科学研究院共同提供的放射性活度计量用核素衰变数据已用于辐射防护、电离辐射计量等领域,是重要的标准参考数据。

          宇宙学数值模拟数据+图像处理技术。宇宙学数值模拟数据库通过图像处理中构建光滑点扩散函数技术可以构建所有图像领域的PSF并不仅限于天文学图像处理。同样,PSFdeLRSA欠采样信号的反混叠和PSF的反卷积技术也可以在普通数码相机、甚至摄像头的多次曝光图像(视频)处理中大有用武之地,用以识别被模糊化的目标,比如被运动模糊的车牌,嫌疑人的面部等。