首页  科学研究
科学研究

研究方向之一: 大数据统计学方法理论研究

    随着“大数据”时代的到来,统计学因其在自然科学各个领域的精彩应用获得了引人注目的长足发展,它的许多分支如随机过程、非参数与半参数统计、回归分析和时间序列分析等在教育、航空航天、电子工程等领域有着广泛的应用。本研究方向的主要研究内容有:

1)可靠性理论与异源性数据分析:研究工作主要集中在用随机序列工具研究异源性数据的卷积、次序统计量和样本间隔的统计性质,并探讨这些统计模型在教育大数据中的应用。

2)统计过程控制:应用统计方法对过程中的各个阶段进行实时监控,尽快诊断出异常并及时调整,从而达到改进与保证质量、降低成本、增加效率的目的。现代的统计过程控制研究趋势要更好地将新的统计方法和工程背景相结合,利用现代科技资源来更有效地处理复杂数据的监控和诊断,而这些在线大规模、高维以及超高维、复杂数据的采集和处理以及SPC方法的应用都离不开大数据实验室这样一个平台。

3)非参数统计与数据挖掘:研究超大规模数据分析、文本数据挖掘、相关性分析、高维数据处理与分析等,其中高维数据处理是目前基于大数据时代的一个热点研究方向。非参数与半参数回归模型分析、生存数据分析与变量选择等问题。同时非参数与半参数回归模型分析、生存数据分析与变量选择等也是重要研究课题。

研究方向之二: 大数据分布式处理技术研究与平台开发

    大数据的主要处理手段是分布式计算,在充分利用在分布式计算取得的成果基础上,深入研究大数据存储、检索和处理的分布式计算实施方法;利用分布式计算平台,开展图像处理、电大目标电磁分析、生物统计等方面的研究和应用。具体研究内容包括:

1)混合多级并行理论研究:课题成员世界上首次提出并付诸工程应用的四级并行方案该方案充分利用了计算机集群、多节点计算机、多核CPU以及矢量单元的优点作大数据的并行处理。同时也使用了包括MPIOpenMpSEE以及MIC的并行处理技术。针对大数据处理问题,将在网络优化、硬件加速技术(CUPGPU加速)、Phi 协处理器加速、矢量单元加速等方面深入研究,实现并行度高的混合多级并行。同时也将研究和加强网络数据存储、网络数据传输、网络数据处理以及网络数据安全等。

2)大数据处理系统平台开发:建立在已有的系统平台基础上,进一步优化网络和并行效率,提高大数据处理平台的性能特性;开发具有自主知识产权的集群管理软件,大数据存储和检索管理系统;优化硬件系统性能降低硬件成本,研究数据加密技术。自主研发一体化大数据处理机、一体化大数据工作站、大数据处理单元, 实现大数据并行快速处理、海量存储和检索等功能,进行批量生产。

3)大规模科学与工程计算:面向国家重大需求、高新技术产业发展和国际科技发展前沿,围绕高性能计算,重点开展高性能计算的算法理论与算法设计分析、软件工具环境以及典型科学工程领域的应用等方面的研究工作。该实验室面向科学研究领域(大规模科学计算、计算电磁学、计算流体力学、计算物理、计算化学、生物信息学等)、相关的并行计算和软件支撑服务、产业(手机辐射模拟、计算机辅助设计等)以及政府公益服务(信息处理等),充分发挥高性能计算在企业中的应用,提高其对企业创新的推动作用。

研究方向之三: 教育大数据研究与开发

    针对当前的社会需求,利用先进的大数据理论和方法解决实际问题服务社会。

1)中小学微课互动系统:中小学微课平台将基于现有的教学大纲和知识点基础上,通过与徐州市教育局合作以及与优秀教师签约合作,开发优质微课资源,通过中小学微课平台,实现优质资源共享,缩小城市、郊区、农村的教育资源差别,提高我国学生的整体教育素质。

2)学者学术网络分析模型:按照西方的大学评价体系评价中国大学,对中国大学是不公平的,从而造成了中国大量优秀学生生源的流失。制定符合中国实际的大学评价系统势在必行。本课题的主要目的是通过大数据技术,挖掘世界学者的学术网络信息和发表论文信息对一个学者进行公正客观的评价。计算每一个学者的贡献之后,对大学每一个专业进行排名。学者学术网络是通过挖掘学者发表论文合作者网络,作为评价学者的学术影响力的重要因素之一。考虑二级学术网络,可以更加全面地反映学者的真实学术网络影响力。


最新信息
江苏省教育大数据科学与工程重点实验室版权所有 Copyright©2016