Differences between revisions 12 and 13
Revision 12 as of 2021-06-25 03:24:18
Size: 10255
Editor: ZhangYong
Comment:
Revision 13 as of 2021-06-25 05:46:54
Size: 9062
Editor: ZhangYong
Comment:
Deletions are marked like this. Additions are marked like this.
Line 10: Line 10:
信息国研中心大数据团队(信息技术研究院WEB与软件技术研究中心)的宗旨是立足于国家信息化战略需求,面向信息化建设和发展前沿研究和关键应用,为我国经济和社会可持续发展的重大信息化支撑软件项目和产业提供核心技术的咨询、设计、研发、监理等支持和服务。研究中心的总体战略是以国家信息化建设和信息产业发展为导向,注重可持续发展,积极开展国内外的交流与合作,研发具有自主知识产权的应用支撑软件和系统,努力成为国家相关产业信息化核心技术及支撑软件研发的领先者。 信息国研中心大数据团队(信息技术研究院WEB与软件技术研究中心)的宗旨是解决国家信息化建设过程中数据科学与工程研究问题特别是其中的“卡脖子”工程问题——国产数据库系统主要任务。总体战略是以国家大数据发展战略为导向,注重可持续发展,积极开展国内外的交流与合作,研发具有自主知识产权的国产数据库系统和大数据支撑平台,努力成为国家相关产业信息化核心技术及支撑软件研发的领先者。
Line 12: Line 12:
研究中心的研究方向包括两个方面:(1)面向复杂应用环境的大数据管理与分析;(2)面向在线教育和智慧健康/医疗等领域的个性化服务。 研究中心与国内外多所大学及科研机构有密切的学术交流,并于2013年通过国家“千人计划”引进了美国亚利桑那大学的陈炘钧教授( http://ai.arizona.edu/hchen/ )。陈教授是IEEE和AAAS院士,美国NSF "Smart and Connected Health"国家计划的首席科学家,亚利桑那大学校董,在论文发表方面其2012年h指数为67,是美国计算机学会管理信息系统会报(ACM TMIS)和施普林格安全情报学期刊(Springer Security Informatics Journal)的主编,以及十个国际学术期刊的编委。 团队的研究方向包括两个方面。
 1. 数据库关键技术研究和国产数据库系统;提出面向列存储的基于稀疏索引的增量压缩方法,研发了国内第一个列数据库Huabase;提出行列混存的自适应物理优化方法,在提高相似查询的速度(提高2倍以上)和近似查询的存储开销(降低了1个数量级以上)方面处于国际先进水平,研究成果发表在A类期刊TKDE及会议ICDE上。受铁道部委托,考察投标单位IBM基于Z系列的订票系统,提炼其高负载和低延迟等核心技术并开发原型,为12306自主研发提供了核心支撑。与上海证券交易所联合,提出了可折叠的多Paxos的低延迟方案,将订单复制延迟降低到百微秒级。【加区块链的相关内容】
 1. 面向领域的大数据管理与分析:面向数据和知识密集型的应用领域如医疗健康、电子政务、数字图书馆和在线教育等,能够在提供通用大数据管理的基础上,针对不同应用领域的数据特点和服务需求,提供可配置、易扩展的数据管理和分析功能,从而有效支持特定领域的具体应用。针对多个机构中的数据来创建电子身份证,提出了EAID-PKI安全模型,比传统模型的安全性和凭证性得到综合增强;参与国家标准规范建设,提出了目录和交换体系,以及政府信息化架构,规范了共享交换领域占比最多的非结构化数据的管理与服务关键环节共性要求;从共享的基础设施和硬件层面提出了高性能安全存储的方法,形成可信固态硬盘技术方案,对性能的影响控制在运行总开销3%以内。
Line 14: Line 16:
研究中心的核心成果是华鼎大数据管理和分析平台,包括5大核心服务组件及一系列共性基础构件:(1)华鼎-L:基于元数据集群的分布式文件系统;(2)华鼎-U:基于数据标签的非结构化数据管理 ;(3)华鼎-C:基于列式存储的结构化数据管理 ;(4) 华鼎-K:提供知识管理、大规模并行数据挖掘和分析;(5)华鼎-S:安全隐私管理;(6)消息中间件;(7)分布式计算框架;(8)分布式协作服务;(9)数据ETL工具;(10)日志工具等。

研究中心目前在智慧健康领域(多源异构数据融合、全流程数据管理、个性化健康服务、健康管理决策支持等)、智慧教育领域(智能题库、精品课堂、在线课堂、在线辅导等)、互联网金融领域(在线营销、风险管控、用户分析、信用管理等)开展了深入的研究探索和应用开发工作,取得了卓有成效的进展。目前已经先后与国内外30多个企事业单位展开研发合作。于2013年成立了校级的“清华大学-河北心神信息技术有限公司信息化系统工程联合研究中心”,针对在线教育、智慧健康医疗和智能交通枢纽等领域的国家重大需求和合作公司提出的技术难题,产学研相结合开展前瞻性和基础性的理论和方法研究,研发新一代信息技术(包括物联网、云计算和大数据等)在行业信息化的示范应用,形成具有自主知识产权的共性技术和核心系统,服务于我国的教育、医疗和交通的信息化建设事业。2015年成立了“清华大学(信研院)-北京倍肯恒业科技发展有限责任公司智慧健康大数据联合研究中心”针对智慧健康等领域的国家重大需求和甲方提出的技术难题,产学研相结合开展前瞻性和基础性的理论和方法研究,研发大数据的存储、管理、分析和服务技术在智慧健康领域中的实际应用,形成具有自主知识产权的共性技术和核心系统。

研究中心注重学科的交叉和集成,积极开展与国内外机构和企业的研发合作,主持并参加了国家和省部级的科研项目,取得了突出的研发成果,主要承担了国家973项目、国家863项目、国家科技支撑计划、国家自然科学基金、中国下一代互联网示范工程(CNGI)、铁道部基金等国家级的科研项目。
团队注重学科的交叉和集成,积极开展与国内外机构和企业的研发合作,主持并参加了国家和省部级的科研项目20余项,取得了突出的研发成果,主要承担了国家重点研发计划、新一代人工智能重大项目、国家973项目、国家863项目、国家科技支撑计划、国家自然科学基金、中国下一代互联网示范工程(CNGI)、铁道部基金等国家级的科研项目。

1. 中心教师

2. 中心简介

2.1. 中文

信息国研中心大数据团队(信息技术研究院WEB与软件技术研究中心)的宗旨是解决国家信息化建设过程中的数据科学与工程研究问题,特别是其中的“卡脖子”工程问题——国产数据库系统为主要任务。总体战略是以国家大数据发展战略为导向,注重可持续发展,积极开展国内外的交流与合作,研发具有自主知识产权的国产数据库系统和大数据支撑平台,努力成为国家相关产业信息化核心技术及支撑软件研发的领先者。

团队的研究方向包括两个方面。

  1. 数据库关键技术研究和国产数据库系统;提出面向列存储的基于稀疏索引的增量压缩方法,研发了国内第一个列数据库Huabase;提出行列混存的自适应物理优化方法,在提高相似查询的速度(提高2倍以上)和近似查询的存储开销(降低了1个数量级以上)方面处于国际先进水平,研究成果发表在A类期刊TKDE及会议ICDE上。受铁道部委托,考察投标单位IBM基于Z系列的订票系统,提炼其高负载和低延迟等核心技术并开发原型,为12306自主研发提供了核心支撑。与上海证券交易所联合,提出了可折叠的多Paxos的低延迟方案,将订单复制延迟降低到百微秒级。【加区块链的相关内容】
  2. 面向领域的大数据管理与分析:面向数据和知识密集型的应用领域如医疗健康、电子政务、数字图书馆和在线教育等,能够在提供通用大数据管理的基础上,针对不同应用领域的数据特点和服务需求,提供可配置、易扩展的数据管理和分析功能,从而有效支持特定领域的具体应用。针对多个机构中的数据来创建电子身份证,提出了EAID-PKI安全模型,比传统模型的安全性和凭证性得到综合增强;参与国家标准规范建设,提出了目录和交换体系,以及政府信息化架构,规范了共享交换领域占比最多的非结构化数据的管理与服务关键环节共性要求;从共享的基础设施和硬件层面提出了高性能安全存储的方法,形成可信固态硬盘技术方案,对性能的影响控制在运行总开销3%以内。

团队注重学科的交叉和集成,积极开展与国内外机构和企业的研发合作,主持并参加了国家和省部级的科研项目20余项,取得了突出的研发成果,主要承担了国家重点研发计划、新一代人工智能重大项目、国家973项目、国家863项目、国家科技支撑计划、国家自然科学基金、中国下一代互联网示范工程(CNGI)、铁道部基金等国家级的科研项目。

2.2. English

The PURPOSE of the Web and Software Technology (WeST) R&D center is to provide technical supports for informationization software projects and related industries which are significant for the national economy and the sustainable development of the society based on the national strategy requirements and the national economic development.

The center's STRATEGY is to serve the construction of China's informationization infrastructure and the development of the information industry, emphasize on sustainable development, communicate and collaborate with international partners, and develop large-scale support software and system with independently intellective property right for serving China’s informationization construction.

WeST hosts ten research labs, namely Digital Library/Archives Lab, Smart Traffic Lab of IoT, Big Data and Cloud Platform Lab, Electronic Commerce and Transaction Systems Lab, Defense Middleware Technologies Lab, Data Engineering Lab, Semantic Web and Knowledge Engineering Lab, Software Engineering and Testing Lab.

WeST is currently carrying out researches in five aspects: (1) Key technologies of massive data storage system in complex application environment. (2) Key technologies of big data management and analysis based on different areas. (3) Key technologies of E-Commerce and E-Government that supporting large-scale concurrent transactions. (4) Service platform that supporting data-driven and knowledge engineering. (5) Defense data supporting platform based on distributed file system and service middleware.

The core achievement of WeST is HUADING Big Data Management and Analysis Platform, which includes four parts: (1) HUADING-C that focuses on the structured data management based on the column storage. (2) HUADING-U that focuses on the non-structured data management based on data tag. (3) HUADING-S that focuses on the distributed file management based on cluster. (4) HUADING-K that provides knowledge management, large-scale parallel data mining and analysis.

Application areas of WeST include Digital Archives/Library, Electronic Government, Electronic Commerce, Cloud Computing, Smart Grid, Internet Public Opinion Analysis, Internet of Things (IoT), Smart Traffic and Digital Medical & Health and so on. Now, WeST R&D center has lots of research and development (R&D) cooperation with more than 30 enterprises and institutions at home and abroad.

WeST focuses on cross-disciplinary and integration, and actively carries out R&D cooperation with domestic and foreign institutions and enterprises. WeST has directed over and participated in lots of national and provincial research projects, and has achieved some outstanding R&D achievements. WeST R&D center has undertaken some national research projects such as National Basic Research Program of China (973 Program), National High Technology Research and Development Program of China (863 Program), the National Key Technology R&D Program, the National Natural Science Foundation of China, China Next Generation Internet Program and Foundation of the Ministry of Railways, and so on.

3. 研发情况

Web与软件技术研究中心已经建立了一个12台服务器规模的“云计算”环境,该环境已经部署了已经完成的以前的863研究项目所拥有的20TB的电子档案等大部分非结构化的海量原始数据及其现在实验室正在进行中的973研究项目所拥有的30TB左右的数字城市方面的多媒体数字资源方面的海量数据。

Web与软件技术研究中心在数据密集型计算、云计算及其电子政务方面取得的与本课题有关的研究工作积累总结如下:

  • 在面向复杂应用环境下海量数据组织与资源共享方法研究方面,建立了一套海量数据组织与共享的模型。建立了数据对象和资源对象的动态组织、管理的体系,提出了一种海量非结构化数据的组织与共享模型及其相应算法;研究了数据对象的框架和描述方法,提出了复杂应用环境中自组织动态、大批量的数据迁移方法;提供了面向复杂应用环境的数据对象定位及获取方法,开展了在社会网络及其模型计算方面应用研究。
  • 在海量分析型数据方面,开发了华鼎数据库Huabase项目。Huabase是新一代基于列存储的关系型数据库系统。系统基于先进的存储模型,可用来解决传统数据库中一些关键的性能问题。Huabase不仅适合于传统的事务型应用,也非常适合于商业智能分析领域,可以帮助企业做出明智的业务经营决策。
  • 在云数据管理框架方面,提出了云数据库管理架构。在研究现有云数据管理框架的基础上,提出云数据管理与服务CDMS 的体系结构,设计一种Chu 空间进程代数,提出一种新的Chu 空间的动作精化算子,在云数据管理服务方面提供了可扩展性的建模和验证。
  • 在电子政务中政府信息化架构和目录与交换体系研究方面,针对电子政务应用的总体规划和顶层设计方面,提出了一个政府信息化架构(GIA),包括科学理论方法、技术支撑体系、分层参考模型以及标准规范等;参加并编制了国家电子政务信息资源目录体系和交换体系标准。GIA已经成为国信办和北京信息办的重要参考,目录体系已成为国家标准,并得到了国家电子政务标准工程和北京市科技计划项目的支持。
  • 在支持数据驱动型应用的跨域共享与服务支撑平台研发方面,提出了一种支持数据驱动型应用的跨域共享与服务支撑平台架构,建立有效聚合跨域的数据资源方法,提供了按需的高效数据整合与共享机制,通过服务支撑平台和示范应用验证研究成果。

Introduction (last edited 2021-06-26 15:52:46 by ZhangYong)