加入收藏在线咨询
位置:主页 > 创新研发 >

美国联邦大数据研发战略计划述评

作者:ag88环亚娱乐时间:2019-03-16 16:39浏览:

  [摘要]《联邦大数据研发战略计划》是美国政府于2016年发布的国家大数据战略性文件,其中包含新兴技术、数据质量、基础设施、共享机制、隐私安全、人才培养、相互合作七项战略内容。计划体现出的四个方面值得借鉴:一是树立“有活力的国家大数据创新生态系统”这一总体战略目标;二是在推进技术发展战略的同时格外注重管理战略;三是将数据隐私安全作为当前战略的重点;四是用成功范例带动战略的全面实施。

  2016年5月,美国发布《联邦大数据研发战略计划》(以下简称《计划》),[1]这是继2012年3月奥巴马政府发布《大数据研发倡议》(以下简称《倡议》)[2]后的又一个国家大数据战略性文件。在此倡议推动下,美国在大数据关键领域取得若干进展,《计划》即是在这一基础上适时推出的更全面、更深入、更具体的文件,共有46页。

  文件公布后立即引起我国学者的广泛关注,在涉及大数据发展战略的相关成果中几乎均有提及,但大多只是简要说明,或者是科技讯息性质的摘要翻译,缺乏对文件内容的专门研究。美国是实施国家大数据战略的全球领跑者,[3]对这一当前正发挥着重要作用的官方文件进行研究,一方面有助于从一个侧面了解全球大数据发展方向,另一方面,也有助于为我国正在实施的国家大数据战略提供参考和借鉴。

  美国是全球最早关注大数据的国家之一,不仅仅是IBM、谷歌等高科技企业,政府部门也极为重视。2009年,热衷于信息技术的奥巴马入主白宫,同年即开通政府数据门户网站,要求各联邦机构将需依法公开的数据和文件按照统一标准分类整合,上传至该网站,供用户集中检索。它的开通实现了政府信息的集中、开放和共享,极大方便了美国各界对政府数据的利用,也为启动国家大数据战略奠定了思想基础、技术基础和数据基础。

  2010年12月,总统科技顾问委员会公开发布了题为“数字未来设计”的报告,[4]强调大数据具有重要战略意义,数据爆炸式增长将带来管控和利用困境,但联邦政府在大数据技术方面的投入不足,应加大投资,将大数据列为优先发展事项。政府部门对大数据的关注度进一步提升。

  2011年,国家科技委员会专门成立“大数据高级督导组(Big Data Senior Steering Group,简称BDSSG)”,负责确定联邦政府当前需要开展的大数据研发任务,做好部门间的工作协调,制定远景目标。[5]此后,BDSSG在大数据战略推进中发挥了重要作用。2012年3月,BDSSG负责起草的《倡议》由白宫科技政策办公室正式对外发布,这标志着美国在全球率先将大数据上升为国家战略。[6]

  《倡议》全文不足4页,与《计划》相比非常简短,提出了三大目标,一是要发展前沿核心技术, 以满足搜集、存储、防护、管理、分析和共享海量数据的要求;二是利用上述技术, 推动科学与工程领域的发明创造, 增强国家安全, 转变教育方式;三是储备人力资源, 以满足发展大数据技术的需求。其中的亮点是声明国家科学基金会、国家卫生研究院、能源部、国防部、国防部高级研究计划局、地质勘探局6个部门将新增总额超过2亿美元的资金,用于在本领域内先进工具与核心技术的研发和应用,同时,公布了六部门拟开展的主要项目名称。《倡议》发布后,又有联邦12个政府部门共18个单位提出了总计89个大数据研发项目清单;[7]国家科学基金会和国防高级研究计划局发布《大数据项目申请指南》,为相关单位申请大数据项目提供指导。[8]

  在《倡议》促进下,联邦机构、科研院所及社会企业在大数据研发、管理及应用等方面进行了积极探索,取得明显进展。如能源部研发的本地气候数据交互可视化项目,能够测判气候变化对国家能源基础设施(如电厂)的影响。该项目能使庞大的气候数据在本地进行筛选处理后再进行传输汇集,迅速在管理中心形成可视化模拟结果,重要的是,这一技术可推广应用到其他需要汇集异地数据进行集中分析的领域,为实现大数据异地传输、合成处理提供了样板。国土安全部与联邦急救管理署和美国消防局合作,运用地理空间和图形分析等大数据技术,在对2亿多个火灾事故进行分析的基础上,开发出计算机系统分析模型,能够预判火灾程度及走势,提供火灾处置和损失减免方案,这一模型的研发为大数据项目的部门合作、多类型数据之间的共享利用等提供了解决方案。国防部高级计划研究局实施了“代斯”项目,开发出在数据流动过程中只将隐私信息用于指定目的而不被其他应用共享利用的工具软件,初步解决了隐私保护与数据开放之间的矛盾。在人才培养方面,已有60多个学院陆续设立了数据科学方向的硕士学位,本科和博士相关课程也在稳步增加。

  《倡议》颁布后取得的诸多进展解决了不少关键技术难题,在软件工具、硬件设施、人才准备、管理经验等方面皆有突破,为大数据战略的全面实施打下了坚实基础。正如国家科技委员会网络信息技术研发子委会联合主席Kurose所说:“在《倡议》推动下,大数据创新生态系统正在联邦机构中显现,引领着知识发现进程和可靠决策的制定。”[9]至此,国家大数据战略已可向更广范围、更深层次推进,需要制定出更详细、全面、前瞻性的战略文件。

  了解《计划》的编制者和印发者,能够明晰美国大数据战略由谁来制定,谁来引领,谁来推动。《计划》由BDSSG编制,总统行政办公室和国家科技委员会(简称NSTC)印发。

  NSTC早在1993年即已成立,是克林顿任总统时建立的美国内阁级委员会。当时联邦政府发现,在确定科技优先发展领域方面的效果很不理想,每年成百上千亿美元的高额科技预算资金要分散用于二十几个联邦部门,各部门制订自己的使用预算优先次序时, 仅仅与预算管理办公室协商, 并不征求白宫科技政策办公室的意见,造成有些领域重复投资,有些重要领域又投资过少,为了解决这一问题,加强对科技经费和优先发展领域的集中控制,开始组建NSTC。[10]NSTC主席由总统担任,成员包括副总统、内阁部长、与科技关系密切部门的负责人和部分白宫官员,主要职责是加强联邦政府对科技研究的决策能力, 直接参与联邦各部门科技计划的管理和协调,日常会议由总统科技顾问(即白宫科技政策办公室主任)负责召集。[11]委员会按照专业不同分为若干分委会,分委会又按专业细分为若干子委会。BDSSG就由NSTC中五个主要分委会之一“技术分委会”下 “网络信息技术研发(NITRD)”子委会负责。

  BDSSG成立于2011年,是为推进国家大数据战略而专门成立的,其成员由来自国家航空航天局、能源部、国防部、国土安全部、国家海洋和大气管理局、国家核安全部、国家科学基金会、国家安全局、国防高级研究项目局、国家标准技术研究院、环保局、内政部、美国国际开发署等13个单位的专家或领导共16人组成。[12]其中2位联合主席来自国家科学基金会和国家卫生研究所,其他成员主要来自拥有重要大数据资源和技术的部门。BDSSG成立后不久就编制了《倡议》,并负责敦促《倡议》中提到项目的具体实施工作。也就是说,BDSSG实际承担着美国大数据政策起草制定、沟通协调、督促实施、远景设计的重任。

  在BDSSG的组成机构中,如果将国防部、国土安全部、国家核安全部、国防高级研究项目局、国家安全局、能源部归类为国家安全部门,国家航空航天局、国家海洋和大气管理局、美国国际开发署归类为境外空间部门,环保局、内政部归类为民生部门,国家科学基金会、国家标准技术研究院归类为研究支持部门,就会发现,国家安全部门占最大比重,占比近50%;其次是涉及境外空间的部门、民生部门和研究支持部门。综合这些部门性质以及NSTC的人员来源可以认为,美国的大数据战略是由总统参与决策,国家安全部门引领,国内与国际共同发展,数据标准与科研投入同时推进的。

  《计划》的面向对象是联邦机构,尤其是涉及数据科学研发、密集型数据应用、大规模数据管理的机构。主要内容包括七项战略,每一项都从重要性、主要内容、典型案例、注意事项等方面进行了阐述,主题分别聚焦新兴技术、数据质量、基础设施、共享机制、隐私安全、人才培养、相互合作。

  战略一指出,充分利用新兴的大数据基础、研究方法和技术,创建新一代功能。为了应对大数据挑战,应该继续加大对大数据收集、管理、分析等技术和知识转化方面的投资,以及大数据带来的隐私、安全和道德等方面的研究,使得各联邦机构能够适应不断增长的数据量,随数据规模、增速、复杂性的变化而变化,利用数据创造出新一代服务和新一代功能。

  战略二指出,支持对数据及其产生的知识的可信性研发,使依靠数据做出的决策更优,基于数据分析采取的行动更可靠,更能获得突破性发现。在开放政策推动下,数据的共享、开放和流动性大幅增加,了解数据来源是否可信、从数据中获得的知识是否准确的重要性日益突显。因此需要加强对数据准确性、错误、精度、异常、真实性、不确定性等指标的测量跟踪和评估,以便实现稳健的基于数据的决策。

  战略三指出,加强科研网络基础设施建设,为各机构实现大数据创新使命提供支持。大数据科研网络基础设施不仅仅包括芯片、高性能计算、云计算等,数据集本身、通用计算工具、标准制定等也是重要组成部分。要想利用大数据提供的机会,最先进的科研网络基础设施必不可少,科研网络基础设施投资应与数据量增长保持同步。网络基础设施需要将大数据资源和大规模计算功能相结合,形成连贯的数据分析能力,解决从芯片到所有规模数据全球传输的挑战,满足日益增长的数据共享和分析新环境的需求。

  战略四指出,完善数据共享管理政策,提升数据价值。BDSSG致力于政府数据共享和开放,这需要数据拥有者等利益相关方发挥积极作用。数据共享不仅包括源数据的共享,还包括数据接口、元数据和标准的共享。良好的数据共享政策、标准和环境可以优化跨数据集分析,从而产生新的科研领域。

  战略五指出,重视大数据收集、共享与利用过程中涉及的隐私安全和伦理道德问题。隐私安全和伦理道德问题是大数据创新生态系统中需要考虑的关键因素,需要新的政策解决方案来保护隐私、澄清数据所有权;需要技术工具评估分布式网络中的数据安全性;需要通过技术手段限制错误信息、不道德信息,削弱特定群体信息的公开或隐蔽传播,保障大数据中的伦理道德。

  战略六指出,改善国家大数据教育和培训面貌,以满足对高端数据科学人才和大批量数据类员工日益增长的需求。全面的教育培训战略对大数据发展至关重要,要继续壮大数据科学家骨干队伍、培育数据研究专家团体、广泛培养具有数据能力的员工、提高公众的数据素养。要增加数据相关专业的教师和科研人员数量,所有联邦部门员工和管理者都要接受“新兵训练营”培训、参加专业研讨班、完成证书课程,了解大数据与其部门的相关性。

  战略七指出,建立和加强国家大数据创新生态系统中的相互联系。应建立持续的政策机制,通过去除技术和数据共享方面的官僚主义壁垒和制订可持续项目计划,加强各机构在大数据研发方面的合作。其途径一是建立跨机构的沙箱或测试平台,加强各机构在技术开发和成果转化方面的合作;二是建立健全紧急优先事件(如国家灾难)处置时的数据共享政策,注重实时的、动态数据的共享合作;三是建立大数据“基准中心”,中心聚焦实现关键目标需要的重大挑战性应用,为确定数据集、分析工具、互操作性标准等提供帮助;四是要认识到国家大数据创新生态系统需要大量从业者团体的参与。

  国家战略是统筹国家安全和发展的总体战略,事关国家的未来。它由国家最高决策机关制定,具有导向、动员、组织和资源配置的功能。[13]《计划》由总统行政办公室和总统任主席的国家科技委员会共同印发,具有引导美国大数据发展方向,动员联邦机构和社会共同参与,组织协调各机构力量,合理安排好人力、物力、财力资源的配置等功能,其中以下几个方面值得借鉴。

  (一)树立了明确的总体战略目标,即建成有活力的“国家大数据创新生态系统”

  总体战略目标是战略活动所追求的最终目的,指明战略活动的基本方向,能够鼓励和激发战略实施的对象向既定目标奋进,一般比较宏大,比较宏观。[14]《计划》中称“发布这一战略文件的最终目的是建成国家大数据创新生态系统”,并且在全文中有10处提到“大数据创新生态系统”,国家大数据创新生态系统成为美国国家大数据战略的总体战略目标。《计划》中对国家大数据创新生态系统进行了如下设想,即“使联邦机构和国家通过分析大量、多样、实时的数据,加速科学发现和创新进程,提高决策和发现能力,具备新一代功能;开拓新的研究领域,发现本来不易被发现的问题;培育21世纪新生代科学家和工程师;实现新的经济增长”。即科学发现、技术革新、尖端人才、经济增长成为美国国家大数据创新生态系统的目标组成。

  生态系统是多种生物共存共生的自然系统,创新生态系统则指创新系统的动态演化、创新要素的有机聚集、系统的自组织生长。一个创新生态系统必定是自组织的生态系统,系统中各个要素相互联系、相互制约,各个创新主体共生共荣,不断演化、不断促进优势新物种的成长和自我超越,创新生态系统里的栖息者可以分为三大群落,即研究、开发和应用,细分为产业创新生态系统、区域创新生态系统、国家创新生态系统等。[15]国家创新生态系统的首个官方定义来自美国总统科技顾问委员会于2004年初发表的报告《维护国家的创新生态体系、信息技术制造和竞争力》。[16]其中提出,“国家创新生态系统是推进技术和经济发展所必需的机构和人员相互作用的动态系统,是决定国家技术和创新领导地位的有活力的系统……支撑美国创新生态系统健康发展需要加强国家研发能力、改善工作者教育状况、提升创业氛围、改善基础设施”。也就是说国家创新系统是由技术研发、人才准备、产业环境、基础设施等要素构成,各要素相互作用、相互促进,引领国家发展的自组织的有活力的动态系统。

  据此可以认为,国家大数据创新生态系统是由大数据研究、开发、应用三大群落构成,包含从数据产生、数据获取、数据存储、数据组织、数据分析到数据应用这一完整链条,需要国家技术创新、产业发展环境、人才准备、基础设施等要素共同发展的动态的、自组织的、有活力的系统。将大数据发展的总体战略目标定为国家大数据创新生态系统,表明美国的国家大数据战略非常重视创新的重要性,国家各方面力量协同配合的重要性,研究、开发和应用三者相互促进且均衡推进的重要性。

  《倡议》将关注的重点放在技术研发和资金投入,主要在卫生、能源、国家安全、地质勘探领域进行,拟实现的目标只包含技术和人才。《计划》的重点则不仅仅局限于技术研发和人才培养,而是包含二者在内的七项战略,内容非常全面,可划分为技术战略和管理战略两类。技术战略侧重技术研发,管理战略侧重政策制定,如图1所示:

  前三项战略均以技术能力提升为主要内容,而且不仅仅强调某一项或某一类技术创新,更强调创新能力的整体性提升。如第一项战略即在标题中提出“创建新一代功能”的目标,要求技术发展一定要与数据发展的规模、速度和复杂性相匹配,不断开发出新的方法以适应未来的数据挑战,实现数据功能的更新换代。在三项战略中提出许多需重点发展的技术,如大型系统结构配置、高性能计算、分布式系统、高速网络互联、物联网、语义识别、数据可信性验证、数据驱动决策等。

  在大数据技术已具备一定基础,在多个领域开始投入使用的背景下,完善的管理战略显得日益重要。因此《计划》中对管理战略进行了重点阐述,其中后四项战略都偏重管理体制机制的建立,强调要完善数据共享和管理的政策;积极应对数据共享带来的隐私、安全和伦理问题;改善国家大数据教育和培训面貌;加强各机构之间的交流与合作。共享机制、隐私安全、人才培养、威海市商业银行济南历城支行开展!相互合作是大数据应用走向成熟必须重视的问题,只有管理战略与技术战略同步推进,才有可能最终建立起稳健的国家大数据创新生态系统。

  国家战略重点,即一个国家为实现国家战略目标所需解决的主要矛盾或主要问题。[17]“在复杂事物的发展过程中,有许多矛盾存在,其中必有一种是主要矛盾,由于它的存在和发展,规定或影响着其他矛盾的存在和发展”。[18]抓住主要矛盾带动全局工作,是唯物辩证法的内在要求。大数据时代的到来加剧了信息泄露和隐私侵害,它决定着数据拥有者是否愿意放心地共享自己的数据,也决定着数据使用者是否能够更好地利用数据,使舆论环境和谐有序。

  虽然全球数据量正在呈现爆炸式增长,但仍有许多拥有大数据资源的工业、政府和教育部门因为担心隐私泄露或丧失竞争优势,而不轻易提供各自的数据。数据是实施大数据战略的基础,《计划》中的战略五专门围绕隐私安全这一主题进行了阐述,“隐私和伦理问题是大数据创新生态系统的关键考虑因素”“解决这些问题的方法将对访问、共享和使用大数据的能力产生重大影响”“大数据隐私保护研究是当务之急”。从“关键”“重大”“当务之急”这些词语可以看出,数据隐私安全是当前美国大数据发展要解决的主要问题,是国家大数据战略的重点。为了解决这一难题,美国国家科技委员会还专门编制了《国家隐私研究战略》,并于2016年6月发布。[19]

  美国是世界上最早提出隐私权概念的国家,[20]关于个人隐私的法律保护历史悠久,1974年即出台《隐私法》,1986 年通过《电子通信隐私法》,1999 年颁布了《互联网保护个人隐私的政策》,2012 年颁布《消费者数据隐私保护法案》。即便如此,隐私信息的泄露依然泛滥成灾,隐私泄露的原因多种多样,比如黑客入侵、操作失误、丢失或被盗、内部作案、媒体报道等。2015年7月,一名越南黑客侵入美国多家企业电脑,窃取约2亿美国人社保账号、银行账户、信用卡信息和家庭住址等个人信息,发布于自己运营的网站,获利超200万美元。[21]同年12月,一个包含1.91亿美国选民姓名性别、家庭住址、选举ID、电话号码、所属政党、详细选举史以及选举预期等个人信息的大型数据库呈完全公开状态,任何人都可自由下载。[22]2017年,俄罗斯黑客入侵美国内部网络,取得总统竞选相关信息,干扰美国大选。[23]隐私泄露问题已不仅仅对某个人或某类群体产生影响,其覆盖范围越来越广、经济社会影响越来越大,甚至影响到国家领导人的选举。

  针对隐私泄露日益严重的情况,《计划》指出,在技术方面,针对大数据应用程序越来越普遍地使用分布式网络的现状,要研发能够评估数据安全的技术和工具,执行数据生命周期综合评价,以决定数据长期留存时间和数据删除的期限。在管理政策方面,强调需要新的政策解决方案。因为在当前的做法中,用“通知和同意”的方式通知数据提供者,获取他们的同意是最广泛使用的策略,这种模式将个人隐私保护的责任直接推向了个人。在大数据时代这种模式是不可取的,因为数据的流动和共享越来越普遍,可能会以新的、未预料到的方式被使用。比如从卫生部门获取的数据可能会与医疗保险公司共享,未来可能还会与其他部门共享,而用户只是与卫生部门达成了数据使用协议。这些问题的处理需要新的数据隐私和保护方案。

  如果从政府数据门户网站(上线算起,美国的大数据发展进程已持续了近十年,在这期间,从技术研发到成果应用,从管理体制到管理方法均积累了一些经验,取得了一些成绩,《计划》中对取得良好效果的范例进行了专门推介。这些范例分散在七项具体战略中,归纳起来可分为三种类型。

  一是先进的大数据技术研发项目。如能源部实施的本地气候数据交互可视化项目;国土安全部与联邦急救管理署和美国消防局合作进行的火灾数据库分析预警项目;国防部开展的通过计算机对复杂系统进行数据读取、综合分析和推解原理的大机制项目。这三个项目不仅能够说明联邦机构目前对大数据新兴技术的最新研发进展,而且其解决的技术难题具有通用性和代表性,可以为其他机构提供参考。

  二是新成立的大数据管理机构。《计划》中推荐介绍了几个近年成立的与大数据管理有关的组织机构。如美国国会于2010年成立的金融研究办公室。这是一个由了解大数据技术的计算机专家、统计学家、经济学家、社会学家、金融专家组成的合作研究团体,职责就是提供高质量的数据及分析报告;还有国家科学基金会2014年主导建立的“大数据、伦理和社会委员会”,汇集了人类学、哲学、经济学、法学等学科研究人员,为大数据战略推进提供关键的社会和文化服务,解决诸如安全、隐私、平等和获取等问题。

  三是新型的大数据管理方法。如斯坦福大学研究出的能够将多种不同类型数据中的元数据组织起来,形成统一的、更易检索、检索准确率更高的数据目录管理方案;美国国际开发署开发的农业数据库项目,可实现农业数据自下而上管理,已为塞内加尔、科索沃等国的农民提供数据服务;由96个政府和87个组织参与建立的地球观测国际联盟为建成全球地球观测系统,制定的一系列区域间数据共享和管理协议。

  这些有代表性的范例能够为联邦机构提供具体的指引和参考,避免其盲目投资,盲目发展,盲目管理。将这些案例揉入《计划》原文,以这些案例为“点”,带动整体战略的高效实施,是编制战略规划文件时值得推崇的一种方式。

  大数据是信息化发展的新阶段,对国家管理、社会治理、经济发展、人民生活都将产生重大影响。我国政府高度重视大数据的战略意义,2015年8月国务院发布《促进大数据发展行动纲要》,提出要全面推进我国大数据的发展和应用;2015年10月,党的十八届五中全会提出“实施国家大数据战略”,将大数据上升为国家战略;2016年3月,在“十三五”规划纲要中再次明确指出要“实施国家大数据战略,加快推动相关研发、应用及治理”;2017年12月,习总书记在中共中央政治局就实施国家大数据战略进行集体学习时又特别强调要“推动实施国家大数据战略。”

  实施国家大数据战略需要战略文件引领。我国重要的大数据官方文件主要有国务院发布的《促进大数据发展行动纲要》和国家发改委、工信部、交通运输部等诸多部门以及各地方出台的中短期规划或行动方案,与美国相比,还欠缺一份提出行动,阐明理念与设想、目标与主张、案例与方法的战略计划。中美两国国情截然不同,我们绝不模仿照搬美国的战略计划,但设定明确的总体目标、管理与技术协同推进、指出当前的发展重点、注重典型范例的推介等四个方面可以吸收借鉴。

  [3] 李国杰,程学旗.大数据研究:未来科技及经济社会发展的重大战略领域[J].中国科学院院刊,2012(6).

  [6] 张勇进,王璟璇.主要发达国家大数据政策比较研究[J].中国行政管理,2014(12).

  [8] 魏孔虎.军队指挥研究[M].北京:国防大学出版社,2014:241.

  [10] 琼尔.美国国家科学技术委员会开始运行[J].全球科技经济瞭望,1994(10).

  [15 ]梅亮,陈劲,刘洋.创新生态系统: 源起、知识演进和理论框架[J].科学学研究,2014(12).

  [20]王敏,江作苏.大数据时代中美保护个人隐私的对比研究[J].新闻界,2016(15).

电话:0411-754584383
传真:
邮编:67636114@qq.com
地址:环亚娱乐ag88真人版