高考语文一轮复习时事热点试题集锦大数据word版

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

高考语文一轮复习时事热点试题集锦大数据word版

‎2019 届高考语文一轮复习时事热点试题集锦(大数据)‎ 学校: 姓名: 班级: 考号: ‎ 一、现代文阅读 ‎1.阅读下面的材料,完成下面小题。‎ 材料一 ‎ 什么是大数据,迄今并没有公认的定义。从宏观世界角度来讲,大数据是融合物理世界、信息空间和人类社会三元世界的纽带,因为物理世界通过互联网、物联网等技术有了在信息空间中的大数据反映,而人类社会则借助人机界面、脑机界面、移动互联等手段在信息空间 中产生自己的大数据映像。从信息产业角度来讲,大数据还是新一代信息技术产业的强劲推动力。 相较于传统的数据,大数据具有体量大、速度快、模态多、难辨识和价值大密度低的特征。但大数据的主要难点并不在于数据量大,因为通过对计算机系统的扩展可以在一定程度 上缓解数据量大带来的挑战。其实,大数据真正的挑战来自于数据类型多样、要求及时响应 和数据的不确定性。‎ 材料二 ‎(摘编自程学旗等《大数据系统和分析技术综述》)‎ 以互联网为载体的大数据,是指人们依托互联网而将自己的行为信息与人际间的互动信息 以互联网能识别、分析与保存的方式所产生的海量数据。互联网中大数据的价值再造过程 如下图。‎ 材料三 ‎(摘编自章政等《大数据时代的社会治理体制》)‎ ‎“神威·太湖之光”,系统采用全国产处理器构建,峰值性能每秒超过 12.5 亿亿次,是世 界第一的超级计算机。‎ ‎2019 年,共有五项基于“神威·太湖之光”的应用入围国际高性能计算应用领域最高奖 ‎“戈登·贝尔奖”的提名,其中两项获奖,这是中国高性能计算应用领域近年来最重大的突 破。“神威·太湖之光”将如何改变我们的生活?“‘神威·太湖之光’有着大数据应用的 天然优势。”中国工程院院士陈左宁说。超算具有强大的数据存储、检索、计算、分析能 力,而现在的大数据应用与新一代人工智能密切结合,“神威·太湖之光”将为二者深度融 合应用提供技术支撑。‎ ‎“未来,国家超算无锡中心将是一所‘人工智能’大学。”科学家张晖这样描绘未来。他 说,这所大学的学生并不是人类,而是人工智能机器人。在超算的“培训”下,智能机器人将 拥有独立思考的“头脑”。比如医院的 CT 机可以代替医生去诊断分析病情,通过大量数据 的计算,选择最优解决方案,甚至比人做得更好。‎ ‎(摘编自过国忠《“神威·太湖之光”,入选世界互联网领先科技成果》,马雪梅、顾庆赟 ‎《超算,开启人工智能新时代》)‎ 材料四 ‎“神威·太湖之光”背后的国家超级计算无锡中心,研发人员平均年龄只有 25 岁。‎ 早在 2019 年夏天,以清华大学为主的科研团队就来到无锡。这群年轻人肩负着一个重要 使命,要为这款完全国产化的超级计算机打造属于自己的系统。超算团队当时的工作环境简 陋,甚至连空调都没有。他们面临的挑战也是艰巨的。“机器是全新的,硬件是全新的,软件 与应用都不完善,只能迎难而上。”29 岁的国家超级计算无锡中心主任助理甘霖说。当时,‎ 唯一的优势就是这支年轻的团队,快速学习与大胆尝试是团队的优势。 团队里的王冬见了“神威·太湖之光”成长的整个过程:从被欧美技术封锁,到研制出完全国产芯片,再到完全国产化的超算诞生,并成为具有全世界最快运算速度的计算机,最后 获得国际高性能计算应用领域最高奖。王冬说,这是一个“彻底强大起来”的过程,中国的 科学家们终于可以扬眉吐气了。‎ ‎(摘编自李超《攀上世界超算最高峰,青春闪耀“太湖之光”》)‎ ‎1.下列对材料相关内容的理解,不正确的一项是( ) A.作为融合物理世界、信息空间和人类社会的纽带,大数据不但能推动新一代信息技术产业 的发展,也会对其他行业的发展产生积极影响。‎ B.人类社会借助技术手段在信息空间产生的大数据映像,有一部分经过互联网的识别、分析 与保存,有可能被收集、整合,应用于生产生活。‎ C.相较于传统数据,大数据的体量更大,但这不是目前大数据应用的主要难点,因为体量大带 来的挑战可以通过扩展计算机系统得到缓解。‎ D.在互联网大数据应用中,个人、企业用户因产品或服务而产生的数据,经过云计算整合后 形成大数据,反馈给各行业生产者,实现价值再造。‎ ‎2.下列对材料相关内容的分析和评价,不正确的两项是( )( ) ‎ A.“神威·太湖之光”峰值性能每秒超过 12.5 亿亿次,是目前世界第一的超级计算机,在 应对数据体量大、要求及时响应等大数据应用挑战上有优势。‎ B.两项基于“神威·太湖之光”的应用获得“戈登·贝尔奖”,表明我国超算研制水平和高 性能计算应用能力已全面超越欧美,位居世界第一。‎ C.未来,医院的 CT 机有可能代替医生诊断分析病情,这是因为 CT 机在超算的“培训”下 会计算懂决策,将拥有能独立思考、超人的“头脑”。‎ D.国家超算无锡中心的研发人员平均年龄只有 25 岁,年轻使他们具有快速学习与大胆尝试 的团队优势,使他们能克服种种困难,完成研发任务。‎ E.超级计算机“神威·太湖之光”成长的过程,也是以清华大学为主的科研团队成长的过程,‎ 这一过程体现了中国科学家自强不息的奋斗精神。‎ ‎3.在未来,“神威•太湖之光”这一类的超级计算机将会如何改变我们的生活?请根据上述材 料简要说明。‎ ‎2.阅读下面的文字,完成下列小题。‎ 材料一 中国投资咨询网发布的《2019-2022 年中大数据产业规模预测分析》认为,云计算、物联 网、智慧城市、移动互联,新技术与应用的不断涌现,加速了“大数据”时代的到来。统计 数据显示,2019 年,全球大数据市场规模为 281 亿美元,同比增长 22%。预计,2019 年全球大 数据市场规模将达到 454 亿美元,未来五年(2019-2022)年均复合增长率约为 15.37%,2022‎ 年将达到 805 亿美元。‎ ‎2019 年,中国大数据市场规模达到 115.9 亿元,同比增长 38%;2019 年为 168.0 亿元,同比 增长 45%。‎ 预计,2019 年我国大数据市场规模将达到 280 亿元,未来五年(2019-2022)年均复合增长 率约为 27.29%,2022 年将达到 735 亿元。‎ ‎(摘编自中国投资咨询网发布的《2019-2022 年中大数据产业规模预测分析》)‎ 材料二 ‎2019 年全国大数据发展指数总数为 1087.8,比 2019 年同期增长 179.32,各省市增长的均 值为 5.78。‎ ‎2019 年和 2019 年 31 个省、市、自治区的大数据发展水平评估结果 2019 年国家大数据 综合试验区所在区域的大数据发展总指数合计 408.36,比去年同期增长 62.26,各省市指数 增幅均值为 6.23,高于全国增幅均值的 5.780。‎ ‎2019 年国家大数据综合试验区大数据发展水平 材料三 ‎(摘编自《2019 年中国大数据产业发展水平评估报告》)‎ ‎2019 年 8 月,国务院印发《促进大数据发展行动纲要》,首次明确提出建设数据强 国;2019 年 10 月,党的十八届五中全会提出“实施国家大数据战略”,将大数据上升为国家 战略。2019 年 1 月,工信部发布了《大数据产业发展规划(2019-2020 年)》。《规划》具体 设置了七项重点任务:一是强化大数据技术产品研发;二是深化工业大数据创新应用;三是促 进行业大数据应用发展;四是加快大数据产业主体培育;五是推进大数据标准体系建设;六是 完善大数据产业支撑体系;七是提升大数据安全保障能力。围绕重点任务,政府还设置了大 数据关键技术及产品研发与产业化、大数据服务能力提升、工业大数据创新发展、跨行业 大数据应用推进、大数据产业集聚区创建、大数据重点标准研制及应用示范、大数据公共 服务体系建设、大数据安全保障等八大工程,作为工作抓手重点推进。‎ ‎(摘编自中国投资网《2019-2022 年中国大数据产业规模预测分析》)‎ 材料四 最近几年,美国、欧盟、日本等主要发达经济体采取各种政策举措,积极推进国家大数据 战略,取得了长足进展。大数据在美国之所以能被迅速、广泛应用,与美国高度重视大数据 价值、积极推动数据开放、采取各种政策举措、拥有一批掌握核心技术的信息技术企业和 积极推进国家大数据战略密切相关。推动大数据产业发展上升为国家战略,美国在推进大数 据应用上形成了从发展战略、法律框架到行动计划的完整布局,实施四轮政策行动:注重数 据开放共享和隐私保护;重视大数据重大项目研究与应用,占领大数据产业和技术制高点,以 点带面引导大数据发展,通过资助重大项目研究,破解大数据发展核心技术,引导企业和社会 推动大数据发展;建立高规格的领导机构,统筹和强化部门间协作,政府营造环境,充分调动 企业发展大数据的积极性;强化开源社区在技术开发中的作用,打造大数据产业链的核心竞 争力:多措并举,坚守大数据安全底线。‎ ‎(摘编自 CIO 时代网《欧美等发达国家如何布局大数据战略》)‎ ‎1.下列对材料相关内容的理解,不正确的一项是( )‎ A.2019 年我国大数据市场规模将接近 2019 年时全球大数据市场规模。‎ B.比较大数据市场规模 2019 年同比增长率,中国是全世界的 2 倍多。‎ C.2019 年,我国综合试验区大数据发展指数增幅超过全国其他地区。‎ D.我国在 2019 年明确提出建设数据强国并将大数据上升为国家战略。‎ ‎2.下列对材料相关内容的概括和分析,不正确的两项是( )( ) ‎ A.随着我国新技术与应用方面的不断涌现、大数据产业规模的扩大和发展水平的迅速,“大 数据”时代会最快到来。‎ B.依据材料二,2019 年,我国大数据发展水平居于前列的是北京和广东,大数据发展指数增 幅超过 10 的是重庆。‎ C.全国大数据发展己形成了以国家大数据综合试验区为引领,多区域集聚发展、第一梯队领 先优势明显的格局。‎ D.随着大数据技术的快速发展及重要影响,我国以及世界其他经济强国的相关部门都在积极 实施国家大数据战略。‎ E.美国政府的态度决定了大数据在美国被应用的程度与水平。‎ ‎3.中美两国为促进大数据产业发展采取了哪些措施?请根据材料,概括说明。‎ ‎3.阅读下面的材料,完成下列小题。‎ 材料一 早在 1980 年,未来学家阿尔文·托夫勒便在《第三次浪潮》一书中将大数据称为“第三 次科技浪潮的华彩乐章”。从 2009 年起,“大数据”逐渐成为人们争相讨论的词汇之一。‎ 如今,无论在自然科学还是在社会科学的研究项目中,都能看到大数据的身影。有学者认为 对不同的使用者来说,大数据的价值体现在不同的方面:对于投资人和创业者而言,大数据是 热门的融资标签;对于大多数互联网公司或工程师来说,大数据意味着对一堆数据进行计算;‎ 对于消费者或者互联网用户来说,大数据是商家尽可能搜集的跟终端消费者相关的行为数 据……‎ 有学者认为大数据的特点主要体现在以下四个方面:第一,大数据相较于传统数据来说,最 大的区别体现在数据规模上,传统的大型数据集规模一般为 TB 级别,而大数据的规模则呈千 倍级的增长,从 TB 跃升至 PB。第二,大数据不再是传统的结构化数据,而是包括网络日志、‎ 视频、图片和地理位置信息等多种类型的非结构化信息。第三,大数据本身拥有海量信息,‎ 但信息必须通过分析才能实现从数据到价值的转变,而真正可用的数据可能只有很小一部 分。第四,大数据的采集、分析及时,流转快速,能保证大数据的新鲜和价值。‎ 为什么人们对大数据如此关注?牛津大学互联网研究院教授维克托·迈尔·舍恩伯格和 ‎《经济学人》杂志数据编辑肯尼思·库克耶在其合著的畅销书《大数据时代:生活、工作与 思维的大变革》中指出,大数据时代分析的信息量很多,在处理个别现象的数据时不用依赖 随机采样。大数据的出现改变了人们的思维方式,它让人们关注相关事物之间的关系,只需 知道“是什么”,而不用知道“为什么”。这颠覆了千百年来人类的思维模式,开启了一次 重大的时代转型,对人类的认知方式和交流方式提出了新挑战。‎ 材料二 ‎(取材于杨敏等相关文章)‎ 大数据这股浪潮正在兴起,人民大众的经济、交通、医疗、旅游、服务等方面的生活形态,‎ 都可能在互联网平台上展开。‎ 目前,大数据在电子商务领域的应用最广泛。京东通过建立 PB 级大数据平台,将每个用户 在网站上的行为数据进行记录和分析,提高与用户的沟通效率,提升用户体验,实现了向不同 用户展示不同内容的效果。例如,针对用户不同的属性特征、性格特点或行为习惯,在他们 搜索或点击时,网站将展示符合该用户特点和偏好的商品,尽力给用户提供友好舒适的购买 体验,这就能有效提高用户的购买效率,提高用户黏性。这也是为什么我们在网上购物时,页 面总能很“神奇”地为我们提供最想购买的商品的原因。‎ 大数据在公共交通、打车出行等交通领域的应用也已初步展开。很多人都有在寒冬户外 苦苦等公交车的经历,如今出门前只需提前查询地图,就知道车辆多久能够到站。交管部门 可以将实时路况与百度地图大数据对接,依托百度地图的交通大数据,为公众提供专业的城 市实时交通信息;客户可根据需要自行选择,来满足个性化出行需求,提高出行效率。利用大 数据,还可以通过分析预测出行交通规律,指导公交线路的设计,调整车辆派遣密度,进行车 流指挥控制,以做到及时梳理拥堵,合理缓解城市交通压力。‎ 与民生福祉密切相关的健康医疗领域也在逐步应用大数据。我国部分省市正在实施病历 档案数字化,以配合临床医疗数据与病人体征数据的相关分析,用于远程诊疗、医疗研发,甚 至还可结合保险数据分析,用于商业及公共政策制定等。北京市政府联合百度公司及其他智 能设备商和服务商共同宣布推出的“北京健康云”项目,就是利用大数据技术和数据实时展 示,来报告流感、手足口病、肝炎、艾滋病、肺结核等主要传染病动态,并预测未来传染病 趋势。 在信息技术日益渗透到企业和个人方方面面的今天,大数据将逐渐成为很多行业、企业实 现其价值的最佳途径,大数据的应用也将会全面展开。‎ 材料三 ‎(取材于王轶辰、孙博洋相关文章)‎ 大数据给人们的生活带来了便利,但在大数据热中,也出现了一些伦理问题,需要我们进行 冷思考,并积极应对。‎ 一是隐私泄露问题。随着大数据的广泛应用,这个世界越来越透明,人们就好像处在“鱼 缸生活”中,个人的身份信息、行为信息、位置信息甚至信仰、观念等隐私信息,都可能被 记录、保存、呈现,每个人的信息,无一不被外界掌握。二是信息安全问题。个人所产生的 数据包括主动产生的数据和被动留下的数据,其删除权、存储权、使用权、知情权等本属于 个人可以自主的权利,在很多情况下难以得到保障。大数据使用的失范与误导,如大数据使 用的权责问题、相关信息产品的社会责任问题等,也是信息安全问题衍生的伦理问题。三是 数据鸿沟问题。一部分人能够较好占有并利用大数据资源,而另一部分人则难以占有和利用 大数据资源,造成数据鸿沟。‎ 学术界普遍认为,针对大数据技术引发的伦理问题,应确立相应的伦理原则。大数据技术 发展应坚持以人为本,坚持权责统一原则和尊重自主原则,数据的存储、删除、使用、知情 等权利应充分赋予数据产生者,还应该建立健全监管机制,消除可能引起的风险。2019 年,‎ ‎《贵州省大数据发展应用促进条例》出台,这是国内首个大数据地方性条例。大数据地方立 法对国家层面立法起到了推动作用。有法律规范,大数据产业才会得到更为健康的发展,而 健康发展、不断创新的大数据产业,也会带动我国的数字化高速发展。‎ 解铃还须系铃人,对于大数据技术带来的伦理问题,最有效的解决办法就是推动技术进步 和技术控制。解决隐私保护和信息安全问题,需要加强事中、事后监管,但从根本上看要靠 技术事前保护,所以应鼓励以技术进步消除大数据技术的负面效应,从技术层面提高数据的 安全使用和管理水平。‎ ‎1.根据材料一,下列对大数据特点概括不正确的一项是( ) A.数据规模巨大 B.数据类型多样 C.数据可用度高 D.数据流转性快 ‎2.根据材料一,下列对大数据理解不正确的一项是( ) A.大数据从 1980 年到现在一直是人们讨论的热词。‎ B.大数据广泛应用在自然科学与社会科学研究领域。 C.大数据对不同的使用者能体现出不同的使用价值。 D.大数据在处理个别现象数据时不用依赖随机采样。‎ ‎3.根据材料二,下列理解不正确的一项是( ) ‎ A.京东 PB 级大数据平台能有效提高用户的购买效率。‎ B.利用大数据技术可以预测在户外等公交车的时间。‎ C.大数据能解决城市道路交通拥堵等重大城市问题。‎ D.“北京健康云”能够利用大数据预测某传染病趋势。‎ ‎(取材于杨维东等相关文章)‎ ‎4.根据材料二,下列关于大数据在社会生活中使用情况推断不正确的一项是( )‎ A.某金融公司分析用户消费数据,评定用户信用等级及合理的授信额度。 B.某社区根据住户情况大数据,推荐社区维修服务项目,安排维修时间。 ‎ C.游客通过手机“旅游数据在线”了解景点实时信息,来帮助规划出行。 D.根据地质地理条件和天气观测结果,预测某地区某时一定会发生地震。‎ ‎5.下列对三则材料中的字词的解说,不正确的一项是( ) A.材料一的“颠覆”:“颠”字可以写成“巅” ‎ B.材料二的“福祉”:“祉”读作 zhǐ,和“福”字同义 ‎ C.材料二的“肺结核”:“肺”字一共八画 ‎ D.材料三的“衍生”:“衍”是会意字,从“氵”从“行”‎ ‎6.下列三则材料中的词语在文中的意思,解释不正确的一项是( ) A.材料一的“华彩乐章”:最精彩的技术 B.材料二的“用户黏性”:用户的忠诚度 C.材料三的“鱼缸生活”:被束缚的、不自由的生活 D.材料三的“数据鸿沟”:掌控数据能力的巨大差距 ‎7.根据材料三,下列理解不正确的一项是( ) ‎ A.大数据给生活带来便利,但很多情况下人们对自己产生的数据难以自主。‎ B.针对大数据发展热潮所带来的伦理问题,应该确立倡导相关的伦理原则。‎ C.我国已经出台了大数据监管的地方条例,这有助于推动国家层面的立法。‎ D.我国的数字化高速发展,必将会带动大数据产业的健康发展和不断创新。‎ ‎8.根据上述三则材料,简要概括大数据给人们带来了哪些影响。‎ ‎4.阅读下面的文字,完成 1~3 题。‎ 大数据的一个根本缺陷就是它只关注“客观数据”的呈现,而缺少对“主观数据”的反 映。从社会学角度看,所有数据说到底都是有关“人”的符号,因此,符号所蕴含的社会文化 意义是我们真正需要了解和掌握的内容。如果脱离了人及其所在社会的价值本性,无限放大 大数据的效应及其影响力,就可能本末倒置,最终产生许多难以预期的后果。数据来源于社 会又作用于社会。无论是可以数字化的数据还是不可数字化的数据,其比较、分析和归纳其 实反映的都是人在符号层面上的一种互动。大数据是汇集了行为主体、时间、地点三个维 度的“数据宇宙”。在大数据时代,个人的信息更多的是以数据为载体来进行互动的。如果 人及其各类社会行为都仅仅被看作一个个数据符号,我们就很难从数据中解读出充满朝气、‎ 富有激情的人,也就很难从数据塑造出来的没有个性特征的人去推导群体样态和社会构成。 犹如网络一样,大数据也是一把双刃剑。巨量化的大数据在给我们研究和分析社会现象带 来便利的同时,实际上也掩盖了许多具有个性特征的数据的意义。在连续的巨量数据海洋中,‎ 许多本身具有个性特征的数据已经变得无足轻重了,它们在大数据霸权面前会成为微不足道 的牺牲品,大数据简化了人们对数据差异性的认知。大数据的复杂性不仅在于其数据样本巨 量,更在于其多源异构、多实体和多空间之间的交互动态性。当前,只有少数人掌握处理这 种复杂的巨量化大数据的技术,这很容易导致“数据暴力”。从这个意义上说,防止大数据 滋生出“数据暴力”是大数据发展中需要注意的问题。‎ 从某种意义上说,大数据的价值只有在其能够被规范成为可供分析的形式之后才能最大程 度地被挖掘出来。然而,在巨量的大数据面前,实际上可供规范分析的数据只是极少数,许多 数据都停留在“碎片化”阶段而难以被真正挖掘和分析。对这些碎片化的数据进行清理,形 成规整的结构,是大数据能够得到充分利用的根本所在。在大数据中,其研究范式重在发现 而不是推论,运用大数据进行各种分析不应像传统的社会调查方法那样通过假设检验来进行 推论,而应通过数据的总体归纳来达成对社会现象的总体分析。这不仅要求我们在数据清理 技术、存储结构上进行优化,而且要在数据采集环节尽可能地做到规范,否则就很难获得对 复杂事物的系统认知。‎ ‎ 在大数据时代,我们真正需要的并不仅仅是大数据本身,而且是大数据背后所隐藏的我们想要获取的各种信息资源,而这些信息资源可能只占数据总体的万分之一甚至更少。从这个 角度说,大量的信息其实都是垃圾。不仅如此,许多大数据本身就是模糊的,其中含有大量虚假和有害的内容。如果我们纯粹凭借数据来判断和分析人类行为,甚至不假思索地去利用和 传播某种数据,就会导致许多误判。因此,未经前期调研论证和规范分析所获取的信息,其数据量越大可能越模糊,其得到的垃圾信息也就可能越多,这也为各种数据造假和不当传播打 开了方便之门。对此,我们必须学会辨识和判断数据的真实性,避免因盲目的数据崇拜造成 误判,甚至迷失在大数据的洪流之中。‎ ‎1.下列关于原文内容的表述正确的一项( )‎ ‎(摘自《大数据热中的冷思考》有删减)‎ A.所有数据说到底都是有关"人"的符号,所以大数据时代,个人的信息更多的是以数据为载 体来进行互动的。‎ B.大数据能反映人及其所在社会的价值本性,因此人及其各类社会行为都不能仅仅被看作一 个个数据符号。‎ C.把人及其各类社会行为变为更多的数据符号,我们就可以从数据中解读出充满朝气、富有 激情的人。‎ D.大数据时代不应该脱离了人及其所在社会的价值本性,无限放大大数据的效应及其影响 力。‎ ‎2.下列理解和分析符合原文意思的一项( ) ‎ A.大数据时代,我们真正需要的并不是大数据本身,而是大数据背后所隐藏的我们想要获取 的各种信息资源。‎ B.从某种意义上说,大数据的价值只要在其能够被规范成为可供分析的形式之后就能最大程 度地被挖掘出来。‎ C.许多数据都停留在 "碎片化"阶段而难以被真正挖掘和分析,大数据的"碎片化"导致人们 难以系统认知复杂事物。‎ D.未经前期调研论证和规范分析所获取的信息,其数据量越大越模糊,其得到的垃圾信息也 就可能越多。‎ ‎3.根据原文内容,下列说法正确的一项( )‎ A.大数据的碎片化不仅要求我们在数据清理技术、存储结构上进行优化,而且要在数据采集 环节尽可能地做到规范,才能获得对复杂事物的系统认知。‎ B.因为只有少数人掌握处理这种复杂的巨量化大数据的技术,所以许多本身具有个性特征的 数据已经变得无足轻重了。‎ C.因为有不可数字化的数据,因此尽管其比较、分析和归纳其实反映的都是人在符号层面上 的一种互动,也很难从数据塑造出来有个性特征的人。‎ D.大数据给我们研究和分析社会现象带来便利,但我们也不能盲目的崇拜数据,在大数据热 中应该有冷思考。‎ ‎5.阅读下面的文字,完成下列小题。‎ ‎“大数据”无法触及诗词的本质 陈慧 刘慈欣的短篇小说《诗云》,讲述了一个外星超级智慧生命体试图用“大数据”征服中国 古典诗词的故事。小说想要表达的是,技术是反诗意的,对于依赖个体心灵和内在情感的诗 歌来说,技术永远无法触及诗歌的本质。日前,《清华附小六年级学生用大数据分析苏轼写 了论文》的报道又引发众人关注。这促使我们思考两个问题:将诗词作为“数据”进行检索 研究是否合理?让小学生通过大数据分析进入诗词是否合适?‎ ‎ 诗词与大数据能否相得益彰,要从二者各自的特质说起。无论从创作还是从赏析的角度,‎ 诗词都是一项主观性很强的艺术,正所谓各言其志,诗词中大多寄托着作者的情感体悟,而诗 作的水准则由诗人的才性神思所决定。诗词中的意象和兴味往往只可意会,需要在读者和作 者之间达成某种精神上的默契。 对诗词的欣赏研究,不能一味寻章摘句,因为一首诗词首先是一个有机整体,必须营造出自洽而完整的意境。然而,大数据分析是一项纯客观的方法,是对客观数据的碎片化处理:如对苏轼全部诗词进行分词研究,再从中分析出高频词,此时苏轼的诗词是以“数据”形式呈现 的,仅仅是一个个语词的序列,而非气脉浑成、寄托深远的活泼泼的整体———这不啻为对诗词的解构。 不可否认,大数据在检索、统计、定位方面的高效便捷对研究工作确有帮助,但再先进的技术手段也不能代替对作品本身的体察涵泳,正如捷径无法代替苦功。对苏轼诗词中高频词 的搜索定位,只能得出某些外在印象,无法细腻深刻地触及其内涵和义旨。‎ 小学生应该接受怎样的诗词教育?事实上,我国古代一直有绵延不绝的“诗教”传统,古典 诗词的关键功能在于涵养人的性情,使之归于温厚。正如钱穆所说,文学作品中包含了作家 的全部人格,它对读者的劝诫安慰如朋友兄弟般亲切。伟大的诗人修辞立其诚,吐露真性情, 读者阅读其诗,不仅会为其真情感动,也很容易为其人格及人生境界感动,而心向往之。小学 生使用大数据固然有助于培养科学精神和逻辑思维能力,但这与诗词的教育旨趣相异。拿苏 轼诗词来说,让孩子们将其看作有血有肉、丰富多彩的艺术作品,从具体作品中感受苏轼的 悲欢离合、开朗豁达与家国情怀,并进一步培养起对中国传统人文精神的感知力和理解力, 不是比作为大数据视野下的客观对象而得出粗浅认知,要更有意义吗?‎ ‎《庄子·天地》篇中激烈地拒斥技术,认为技术的滥用会导致心灵的遮蔽。那么小学生使 用大数据,有没有技术的“滥用”之嫌?这个问题姑置不论,重要的是,孩子们的蓬勃诗心不 要就此遮蔽。‎ ‎(选自《文汇报》2019 年 10 月 22 日,有删改)‎ ‎1.下列关于原文内容的理解和分析,正确的一项是( ) ‎ A.用大数据可以从古典诗词中提取出人类的共同情感,有助于把握诗人的心灵和情感。‎ B.对诗词的欣赏研究只能采取整体感知的方法,而大数据无法对数据进行整体化处理。‎ C.大数据分析只是一项纯客观的技术方法,它无法触及诗词的内涵和义旨等本质特性。‎ D.用大数据研究诗词只能获得理性认识,而不能与诗词内外的自然生命发生感情共鸣。‎ ‎2.下列对原文论证的相关分析,不正确的一项是( ) ‎ A.文章第一段援引一篇小说和一则报道,提出论题,并表明了作者“反技术”的态度。‎ B.文章通过对诗词和大数据各自特质的分析,论证了“大数据”研究诗词的不合理性。‎ C.文章将体察涵泳与大数据分析的结果进行对比,论述了感性启发对诗词教育的意义。‎ D.文章论述两个论题之后,指出了大数据对孩子诗心的危害,回应了开头提出的疑问。‎ ‎3.根据原文内容,下列说法不正确的一项是( ) ‎ A.用大数据来处理诗词,没有注意到诗词主观性、整体性的特质,是对美的肢解。‎ B.诗词中的意象和兴味往往只可意会,所以读者无从感知、理解诗人的人文精神。‎ C.大数据分析容易使学生丧失“感动”能力,因而很难真正进入诗人的情感世界。‎ D.在诗词教育中应通过情感教育来帮助人涵养性情,塑造人格,提升人生的境界。‎ ‎6.阅读下面文章,完成下列小题。‎ 大数据的财富与陷阱 ‎ 大数据指所涉及的数据量规模巨大,以至于无法在合理时间内通过人工截取、管理、处理 并整理成为人类所能解读的信息。有人把大数据的特征归纳为 4V:Volume(量大)、Variety ‎(多样)、Velocity(高速)、Value(价值密度低)。大数据首先体现在数据量巨大上。1024‎ 个 GB 是一个 TB,再 1024 个 TB 就是一个 PB,而大数据往往达到 PB 数量级,可见数据量大得 无法想象。其次,就是数据的多样性,交易的品种、卖家的信息、买家的信息、快递的信 息、支付的信息,构成了一个行业多样化的数据链。第三,就是数据产生的速度极快,检索结 果的速度也要求快,要在几百万件商品中查找出一类商品,其检索速度只需要 1 秒,这是传统 技术无法达到的。大数据的内容虽真实、完整地反映了客观世界,但它的价值密度很低,如 果不去研究挖掘,大数据是不会自动产生有用结果的。比如,在街景的海量监控视频中,犯罪 分子留下的踪影也许只有几秒钟。‎ ‎ 英国的大数据权威专家维克托•迈尔•舍恩伯格曾断言人类已经无可逆转地跨入了大数据 时代。大数据时代在生活、工作和思维上给人们带来了巨大变革。首先,是数据的形式由原 来的关系型数据更多地表现为非关系型数据;数据存储方式也由原来集中式存储变为分布式 存储,大型数据不得不存储在不同地方的存储服务器中,通过网络进行互联访问,构成所谓的 云存储。其次,是对数据处理的方式发生了根本变化,人们已无法只用一台电脑处理数据,必 须依赖网络后面的云平台,进行云计算,才能有效处理大数据。在对大数据处理上,有三个变 化:在小数据时代,人们限于获取数据的困难,只能采用随机抽样的方式获取数据样本,然后 根据样本数据进行分析预测。一旦样本出现偏差,那推导出的结果就会产生很大的误差。而 在大数据时代,数据处理的范围是全体,而不再是样本。第二个变化,是不再一味地追求数据 的精确性。由于大数据的多样性、丰富性、动态性,强调数据的精确性是做不到的,也没有 必要。纷繁的数据会混杂在一起,看起来好像全无用处,甚至有些还是错误的数据,但是没有 关系,这就是大数据的本性, 看似无关无用的一堆数据却蕴含着无限商机。第三个变化,是 关注数据之间的相关性,而不是因果关系。比方说,通过挖掘天猫商城的交易数据,发现购买 德龙咖啡机的买家,会有很高的比例购买宠物粮食,那商家会不失时机地推荐你购买皇家狗 粮。咖啡机与狗粮没有因果关系,但却有内在的相关性。数据之间的相关性,就是大数据所 蕴含的价值,也是商家追求的商机。大数据的相关性,告诉我们在面对错综繁杂的大数据时, 我们不需要去研究“为什么”,只要知道“是什么”就足够了。‎ 大数据时代将催生一个数据挖掘行业,出现一批数字科学家。数据挖掘就是从收集的数据 中用一定的算法分析计算,得到我们所需要信息和知识的过程。传统的统计分析是将数据按 已知的类别进行分类统计,然后寻找有价值的数据。数据挖掘采用的是一种叫“聚类”的方 法,它事先不需要人工分类,而是由算法分析数据的属性,将数据自动聚集成“类”,使“类”间的相似性尽量小,“类”内的相似性尽量大。比方说,保险业务涵盖各类人群、各 种职业,所以设计某个险种潜在的客户目标群,需要对大量数据进行挖掘,才能找出不同的客户群和重要系数,这不是事先人为设定的。要“让数据自己说话”,这样才能因地制宜地制订营销计划,科学测算盈亏平衡,为保险企业创造更多利润。‎ ‎(《科技博览》2019.7.28,有删节)‎ ‎1.下列关于“大数据”的表述,不正确的一项是( ) ‎ A.大数据所涉及的数据量规模巨大,往往达到 P 数量级,相关信息无法在合理时间内靠人工 截取、管理、处理并整理成为人们可以解读的信息。‎ B.大数据的特征被人概括为 4V,即 Volume(量大)、Variety (多样)、Velocity(高速)、‎ Value(价值密度低)。‎ C.大数据具有多样性的特点,且交易品种、交易双方、物流快递、支付方式等信息,虽然呈 现为碎片化状态,却能构成一个数据链。‎ D.大数据具有速度快,内容真实等特点,完整反映了客观世界,却又有价值密度很低的特点,‎ 赖于人们对此进行研究挖掘,方能应用。‎ ‎2.下列对文章内容的理解和分析,不恰当的两项是( )( ) ‎ A.大数据并不是现代社会特有的产物,任何时代都会产生自己的大数据。‎ B.对所存储数据应进行控制与筛选,避免因数据过大造成的分析困难。‎ C.如果没有相关技术与有效的分析手段支持,所谓的大数据没有价值。‎ D.无论个人还是企业,都可以从对大数据的应用中获得极大的切实收益。‎ E.因为大企业管理严格,所以它们收集使用用户个人信息数据不会泄露。‎ ‎3.根据文意,请分条概括大数据具有哪些特点。‎ ‎7.阅读下面的文字,完成下列小题。‎ 大数据时代 ‎“大数据时代”的说法并不新鲜,早在 2019 年,美国数据科学家维克托·迈尔·舍恩伯格 在《大数据时代》一书中就系统地提出,以前,一旦完成了收集数据的目的之后,数据就会被 认为已经没有用处了。比如,在飞机降落之后,票价数据就没有用了;一个网络检索命令完成 之后,这项指令也已进入过去时。但如今,数据已经成为一种商业资本,可以创造新的经济利 益。‎ 数据能够成为一种资本,与移动互联网有密切关系。随着智能手机、平板电脑等移动数码 产品的“白菜化”,WIFI 信号覆盖的无孔不入,越来越多的人不再有“在线时间”和“不在 线时间”之分,只要他们愿意,便可几乎 24 小时一刻不停地挂在线上;在线交易、在线支 付、在线注册等网络服务的普及固然方便了用户,却也让人们更加依赖网络,依赖五花八门的网上平台。 大数据时代的科技进步,让人们身上更多看似平常的东西成为“移动数据库”,如带有存储芯片的第二代银行卡、信用卡,带有芯片读取功能的新型护照、驾驶证、社保卡、图书证 等等。在一些发达国家,官方为了信息录入方便,还不断将多种“移动数据库”的功能组合成一体。 数字化时代使得信息搜集、归纳和分析变得越越方便,传统的随机抽样被“所有数据的汇拢”所取代,基于随机抽样而变得重要的一些属性,如抽样的精确性、逻辑思辨和推理判断 能力,就变得不那么重要,尽可能汇集所有数据,并根据这些数据得出趋势和结论才至为关键。‎ 简单地说,以往的思维决断模式是基于“为什么”,而在“大数据时代”,则已可直接根 据“是什么”下结论,由于这样的结论剔除了个人情绪、心理动机、抽样精确性等因素的干 扰,因此,将更精确,更有预见性。‎ 不过,一些学者指出,由于“大数据”理论过于依靠数据的汇集,那么一旦数据本身有问题,‎ 在“只问有什么,不问为什么”的模式下,就很可能出现“灾难性大数据”,即因为数据本身 的问题,而做出错误的预测和决策。‎ 斯坦福大学专家特沃尔·哈斯蒂也指出,“大数据”的理论是“在稻草堆里找一根针”,‎ 而面临的问题是“所有稻草看上去都挺像那根针”。而乔治·梅森大学专家瑞贝克·高尔 丁则提出“数据提供者造假”的危险,在“大数据时代”变得更有害,因为“大数据”理论 建立在“海量数据都是事实”的基础上,但人们无法控制数据提供者和搜集者本人的偏见和 筛选。‎ 由于“大数据”炙手可热,数据的流失、泄露和私下买卖也成为噩梦,全球各地不时发生 的个人信息被盗,可被看作“大数据时代”对个人生活的伤害,而“维基泄密事件”则提醒 强力部门和各国政府,“大数据”的魔力同样会对强者构成威胁。‎ ‎(《国际先导报》2019 年 7 月 5 日,有删节)‎ ‎1.下列选项中,不属于“危险大数据”的内容的一项是( ) ‎ A.如果过于依靠数据的汇集,一旦数据本身有问题,就会可能导致“灾难性大数据”出现。‎ B.“所有数据的汇拢”使随机抽样中的精确性、逻辑思辨和推理判断能力变得不重要。‎ C.“大数据”理论需要海量数据都是以事实作基础,但人们无法控制数据都是真实的。‎ D.“大数据”一旦流失泄露和私下买卖,不但对个人生活,甚至对各国政府都会带伤害。‎ ‎2.根据原文提供的信息,下列对“大数据时代”的阐述,不符合原意的一项是( ) A.“大数据时代”,根据“是什么”下的结论剔除了个人情绪、心理动机等因素的干扰,因 此,与传统的随机抽样相比更精确,更有预见性。‎ B.“移动互联网”提供了数据传输的网络服务,赋予了“大数据”的商业资本价值。‎ C.带有存储芯片的第二代银行卡、信用卡、新型护照、驾驶证、社保卡、图书证等固然给 你带方便,但数据的流失、泄露和被人私下买卖,也可能成为你的噩梦。‎ D.“灾难性大数据”的出现,是因为收集者不负责任地“只问有什么,不问为什么”。‎ ‎3.根据原文内容,下列理解和分析不正确的一项是( ) ‎ A.在数字化时代,人们需要的是更精确、更有预见性的结论,数据的搜集、归纳和分析也变 得方便起,因此,传统的数据抽样的准确性、逻辑思辨和推理判断能力等要素的地位有所降 低。‎ B.数据提供者提供的数据有时不够全面,搜集者有个人的偏见和筛选角度,往往导致“所有 稻草看上去都挺像那根针”,以致得出的结论似是而非,好像都是正确的。‎ C.“在稻草堆里找一根针”,就是说在“大数据”中找出自己需要的小数据,这就需要使用 者耐心、细致地去寻找,需要顽强的毅力。‎ D.适应时代发展,提醒人们小心应对“大数据”时代,在数据的运用上趋利避害,这是本文作 者的写作意图,也是对人们的告诫。‎ ‎8.阅读下面的文字,完成 1〜3 题。‎ 工业化时代,学校教育映射了工业化集中物流的经济批量模式:铃声、班级、标准化的 课堂、统一的教材、按照时间编排的流水线场景。这种教育为工业时代标准化“制造”了 可用的人才。而大数据教育将呈现另外的特征:弹性学制、个性化辅导、 社区和家庭学 习、每个人的成功。世界也许会因此安静许多, 而数据将火热地穿梭其中,人与人(师生、‎ 生生)的关系将通过人与技术的关系来实现,正如现在过春节拜年,不通过短信、电话、视 频、微信,还能像 20 年前那样骑自行车挨家挨户拜年吗? 大数据时代,无论你是否认同技术 丰富了人类的情感,技术的出现,都让我们再也回不到从前了。‎ 一个学生考试得了 78 分,这只是一个“数字”,如果把背后的因素——家庭背景、努力程 度、学习态度、智力水平等与 78 分联系在一起,就成了“数据”。大数据与传统的数据相 比,有非结构化、数据量巨大、数据分析由专家层变化为用户层、大量采用可视化展现方法 等特点,这些特点正好适应了个性化和人性化的学习变化。目前教育变革的讨论,过多集中 于在线教育 (远程、平板、电子、数字),这正像任何一种科技让人们最先想到的都是偷懒 的哲学,自动化时代最先想到的是卓别林电影中的自动吃饭机,多媒体时代最先想到的是游 戏。在线教育本身很难改变学习,在这场教育革命的浪潮中,由在线教育引发的教育从数字 支撑到数据支撑的变化,却是很多人没有在意的巨大金矿。 教育环境的设计、教育实验场景的布置、教育时空的变化、 学习场景的变革、教育管理 数据的采集和运用,这些过去靠“拍脑袋”或者理念灵感加经验的事情,在云计算、物联 网、大数据的背景下,变成一种数据支撑的行为科学。教育将成为继经济学之后,一门不再 靠理念和经验传承的社会科学,大数据时代的教育,将变成一门实实在在的实证科学。 目前的经济社会,已经进入后工业化的大数据时代,人与机器的主流社会关系逐渐转向人 与数据之间的关系,若干年后社会的竞争将以服务和创新为核心,然而我们今天的教育还受 制于减少犯错和标准化的“魔咒”。大数据教育提供了另外一种可能,标准化的教育将转向 网络完成,而个性化的人才培养将主要由学校承担:越来越小的班级、越来越近的学校、越 来越聚焦的教育支持、越来越个性化的培养方式。这将使教育摆脱工业化时代的模式。‎ ‎1.下列关于大数据教育的表述,符合原文意思的一项是( ) ‎ A.工业化时代的教育标准化地培养人才,导致人才的个性和创新性不足,这样的弊端直接催 生了大数据教育。‎ B.大数据教育的特点是非结构化、数据量巨大、数据分析由专家层变化为用户层、大量采 用可视化展现方法等。‎ C.以数据支撑为标志的大数据教育具有巨大的开发潜力和社会效益,但不少人没有对它给予 应有的关注。‎ D.大数据教育将不再是靠理念和经验传承的社会科学,而会成为继经济学之后的第二门实实 在在的实证科学。‎ ‎2.下列不属于大数据将给教育带来的变化的一项是( )‎ A.教育环境的设计、教育实验场景的布置、学习场景的变革、 教育管理数据的采集和运用 等由数据支撑。 ‎ B.老师与学生、学生与学生甚至他们与家长、社区交流的大量信息得以处理为数据,可以丰 富教育资源。‎ C.将优质课堂教学资源传送到教育发展滞后的学校,学生们在校即时同步学习,扩大优质资 源的覆盖面。‎ D.累积足够的学生个体信息并据此对学生进行个性化辅导, 从而最大可能地实现每个人的 进步与成功。‎ ‎3.下列对文章有关内容的理解和分析,不正确的一项是( ) ‎ A.“大数据教育”中的“数据”不是孤立的“数字”,而是对数字及其相关资料、信息进行 处理所形成的“数据”。‎ B.大数据教育时代,随着教育时空的变化、学习场景的变革, 情感交流和思想教育将会出现 新的情况。‎ C.工业化时代的教育培养的少犯错和标准化的人才,难以适应后工业化大数据时代经济社会 对人才的需求。‎ D.大数据教育由网络完成标准化教育,而学校主要承担个性化人才的培养工作,教师需求量 将大为减少。‎ ‎9.阅读下面的文字,完成后面问题。‎ 近年来伴随着不少国家的宽带化战略的实施、云计算服务的起步、物联网应用的铺开 和移动互联网的崛起,数据量与时俱增,数据处理能力也发展迅速,数据量积累到一定程度其 资源属性越加明晰,显示出开发的价值。同时,社会的节奏越来越快,要求快速的反应和精细 的管理,急需借助对数据的分析来科学决策,催生了对大数据开发的需求,大数据被称为将引 发生活、工作和思维变革的一次革命。‎ 大数据是相对于一般数据而言的,目前对大数据尚缺权威的严格定义,但较普遍的解释是 指“难以用常规的软件工具在容许的时间内对其内容进行抓取、管理和处理的数据集 合”。规模大是大数据的标志之一,但大数据之所以难处理不仅在于规模大,更大的挑战是其随时间的变化快和类型的多样性,根据可否用表格或关系数据库的表和视图来表示而区分 为结构型和非结构型数据,照片和视频等就是典型的非结构数据。随时间和类型的变化增加了大数据的复杂性但也同时丰富了大敷据的内涵。通常用 4V( Volume、Velocity、Variety、Value)来反映大数据的特征,即量大、增长快、多样性和高价值。从这一点来看,对大数据仅仅冠以“大”这一形容词是不全面的,只不过在大数据的 4V 中,规模相对于变化和类型这两个特征容易定量,而且即便是单一类型的数据集(例如文本文件),只要有足够的 规模也能称得上大数据。数据的规模越大,通常对数据挖掘所得到的事物演变规律越可信, 数据分析的结果也越有代表性,因此对大数据这一词汇突出其规模大这一特征也是可理解 的。‎ 大数据不仅是一种资源,也是一种方法,伴随大数据产生数据密集型科学,有人将它称为是 ‎ 继实验科学、理论科学和计算科学之后的第四种科学研究模式,这一研究模式的特点表象为 不在意数据的杂乱,但强调数据的量;不要求数据精准,但看重其代表性;不刻意追求因果关 系,但重视规律总结。这一模式不仅用于科学研究,更多的会用到各行各业,成为从复杂现象 中透视本质的有用工具。有人担心从大数据中发现事物发展规律并预测未来的做法强调了 有章可循,可能会妨碍创新。事实上检验技术创新、商业模式创新还是管理创新,不是看是 否使用新的模式或颠覆性技术,而是看应用领域酌开拓和市场上的引领,成功的重要因素正 是符合客观规律。苹果公司的 iPhone 用触摸屏代替键盘并开发了 AppStore 应用商店,完善 了移动互联网的产业链,开创了移动智能终端时代,方便了用户的使用,顺应并引导移动互联 网的发展,这是大数据思维与创新文化结合的范例。大数据还是一个新学科,大数据技术是 指设计用于高速收集、发现和分析从多种类型的大规模数据中提取经济价值的新一代技术 和体系,涉及数据存储、合并压缩、清洗过滤、格式转换、统计分析、知识发现、可视呈 现、关联规则、分类聚类、序列路径和决策支持等技术。大数据将带动起大数据产业和市 场,包括服务器、存储器、联网设备、软件与服务。总之,大数据服务业属性大于制造业,对 其他产业的影响大于对直接产业的影响,社会效益大于直接经济效益。大数据影响之大和受 到广泛重视也正是因其溢出效应明显。‎ ‎1.下列关于大数据的表述,不正确的一项是( )‎ ‎(有删改)‎ A.大数据是伴随着各种现代信息量剧增、各行业信息化程度提升、各类信息资源属性日益 明晰而开发的。‎ B.大数据是指难以用日常的软件工具在许可的时间内对有关内容进行集合的各类数据。‎ C.大教据不仅仅在于数字“大”,而且还有增长变化快、品种类型多、价值高昂等特征。‎ D.大数据分析结果所具有的代表性,取决于对数据挖掘所得到事物演变规律的可信度。‎ ‎2.下列理解和分析,不符合原文意思的一项是( ) ‎ A.大数据的类型有多样性,能用表格或关系数据库的表和视图来表示的为结构性数据,否则 为非结构性数据。‎ B.大数据可以催生一种新的科学研究模式——数据密集型科学,这种模式应用广泛,并能从 事物复杂的现象中透视其本质,因此说大数据也是一种方法。‎ C.从大数据中发现事物的发展规律并预测未来的做法,不仅不会影响创新,而且有利于开拓 和引领更广阔的应用领域和市场。‎ D.大数据作为一门新学科,其技术涉及领域众多,带动的产业市场广泛,其服务业的属性、影 响和效益明显超出预期的社会效应。‎ ‎3.根据原文内容,下列不属于大数据运用的一项是( )‎ A.某市市民上街反对“PX 化工项目”上马,就在市民集会前—周,有关该项目的百度搜索关 注度剧增。‎ B.某数讯公司掌握了 2 万部电影、6 万名艺人、4000 位导演的数据资料,并能对微博关注影 视娱乐的 1.2 亿人进行偏好分析。‎ C.某学校对全校 4000 名学生的个人资料进行归类整理,结合平时的表现有针对性地进行当 而谈话或家访,并及时更新有关资料。 ‎ D.某商业机构基于每月几千万的网络购物数据,结合网络产品的大众评分,开发搜索引擎 ‎“南方神”,供在线购物者浏览,在线购物人数增加一成多。‎ 二、语言表达 ‎1.把下面的几个短句改写成长句,可以改变语序、增删词语,但不得改变原意。‎ ‎①大数据是海量数据的集合。‎ ‎②它是由结构复杂、类型众多的数据构成。‎ ‎③它需要新处理模式才能具有更强的决策力和流程优化能力。‎ ‎④这种数据集合无法在一定时间范围内用常规软件工具进行捕捉、管理和处理。‎ ‎2.在下面一段文字的空白处填写恰当的语句,使整段文字语意完整,逻辑严密,前后连贯。‎ 大数据是一种工具。它告知信息但不解释信息。它指导人们去理解,① ,这取 决于是否被正确使用。人们能收集和处理到的数据只是世界上极其微小的一部分。‎ ‎② ,所以做出的预测本身就不可靠。但这也不代表预测就一定是错的,只是永远 不能做到完善。③ ,而是参考答案,只能为我们提供暂时的帮助,以便等待更好的 方法和答案出现。‎ ‎3.在下面一段文字横线处补写恰当的语句,使整段文字语意完整连贯,内容贴切,逻辑严密。 毎处不超过 15 个字。‎ ‎①_ 。人们在因大数据受益的同时,也面临着巨大的挑战,个人隐私保护问题就 是其中之一。那么,② ?这是整个社会都需要思考和关注的社会问题。在这个信 息大爆炸的时代,网络上保留了用户太多的个人数据。无论运营商在技术层面做了多大努力,‎ 数据的来源始终来自用户自己,因此,③ ,才是根本之策。‎ ‎4.在下面一段文字横线处补写恰当的语句,使整段文字语意完整连贯,内容贴切,逻辑严密,‎ 每处不得超过 15 个字。‎ ‎① ?首先,大数据必须是随时随地能调用,并且马上被计算的,而不是储存在磁 带、U 盘等软件工具中的数据。其次,② 。我们上天猫搜索一个商品,数十亿商 品、几百万个卖家、一亿的消费者,瞬间完成匹配呈现,这才能称之为“大数据”。最后,大 数据还有一个特征,就是数据的全面性。大数据不是样本思维,它是一个完整的全面的系 统。与传统数据相比,③ ,但是,传统数据并没有退出历史舞台,在某些特殊的领 域,传统数据发挥的作用还是无可替代的。‎ 三、选择题 ‎5.填入下面文段空白处的词语,最恰当的一组是( )‎ 大数据带给我们一个颠覆性的观念转变: ① 随机样本, ② 全体数据。在大数据时代,‎ 我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的的所有数据, ③ 不 再依赖于随机采样,以前我们通常把这看成是理所应当的限制, ④ 高性能的数字技术让我 们意识到,这 ⑤ 是一种人为限制。‎ ‎①‎ ‎②‎ ‎③‎ ‎④‎ ‎⑤‎ A 不是 而是 但 或许 就 B 不仅是 而且是 ‎/‎ 同时 根本 C 不是 而是 而 但 其实 D 既是 又是 所以 但是 实在 A.A B.B C.C D.D ‎6.填入下面一段文字横线处的语句,最恰当的一句是( )‎ 大数据的发展要遵循实践应用与理论升华相结合的科学路径。事实上,在大数据的概念被 提出之前,已经有很多关于大数据获取、存储、处理和应用的研究和实践成果。 。‎ 基于这点,我们要建立并完善大数据相关的理论体系,以更好地发现和利用大数据的潜在价 值,推动大数据产业的健康发展。‎ A.理论的升华一定能够促进实践的发展,即使不少大数据实践应用是在理论研究之前 B.虽然实践应用先于理论研究,但是凝炼的理论升华是实现大数据社会价值的必须 C.因为理论指导实践是普遍的科学研究路径,所以建立完善的大数据理论是很重要的 D.实践应用与理论研究是相辅相成、缺一不可的,厚此薄彼的做法是错误的发展路径 参考答案 一、现代文阅读 ‎1.答案:1.D; 2.BD; 3.①服务大数据应用,提高互联网中大数据价值再造水平,提供更有价 值的产品与服务,让我们享有更高品质的生活。‎ ‎②为大数据应用与人工智能的深度融合应用提供技术支撑,助推智能机器人制造,让我们享 有更智能更便捷的优质生活与服务。 解析:1.本题考查筛选文中重要信息的能力。解答时要找出文章中相对应的语句,注意将选 项转述内容与原文内容逐一比对,寻找细微的差别确定答案。D 项,“经过云计算整合后形 成大数据”不当,由材料二图表可以看出,应是个人、企业用户因产品或服务而产生的数据,‎ 整合成大数据,再经过云计算反馈给各行业生产者,实现价值再造。‎ ‎2.B 项,无中生有。“表明我国超算研制水平和高性能计算应用能力已全面超越欧美,位居 世界第一”文中没有依据。虽然文中提到“‘神威·太湖之光’,系统采用全国产处理器构 建,峰值性能超过每秒 12.5 亿亿次,是世界第一的超级计算机”,但并不能由此得出“全面 超越欧美,位居世界第一”的结论。‎ D 项,强加因果。“他们能克服种种困难,完成研发任务”与“年轻”没有必然的因果联 系。‎ ‎3.本题解答时可通读全文,根据题干要求筛选出相关信息,再进行概括即可。由材料三 ‎“‘神威·太湖之光’有着大数据应用的天然优势”,可总结出“神威·太湖之光”这一类 的超级计算机可以服务于大数据应用,再结合材料一、材料二对大数据的介绍,可总结出提 高互联网中大数据价值再造水平,提供更有价值的产品与服务;由“现在的大数据应用与新 一代人工智能密切结合,‘神威·太湖之光’将为二者深度融合应用提供技术支撑”可总结 出为大数据应用与人工智能的深度融合应用提供技术支撑;由“未来,国家超算无锡中心将 是一所‘人工智能’大学”“这所大学的学生……是人工智能机器人”,可总结出助推智能 机器人制造。‎ ‎2.答案:1.C; 2.AE; 3.①推动大数据产业发展上升为国家战略;‎ ‎②以点带面,形成集聚效应促进产业发展;‎ ‎③重视大数据技术的创新;‎ ‎④调动企业的积极性;‎ ‎⑤重视相关服务体系建设;‎ ‎⑥重视大数据安全。 解析:1.我国综合试验区大数据发展指数增幅超过全国其他地区”表述错误,文中是均值增 幅超过。‎ ‎2.“中国‘大数据’时代会最快到来”说法不当。‎ E 项以偏概全 ‎3.答案:1.C; 2.A; 3.C; 4.D; 5.A; 6.C; 7.D; 8.大数据改变了人们的思维方式,对人类 的认知方式和交流方式提出了新挑战;‎ 大数据让老百姓生活更便利,给各行各业的发展带来变化;‎ 大数据在快速发展的同时,带来了伦理问题,需要进行冷思考、积极应对。 解析:‎ ‎4.答案:1.D; 2.C; 3.D 解析:1.A 不构成因果关系 B 文中没有说大数据能反映人及其所在社会的价值本性,前后句 也不构成因果关系 C 原文说“如果人及其各类社会行为都仅仅被看作一个个数据符号,我们 就很难从数据中解读”。‎ ‎2.A 原文“我们真正需要的并不仅仅是”B 原文“只有”“才能”D 原文“其数据量越大可 能越模糊”。‎ ‎3.A“这不仅要求”这代指不是碎片化 B 不构成因果关系 C 不构成因果关系。‎ ‎5.答案:1.C; 2.A; 3.B 解析:1.A 根据原文,诗歌依赖的是诗人“个体”的心灵和内在情感,而非人类的“共同”‎ 情感。‎ B 原文强调的是“一首诗词是一个有机整体”,“整体感知”是欣赏研究诗词应遵循的原则,‎ 而不是唯一的方法。‎ D 原文是说“用大数据研究诗词获得的是‘外在印象’‘粗浅认知’,而不是‘理性认 识’”‎ ‎2.本文并非持一种简单的“反技术论”,只是想强调不适宜用存在根本差异的方法来研究古 典诗词,原文中有“不可否认,大数据……确有帮助”“小学生使用大数据……能力”等提 示 ‎3.“无从”绝对化了,读者是可以从感性到理性逐步培养起自己对诗人的人文精神的感知力 和理解力的,原文中有“让孩子们将其看作有血有肉、丰富多彩的艺术作品……感知力和理 解力”的提示 ‎6.答案:1.C; 2.BE; 3.①数据庞大;‎ ‎②种类复杂;‎ ‎③产生及传送频率快;‎ ‎④获取数据成本高;‎ ‎⑤待挖掘价值大。 解析:‎ ‎7.答案:1.B; 2.D; 3.C 解析:1.B 项表述的是“所有数据的汇拢”(即“大数据”)取代“传统的随机抽样”后的 意义,并未涉及“危险”或“灾难”。选项答非所问。‎ ‎2.原文认为“灾难性大数据”产生的原因是“数据本身有问题”,而选项将原因归于“收集 者不负责任”,属于无中生有。‎ ‎3.C 项,原文所说的“在稻草堆中找一根针”是从“大数据”中筛选人们所需要信息的比喻,‎ 意思是,从大量信息中找到人们需要的极小比重的信息,而选项表述为对使用者的要求,曲解 文意。‎ ‎8.答案:1.C; 2.C; 3.D 解析:1.A.因果混乱。“工业化时代的教育标准化地培养人才,导致……不足”,这一弊端 并没有“直接催生了大数据教育”。B.张冠李戴。这一特点是“大数据”的,而不是“大数 据教育”的。‎ D.张冠李戴。将变成实证科学的是“教育”,而不是“大数据教育”。‎ ‎2.无中生有。选项内容在原文中根本没有提及。‎ ‎3.无中生有。“教师需求量将大为减少”之说于文无据。‎ ‎9.答案:1.B; 2.D; 3.C 解析:1.“大数据是”“对有关内容进行集合的各类数据”错,原文是说“对其内容进行抓 取、管理和处理的数据集合”。‎ ‎2.“从而受到广泛重视,并产生了明显的社会效应”错,原文是“大数据影响之大和受到广 泛重视也正是因其溢出效应明显”。‎ ‎3.根据文意,C 项所指数据不符合大数据的特征,且在大数据产生之前就有。‎ 二、语言表达 ‎10.答案:大数据是由结构复杂、类型众多的数据构成的无法在一定时间范围内用常规软件 工具进行捕捉、管理和处理而需要新处理模式才能具有更强决策力和流程优化能力的海量 数据的集合。‎ 解析:‎ ‎11.答案:有时也会引起误解; 因为我们无法获得完美的信息; 大数据提供的不是最终答案 解析:本题考查学生补写句子的能力。①由“是否被正确使用”可推测出在它之前有两种 相反文意与其照应,所以该填写与前句“指导人们去理解”相反的文意。②由后句的关联词 ‎“所以”推出该空有关联词“因为”,再由后句的“只是永远不能做到完善”推测出该空有 ‎“不完美”之意。③后的关联词“而是”看出该空有对应的关联词“不是”,从后几句的 ‎“参考答案”“暂时”“等待更好的答案”看出,该空应该强调的是“最终答案”。‎ ‎12.答案:大数据是一把“双刃剑” ; 如何在大数据时代下保护个人隐私; 用户要保护好 自己的个人数据 解析:‎ ‎13.答案:大数据与传统的数据差别何在; 大数据必须反应迅速及时; 大数据的价值和优势 更加凸显 解析:‎ 三、选择题 ‎14.答案:C 解析:本题考查关联词的运用。考生应先浏览语段,把握整体内容,然后依据关联词的搭配 和句间的关系进行排除。这段文字是讲述“大数据带给我们一个颠覆性的观念转变”,第一 处和第二处属于并列关系,排除“不仅是……而且是……”这组选择关系;第三处,前面说 “可以……”,后面说“不再依赖……”,这两者之间是轻微的转折关系,排除 D 项;第四处, 前面说“以前我们通常把这看成是理所应当的限制”,后面说“高性能的数字技术让我们意 识到,这是一种人为限制”,前后是转折关系。‎ ‎15.答案:B 解析:A 项,“……一定能够……”的说法过于绝对。C 项,“理论指导实践……”的做法与 语段表述的话题不一致。D 项, 与文意不符。‎
查看更多

相关文章

您可能关注的文档