联大学堂郑州城市职业学院数据采集与分析基础网上考试答案
支撑大数据业务的基础是()。 |
A.数据科学 B.数据应用 C.数据硬件 D.数据人才 |
|
当前大数据技术的基础是由()首先提出的。 |
A.微软 B.百度 C.谷歌 D.阿里巴巴 |
|
关于BC式下列说确的是_________。 |
A.如果R∈3NF,则R一定是BCNF B.若R∈3NF,且不存在主属性对非码的函数依赖,则其是BCNF C.如果R∈BCNF,则R∈3NF D.以上说法都不对 |
|
若事务T对数据对象A加上S锁,则()。 |
A.事务T可以读A和修改A,其它事务只能再对A加S锁,而不能加X锁。 B.事务T可以读A但不能修改A,其它事务能对A加S锁和X锁。 C.事务T可以读A但不能修改A,其它事务只能再对A加S锁,而不能加X锁。 D.事务T可以读A和修改A,其它事务能对A加S锁和X锁。 |
|
下列关于计算机存储容量单位的说法中,错误的是()。 |
A.1KB<1MB<1GB B.基本单位是字节(Byte) C.一个汉字需要一个字节的存储空间 D.一个字节能够容纳一个英文字符, |
|
SQL的GRANT和REVOKE语句主要用来维护数据库的_________。 |
A.安全性 B.完整性 C.可靠性 D.一致性 |
|
在数据库中,产生数据不一致的根本原因是____。 |
A.数据存储量太大; B.没有严格保护数据 C.未对数据进行完整性控制 D.数据冗余 |
|
数据库系统的基本特征是_________。 |
A.数据的统一控制 B.数据共享性和统一控制 C.数据共享性、独立性和冗余度小 D.数据共享性和数据独立性 |
|
下列关于大数据的分析理念的说法中,错误的是()。 |
A.在数据基础上倾向于全体数据而不是抽样数据 B.在分析方法上更注重相关分析而不是因果分析 C.在分析效果上更追究效率而不是绝对精确 D.在数据规模上强调相对数据而不是绝对数据 |
|
以下是信息世界的模型,且实际上是现实世界到机器世界的一个中间层次的是_________。 |
A.数据模型 B.E-R图 C.关系模型 D.概念模型 |
|
设有关系R和S,关系代数表示的是_________。 |
A.R∩S B.R―S C.R÷S D.R∪S |
|
()反映数据的精细化程度,越细化的数据,价值越高。 |
A.规模 B.活性 C.关联度 D.颗粒度 |
|
从E-R模型关系向关系模型转换时,一个M:N联系转换为关系模式时,该关系模式的码是_________。 |
A.M端实体的码 B.N端实体的码 C.M端实体码与N端实体码组合 D.重新选取其他属性 |
|
在关系代数运算中,五种基本运算为_________。 |
A.并、差、选择、投影、连接 B.并、交、选择、投影、笛卡尔积 C.并、差、选择、投影、笛卡尔积 D.并、除、投影、笛卡尔积、选择 |
|
数据库的网状模型应满足的条件是() |
A.允许一个以上结点无双亲,也允许一个结点有多个双亲 B.必须有两个以上的结点 C.有且仅有一个结点无双亲,其余结点都只有一个双亲 D.每个结点有且仅有一个双亲 |
|
下列国家的大数据发展行动中,集中体现“重视基础、首都先行”的国家是()。 |
A.美国 B.日本 C.中国 D.韩国 |
|
下面关于关系数据库式的描述中,错误的是。_________ |
A.关系满足的式越低,则更新操作的代价就越高 B.关系满足的式越高,则更新操作的代价就越低 C.关系满足的式越高,则查询操作的代价就越高 D.关系满足的式越低,则查询操作的代价就越高 |
|
数据库的完整性是指数据的________和________。(1)正确性(2)合法性(3)不被非法存取(4)相容性(5)不被恶意破坏 |
A.(1)和(3) B.(2)和(5) C.(2)和(4) D.(1)和(4) |
|
大数据的最显著特征是()。 |
A.数据规模大 B.数据类型多样 C.数据处理速度快 D.数据价值密度高 |
|
当将局部E-R图集成为全局E-R图时,如果同一对象在一个局部E-R图中作为实体,而在另一个局部E-R图中作为属性,这种现象称为_________。 |
A.属性冲突 B.命名冲突 C.结构冲突 D.语义冲突 |
|
在合并分E-R图时必须消除各分图中的不一致。各分E-R图之间的冲突主要有三类,即属性冲突、命名冲突和结构冲突,其中命名冲突是指()。 |
A.命名太长或太短 B.同名异义或同义异名 C.属性类型冲突 D.属性取值单位冲突 |
|
数据库管理系统能实现对数据库中数据的查询、插入、修改和删除等操作的数据库语言称为() |
A.数据定义语言(DDL) B.数据管理语言 C.数据操纵语言(DML) D.数据控制语言 |
|
下列关于聚类挖掘技术的说法中,错误的是()。 |
A.不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别 B.要求同类数据的内容相似度尽可能小 C.要求不同类数据的内容相似度尽可能小 D.与分类挖掘技术相似的是,都是要对数据进行分类处理 |
|
学校数据库中有学生和宿舍两个关系:学生(学号,姓名)和宿舍(楼名,房间号,床位号,学号)假设有的学生不住宿,床位也可能空闲。如果要列出所有学生住宿和宿舍分配的情况,包括没有住宿的学生和空闲的床位,则应执行() |
A.全外联接 B.左外联接 C.右外联接 D.自然联接 |
|
大数据的起源是()。 |
A.金融 B.电信 C.互联网 D.公共管理 |
|
KNIME是一个对用户友好的、智能、开源的平台。该平台包括了()、()、()、()。 |
A.数据集成 B.数据处理 C.数据分析 D.数据挖掘 |
|
当前大数据技术的基础包括() |
A.关系型数据库 B.分布式数据库 C.分布式文件系统 D.分布式并行计算 |
|
下列关于基于大数据的营销模式和传统营销模式的说法中,错误的是()。 |
A.传统营销模式比基于大数据的营销模式投入更小 B.传统营销模式比基于大数据的营销模式针对性更强 C.传统营销模式比基于大数据的营销模式转化率低 D.基于大数据的营销模式比传统营销模式实时性更强 E.基于大数据的营销模式比传统营销模式精准性更强 |
|
以下哪些指标是衡量大数据应用成功的标准? |
A.速度更快 B.成本更低 C.风险更低 D.质量更高 |
|
大数据的预测价值体现在:() |
A.预测热卖品及交易额 B.预测经营趋势 C.评价 D.预测用户的偏好、流失 |
|
下列关于数据生命周期管理的核心认识中,正确的是()。 |
A.数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段 B.在不同的数据存在阶段,数据的价值是不同的 C.根据数据价值的不同应该对数据采取不同的管理策略 D.数据生命周期管理旨在产生效益的同时,降低生产成本 E.数据生命周期管理最终关注的是社会效益 |
|
医疗大数据特点:除了包含了大数据4个“V”的特点之外还有() |
A.多态性 B.时效性 C.不完整性 D.冗余性 |
|
以下属于推荐系统算法的是() |
A.CF协同过滤算法 B.聚类及相似度算法 C.基于知识推理算法 D.关联规则算法 |
|
移动行业的通用需求: |
A.人群分布 B.分类应用排行 C.终端市场趋势 D.设备分布 |
|
大数据有哪些价值? |
A.生产数据的价值 B.用户身份识别 C.预测价值 D.实时价值E.描述价值 |
|
层次方法可以分为() |
A.K均值算法 B.K中心点算法 C.凝聚法 D.分裂法 |
|
下列关于脏数据的说法中,正确的是()。 |
A.格式不规范 B.编码不统一 C.意义不明确 D.与实际业务关系不大 E.数据不完整 |
|
百度大数据引擎主要包含三大组件() |
A.开放云 B.数据工厂 C.百度大脑。 D.以上都不对 |
|
下列各项表述中正确的有哪些? |
A.我国中央网络安全和信息化领导小组宣告成立是在2014年。 B.中央网络安全和信息化领导小组组长是李克强。 C.中央网络安全和信息化领导小组组长是习近平。 D.我国中央网络安全和信息化领导小组宣告成立是在2013年。 |
|
按照服务目的不同,数据流通平台可分为() |
A.数据废气交易市场 B.政府数据开放平台 C.数据研发市场 D.企业数据开放平台 E.数据交易市场 |
|
()是大数据运用的基础。 |
A.隐私问题 B.有用的数据 C.数据统计有效性 D.覆盖率 |
|
传统数据密集型行业积极探索和布局大数据应用的表现是()。 |
A.投资入股互联网电商行业 B.打通多源跨域数据 C.提高分析挖掘能力 D.自行开发数据产品 E.实现科学决策与运营 |
|
中心性研究的意义是在于衡量节点的() |
A.约束力 B.影响力 C.权力 D.控制力 |
|
当前,大数据产业发展的特点是() |
A.增速缓慢 B.增速很快 C.规模较小 D.规模较大 E.多产业交叉融合 |
|
大数据的价值体现在() |
A.大数据助力智慧城市提升公共服务水平 B.大数据给思维方式带来了冲击 C.大数据的发力点在于预测 D.大数据为政策制定提供科学论据 E.大数据实现了精准营销 |
|
一个HDFS集群由一个()和()构成。此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。 |
A.一个名字节点 B.若干个名字节点 C.一个数据节点 D.若干个数据节点 |
|
可视化工具包括() |
A.Excel B.GoogleChart C.Gephi D.ppt |
|
在网络爬虫的爬行策略中,应用最为基础的是()。 |
A.深度优先遍历策略 B.广度优先遍历策略 C.高度优先遍历策略 D.反向链接策略 E.大站优先策略 |
|
按照涉及自变量的多少,可以将回归分析分为()。 |
A.线性回归分析 B.非线性回归分析 C.一元回归分析 D.多元回归分析 E.综合回归分析 |
|
请简述云计算的三种主要部署模式 |
|
|
简述三级封锁协议的内容以及不同级别的封锁协议能解决哪些数据不一致性问题? |
|
|
大数据对科学研究有什么影响? |
|
|
数据库系统中有哪三层模式结构?采用三层模式结构有什么好处? |
|
|
在数据库设计过程中将E-R模型转换为关系数据模型的转换原则是什么? |
|
|
试述SQL语言的特点。 |
|
|
论述集群的分类以及他们的特点。 |
|
|
为什么计算机系统要往并行与异构的方向发展? |
|
|
论述HDFS存储数据的优点。 |
|
|
什么是离群点分析?离群点分析可以应用在哪些领域? |
|
|
预测性分析(PredictiveAnalysis)用于预测未来事件发生的概率和演化趋势。() |
A.正确 B.错误 |
|
数据集成(DataIntegration)是将多个数据源中的数据合并存放到一个一致的数据存储中。() |
A.正确 B.错误 |
|
根据麦肯锡的预测,随着大数据的普及,全球零售业和医疗行业的利润将会减少。 |
A.正确 B.错误 |
|
对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同兴趣偏好的用户最好集中处理。 |
A.正确 B.错误 |
|
大数据是时代发展的潮流与趋势。() |
A.正确 B.错误 |
|
美国《自然》(Nature)杂志专刊—Thenextgoogle,第一次正式提出“大数据”概念。() |
A.正确 B.错误 |
|
使用编程软件Python也可以任何类型的数据。() |
A.正确 B.错误 |
|
简单随机抽样,是从总体N个对象中任意抽取n个对象作为样本,最终以这些样本作为调查对象。在抽取样本时,总体中每个对象被抽中为调查样本的概率可能会有差异。 |
A.正确 B.错误 |
|
云计算与大数据联系不大。() |
A.正确 B.错误 |
|
轨迹数据包含空间和时间属性,并且通常规模巨大且维度高。() |
A.正确 B.错误 |
|
智能健康手环的应用开发,体现了()的数据采集技术的应用。 |
A.统计报表 B.网络爬虫 C.API接口 D.传感器 |
|
下列关于数据重组的说法中,错误的是()。 |
A.数据重组是数据的重新生产和重新采集 B.数据重组能够使数据焕发新的光芒 C.数据重组实现的关键在于多源数据融合和数据集成 D.数据重组有利于实现新颖的数据模式创新 |
|
万维网之父是()。 |
A.彼得·德鲁克 B.舍恩伯格 C.蒂姆·伯纳斯-李 D.斯科特·布朗 |
|
智慧城市的构建,不包含()。 |
A.数字城市 B.物联网 C.联网监控 D.云计算 |
|
数据的逻辑独立性是指() |
A.内模式改变,模式不变 B.模式改变,内模式不变 C.模式改变,外模式和应用程序不变 D.内模式改变,外模式和应用程序不变 |
|
SQL的集合处理方式与宿主语言单记录的处理方式之间用______来协调。 |
A.游标 B.SQLCA C.存储过程 D.触发器 |
|
SQL语言中的“视图(VIEW)”对应于数据库系统三级模式结构中的_________。 |
A.模式 B.外模式 C.模式 D.都不对应 |
|
根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是()。 |
A.数据管理人员 B.数据分析员 C.研究科学家 D.软件开发工程师 |
|
自然连接是构成新关系的有效方法。一般情况下,当对关系R和S使用自然连接时,要求R和S含有一个或多个共有的__________。 |
A.行 B.属性 C.记录 D.元组 |
|
SQL的视图是从_________中导出的。 |
A.基本表 B.视图 C.数据库 D.基本表或视图 |
|
在数据库设计中,将E-R图转换成关系数据模型的过程属于() |
A.需求分析阶段 B.物理设计阶段 C.逻辑设计阶段 D.概念设计阶段 |
|
当前社会中,最为突出的大数据环境是()。 |
A.互联网 B.物联网 C.综合国力 D.自然资源 |
|
关于搜索引擎步骤中分词的说法正确的是() |
A.分词的准确性决定了搜索结果的相关性排序 B.用户的查询和内容的理解都是基于分词 C.分词的准确性决定了搜索结果是否让用户满意 D.中文分词的准确性对搜索引擎的结果没有任何影响 |
|
贵州发展大数据的'八个一”建议包括() |
A.引入一批人才、聚集一批创客 B.制定一个工作计划、建立一个领导机构 C.培养一批干部、出台一批政策 D.谋划一批产业、引进一批项目 |
|
下列属于传统统计学展示方法的是() |
A.柱状图 B.饼状图 C.曲线图 D.网络图 |
|
数据再利用的意义在于()。 |
A.挖掘数据的潜在价值 B.实现数据重组的创新价值 C.利用数据可扩展性拓宽业务领域 D.优化存储设备,降低设备成本 E.提高社会效益,优化社会管理 |
|
数据变换的方法有() |
A.光滑 B.聚集 C.数据泛化 D.规范化 |
|
交通数据分析可用于: |
A.交通流量实时分析 B.合理进行道路规划 C.信号灯智能调度 D.实时路况查询播报 |
|
大数据智能感知层:主要包括()及软硬件资源接入系统 |
A.数据传感体系 B.网络通信体系 C.传感适配体系 D.智能识别体系 |
|
大数据是描述()所发生的行为。 |
A.未来 B.实时 C.过去 D.现在 |
|
离群点检测的应用包括()等。 |
A.欺诈检测 B.入侵检测 C.故障检测 D.疾病的不寻常模式 |
|
请分析大数据未来的发展趋势 |
|
|
什么是根本表?什么是视图?两者有什么区别和联系? |
|
|
论述数据仓库的四种类型 |
|
|
如何计算PageRank的值? |
|
|
对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息量要尽量精确 |
A.正确 B.错误 |
|
结构化数据是用excel结构表现的数据 |
A.正确 B.错误 |
|
数据分析是大数据发展面临的挑战 |
A.正确 B.错误 |
|
时间序列分析是对随时间变化的数据对象的变化规律和演化趋势进行建模分析 |
A.正确 B.错误 |
|
数据表达是通过计算机图形图像技术来更加友好地展示数据信息,方便人们阅读、理解和运用数据 |
A.正确 B.错误 |
|
规则性分析(PrescriptiveAnalysis)用于解决决策制定和提高分析效率 |
A.正确 B.错误 |
|
利用大数据技术对电子病历中的数字化信息进行分析处理,既能够让医生的诊疗有迹可循,还可以发现最有效的临床路径,从而及时为医生提供最佳的诊疗建议。 |
A.正确 B.错误 |
|
Gartner研究机构给出的大数据定义是大数据一般会涉及两种或两种以上的数据形式,它需要收集超过100TB的数据,并且是高速实时数据流;或者是从小数据开始,但数据每年增长速率至少为60%。 |
A.正确 B.错误 |
|
数据分析是大数据价值链中最终和最重要的阶段,其目的是挖掘数据中潜在的价值以提供相应的建议或决策。通过分析不同领域中的数据集可以使数据在不同层面发挥最大价值。 |
A.正确 B.错误 |
|
一个事务执行过程中,其正在访问的数据被其他事务所修改,导致处理结果不正确,这是由于违背了事务的何种特性而引起的() |
A.隔离性 B.一致性 C.原子性 D.持久性 |
|
数据库的_________是指数据的正确性和相容性。 |
A.恢复 B.安全性 C.并发控制 D.完整性 |
|
下列关于舍恩伯格对大数据特点的说法中,错误的是()。 |
A.数据规模大 B.数据类型多样 C.数据处理速度快 D.数据价值密度高 |
|
美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的()。 |
A.在数据基础上倾向于全体数据而不是抽样数据 B.在分析方法上更注重相关分析而不是因果分析 C.在分析效果上更追究效率而不是绝对精确 D.在数据规模上强调相对数据而不是绝对数据 |
|
事务的原子性是指()。 |
A.一个事务内部的操作及使用的数据对并发的其他事务是隔离的 B.事务一旦提交,对数据库的改变是永久的 C.事务中包括的所有操作要么都做,要么都不做 D.事务必须是使数据库从一个一致性状态变到另一个一致性状态 |
|
数据库系统与文件系统的主要区别是() |
A.数据库系统复杂,而文件系统简单 B.文件系统不能解决数据冗余和数据独立性问题,而数据库系统可以解决 C.文件系统只能管理程序文件,而数据库系统能够管理各种类型的文件 D.文件系统管理的数据量较少,而数据库系统可以管理庞大的数据量 |
|
在关系代数中,对一个关系做投影操作后,新关系的元组个数()原来关系的元组个数。 |
A.小于 B.小于或等于 C.等于 D.大于 |
|
大数据在社交网络中的应用 |
A.用户偏好、情感、社交网络结构 B.用户画像、精准推荐 C.舆情监控、突发事件预警 D.预测外部趋势 |
|
可使用(),(),()进行光滑。 |
A.最大值 B.箱中位数 C.箱边界 D.箱均值 |
|
以下属于能产生大数据,即大数据的源头的有() |
A.社交网络 B.游戏 C.互联网电视 D.搜索引擎 E.移动互联网 |
|
Spark产生的原因包括() |
A.MapReduce具有很多的局限性 B.Spark只能进行交互式计算 C.现有的各种计算框架各自为战 D.Spark不适合交互式处理 |
|
数据挖掘常用的工具有() |
A.R B.Photoshop C.Gephi D.Clement |
|
数据库管理系统有哪些功能? |
|
|
什么是数据库的安全性?DBMS有哪些安全性措施? |
|
|
云计算有什么特点? |
|
|
数据库设计分哪几个阶段? |
|
|
Kettle可用于数据清洗。() |
A.正确 B.错误 |
|
宁家验委员指出,发展大数据的应用,有助于促进医疗改革。 |
A.正确 B.错误 |
|
云存储是指通过集群应用、网络技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。() |
A.正确 B.错误 |
|
宁家验委员指出,我国民生领域信息化服务水平显著提升。 |
A.正确 B.错误 |
|
BI分析适用于总数据量在集群内存的最大级别以内的情况,使用内部数据库技术,适合实时业务分析需求。 |
A.正确 B.错误 |
|
matplotlib是一个Python的2D绘图库。() |
A.正确 B.错误 |
|
用一个函数拟合数据来光滑数据称为回归。() |
A.正确 B.错误 |
|
在数据库中存储的是_________。 |
A.数据 B.数据模型 C.信息 D.数据以及数据之间的联系 |
|
设有关系模式EMP(职工号,姓名,年龄,技能)。假设职工号唯一,每个职工有多项技能,则EMP表的主码是() |
A.职工号 B.姓名,技能 C.技能 D.职工号,技能 |
|
SQL语言中,条件年龄BETWEEN18AND30表示年龄在18至30之间,且_________。 |
A.包括30岁但不包括18岁 B.包括18岁和30岁 C.包括18岁但不包括30岁 D.不包括18岁和30岁 |
|
DB、DBMS和DBS三者之间的关系是_________。 |
A.DBS与DB和DBMS无关 B.DB包括DBMS和DBS C.DBS包括DB和DBMS D.DBMS包括DBS和DB |
|
关系规范化中的删除操作异常是指() |
A.不该删除的数据被删除 B.不该插入的数据被插入 C.应该删除的数据未被删除 D.应该插入的数据未被插入 |
|
在数据库设计中数据流图(DFD)和数据字典(DD)主要用来描述结构化方法中的_________阶段的工具。 |
A.概念结构设计 B.需求分析 C.可行性分析 D.逻辑结构设计 |
|
构成E—R模型的三个基本要素是_________。 |
A.实体、属性值、关系; B.实体、属性、联系; C.实体、实体集、联系; D.实体、实体集、属性; |
|
下列关于网络用户行为的说法中,错误的是()。 |
A.网络公司能够捕捉到用户在其网站上的所有行为 B.用户离散的交互痕迹能够为企业提升服务质量提供参考 C.数字轨迹用完即自动删除 D.用户的隐私安全很难得以规范保护 |
|
在数据生命周期管理实践中,()是执行方法。 |
A.数据存储和备份规范 B.数据管理和维护 C.数据价值发觉和利用 D.数据应用开发和管理 |
|
若系统在运行过程中,由于某种硬件故障,使存储在外存上的数据部分损失或全部损失,这种情况称为() |
A.事务故障 B.系统故障 C.介质故障 D.运行故障 |
|
属于社交网络的表达形式() |
A.网论 B.点阵论 C.矩阵论 D.图论 |
|
下列关于大数据的说法中,错误的是()。 |
A.大数据具有体量大、结构单一、时效性强的特征 B.处理大数据需采用新型计算架构和智能算法等新技术 C.大数据的应用注重相关分析而不是因果分析 D.大数据的应用注重因果分析而不是相关分析 E.大数据的目的在于发现新的知识与洞察并进行科学决策 |
|
医疗领域如何利用大数据 |
A.临床决策支持 B.个性化医疗 C.社保资金安全 D.用户行为分析 |
|
传统研究中数据采集的方法包括:() |
A.网络监测 B.对面访谈 C.电话访谈 D.线上互动 |
|