专题02 数据采集与编码 – 亦涛教育工作室
浙江领先的线上培训和职业文化发展平台
功能导航
首页 回顶 返回 评论

专题02 数据采集与编码

2026年 4月 10日 4 阅读

专题02 数据采集与编码

1.(2023贵州)下数据采集的方法,不可取的是(   )

A.利用问卷星发放调查问卷采集数据       B.利用木马程序收集数据

C.通过走访调查采集数据                D.通过实验操作采集数据

【答案】B

【知识点】数据的采集

【详解】本题考查常见的数据采集方式。A、C、D选项都是合法且有效的数据采集方法,而B选项(利用木马程序收集数据)则违反了隐私保护和信息安全的原则,且可能触犯法律,因此是不可取的。

因此,答案是B。

2.(2023内蒙古)通过地图、遥感图像、野外考察等获得数据的过程是(   )

A.数据处理     B.数据输出     C.数据分析     D.数据采集

【答案】D

【知识点】数据的采集

【详解】本题考查的是数据的采集。数据处理通常发生在数据收集之后,涉及对原始数据进行清洗、整理、转换等操作,以便于后续的数据分析。数据输出常指的是将处理后的数据以某种形式(如报告、图表等)呈现出来,供用户或决策者使用。数据分析涉及对处理后的数据进行统计、建模、挖掘等操作,以揭示数据中的模式、趋势或关联。数据采集是通过各种手段和方法收集原始数据的过程,包括观察、实验、调查等。综上所述,通过地图、遥感图像、野外考察等获得数据的过程是数据采集,即D选项。

3.(2024全国)数据按照获取的渠道分为直接数据和间接数据。下列属于直接数据的是(   )

A.咨询获得的景点介绍    B.查阅县志了解的历史

C.实验得到的电流数值    D.网络搜索的空气指数

【答案】C

【知识点】数据采集

【详解】本题考查的直接数据与间接数据。直接数据:指通过直接观察、实验或测量等手段获取的第一手数据。间接数据:通常是通过查阅文献、资料、报告等途径获得的,这些数据已经经过了加工或整理。

分析选项:

A选项通过咨询获得的,属于二手信息,即间接数据。

B选项通过查阅历史资料获得的,同样是二手信息,即间接数据。

C选项通过直接实验测量得到的,属于第一手数据,即直接数据。

D选项通过网络搜索获得的,通常是基于其他来源的数据整理得到的,属于间接数据。

因此,答案是C。

4.(2023广西)在成都第31届世界大学生夏季运动会上,各赛场安装的高清摄像机,实时记录比赛情况。

摄像机记录信息的过程属于(   )

A.数据可视化        B.数据分类     C.数据分析     D.数据采集

【答案】D

【知识点】数据的采集

【详解】本题考查的是数据的采集。摄像机实时记录比赛情况,这是一个信息收集和记录的过程。即D选项

5.(2024安徽)某平台根据用户的搜索需求,进行智能推送的过程属于(   )

A.数据分析     B.数据分类     C.数据采集     D.数据可视化表达

【答案】A

【知识点】数据分析

【详解】本题考查的是数据分析。某平台根据用户的搜索需求,智能推送相关内容。这涉及到对用户搜索数据的处理,以便理解用户的需求并作出相应的响应。因此,答案是A选项(数据分析)。

6.(2024安徽)如图所示的数据表,筛选星级为“三星”,并且评分大于7.0的旅舍,此过程属于(   )

A.数据采集     B.数据分析     C.数据存储     D.数据可视化表达

【答案】B

【知识点】数据分析

【详解】本题考查的是数据分析。根据提供的数据表,我们需要筛选出满足特定条件(星级为“三星”,且评分大于7.0)的旅舍。这是一个对数据进行筛选和处理的过程。因此,B选项正确。

7.(2024安徽)某商场年末促销活动中的部分商品客流量变化如图所示,双十二当天各品类客流量均增幅明显,圣诞节、元旦前一天,各品类客流亦出现不同幅度的增长。这里运用的数据分析方法是(     )

A.对比分析     B.平均分析    C.现实分析     D.聚类分析

【答案】A

【知识点】数据的分析

【详解】本题考查的是数据的分析。根据题目描述的场景和数据分析方法的定义,最符合的数据分析方法是A选项(对比分析)。这种方法通过对比不同时间段的数据,揭示了商场促销活动对客流量的影响。

8.(2024云南)“词云图”是数据可视化的一种表达方式。2023年国家社科基金立项热词的词云图如下图所示,下列说法错误的是(   )

 

A.通过词云图显示,“机制研究”比“实现路径”的出现频率高

B.制作词云图一般需要经过数据准备、分词处理、特征提取、数据分析、结果呈现等步骤

C.词云图必须显示该数据集包含的全部词语

D.词云图通常使用文字的大小和颜色来表示关键词出现的频次

【答案】C

【知识点】数据的可视化表达

【详解】本题考查的是数据的可视化表达。词云图是一种数据可视化表达方式,通过文字的大小和颜色来表示关键词出现的频次。在词云图中,通常出现频率越高的词,其字体越大,颜色也可能越醒目。

词云图通常根据关键词的重要性(如出现频率)来选择性地显示词汇,而不是必须显示全部词语。如果数据集包含大量词汇,词云图可能会过滤掉一些出现频率较低或不重要的词汇,以便更清晰地展示关键信息。因此,C选项的说法是错误的。

 

9.(2023贵州)为分析学生成绩,张老师将考试成绩做成一张柱状图呈现给学生,请问张老师所做的是数据处理哪一步(   )

A.数据收集     B.数据整理     C.数据分析     D.数据可视化

【答案】D

【知识点】数据的可视化表达

【详解】本题考查的是数据的可视化表达。张老师将考试成绩做成柱状图,这是一个将数据以图形形式展示出来的过程。张老师所做的是数据处理的“数据可视化”步骤。

10.(2024江苏)大数据个人报表

近年来,很多网络平台会在年底为用户生成专属的个人报表,显示一年内该用户在该平台上的各种使用行为数据。

(1)这类个人报表是利用大数据技术收集用户的个人行为数据,并通过分类和计算获得。由此可见(     )

A.大数据采集的数据必须准确无误

B.大数据的数据采集主要还是人工方式

C.大数据分析的是抽样数据

D.大数据分析能发现数据间的相关性

(2)国际数据公司统计了2016-2020年全球每年产生的数据量及其增速,所得结果如图所示。

此统计主要采用的数据分析方法是    ,使用了    和    两种图表来组合进行可视化呈现(   )

 

A.聚类分析、饼图、条形图        B.对比分析、折线图、柱形图

C.结构分析、饼图、条形图        D.平均分析、折线图、柱形图

(3)该网站可实现对数据的加密解密,应用界面如图。可见该应用的服务架构体系属于(     )

 

A.B/S       B.P2P       C.C/S       D.B/C

【答案】(1)D,(2)B,(3)A

【知识点】数据的分析和可视化表达

【详解】本题考查的是数据的分析和数据的可视化表达。

(1)大数据采集的数据不一定完全准确无误,A选项错误;大数据的数据采集主要是通过自动化的方式,而非人工方式,B选项错误;大数据分析的是全体数据,而非抽样数据,C选项错误;通过对用户个人行为数据的收集和分析,能够发现不同数据之间的相关性,生成个人报表,D选项正确。故答案为:D。

(2)国际数据公司统计不同年份的数据量及其增速,主要是进行对比分析,以观察数据的变化趋势和差异。使用了折线图来展示数据量的增速变化趋势,使用柱形图来直观呈现每年产生的数据量的具体数值。故答案为:B。

(3)B/S架构是指浏览器/服务器架构,用户通过浏览器访问服务器端的应用程序。从图中给出的浏览器界面可以判断该应用的服务架构体系属于B/S架构。故答案为:A。

 

1.(2024江苏)以下说法正确的是(   )

A.用传感器直接获得的信号一定是模拟信号

B.数字信号随时间的变化是非连续的

C.数字信号无法由模拟信号转换得来

D.模拟信号的值可以直接用计算机所能理解的二进制表示

【答案】B

【知识点】模拟信号与数字信号

【详解】本题考查的是模拟信号与数字信号的相关知识。传感器可以获取各种物理量(如温度、压力、光强等)并将其转换为电信号。这些电信号可以是模拟信号,也可以是数字信号,这取决于传感器的类型和设计,所以A选项错误。数字信号是由离散的数值(通常是二进制数)组成的,这些数值在时间上是不连续的,即它们只在特定的时间点(如采样时刻)上取值,因此,B选项正确。模拟信号可以通过采样、量化和编码等过程转换为数字信号,因此,C选项错误。计算机使用二进制进行数据处理,但模拟信号的值通常需要先进行采样、量化和编码才能转换为计算机可以理解的二进制形式。直接表示是不可能的,因为模拟信号的值是连续的,而计算机处理的是离散的二进制数。因此,D选项错误。

本题答案选B

2.(2023江苏)英语老师上课播放的英语听力,可以在电脑中播放音频文件,也可以利用传统收录机播放磁带。这两种声音信号分别是(   )

A.数字信号、数字信号                           B.模拟信号、模拟信号    

C.数字信号、模拟信号                            D.模拟信号、数字信号

【答案】C

【知识点】模拟信号与数字信号

【详解】本题考查的是模拟信号与数字信号相关的知识,英语老师上课播放的英语听力,在电脑中播放的是数字信号,而利用传统收录机播放的磁带则是模拟信号。故选C。

本题答案选C

3.(2022福建)将模拟信号转换为数字信号的过程包含采样和(   )

A.解密、量化         B.压缩、编码         C.量化、编码      D.压缩、量化

【答案】C

【知识点】模拟信号与数字信号的转化

【详解】本题考查的是模拟信号与数字信号的转化。将模拟信号转换为数字信号的过程包含采样、量化和编码。因此,正确答案是C。

本题答案选C

4.(2023内蒙古)有4盏信号灯,信号灯只有“开”和“关”两种状态,如果包括4盏信号灯全关的状态,则最多能表示的信号编码数为(   )

A.10                     B.5                           C.20                         D.16

【答案】D

【知识点】数据编码

【详解】本题考查的是二进制编码,

第一盏信号灯有2种状态:开或关。

第二盏信号灯也有2种状态:开或关。

第三盏信号灯还有2种状态:开或关。

第四盏信号灯同样有2种状态:开或关。

那么,4盏信号灯的所有可能组合就是:16种

这16种组合包括了所有信号灯都关的状态,也包括了其他所有可能的开关组合。

所以,最多能表示的信号编码数是16

5.(2024安徽)已知字母B的ASCII码二进制表示为01000010,则字母D的ASCII码值用十进制表示为(   )

A.66                     B.67                         C.68                         D.69

【答案】C

【知识点】ASCII码值的计算

【详解】本题考查的是ASCII码值计算,注意到ASCII码表中,字母是顺序排列的。字母B的ASCII码二进制表示为01000010,转化成十进制是66。因此,字母D的ASCII码值用十进制表示为68,选项C是正确的。

本题答案选C

6.(2023安徽)如果将黑、白像素分别映射为1和0,按照从左向右的次序对如图所示的图像用二进制编码,则表示该图像信息的二进制编码是: (   )   

 

A.01010110                         B.10100101

C.01001001                         D.10101001

【答案】D

【知识点】图像编码

【详解】本题考查的是计算机中图像编码。黑像素对应1,白像素对应0,按照从左向右的次序对图像进行二进制编码10101001。故选D。

本题答案选D

7.(2023全国)交通控制中心对信号灯状态进行数据编码,如图1所示。若只允许左转一个车道通行,对应的编码是110101,如图2所示。若不允许车辆左转,只允许车辆直行和右转,对应的编码是(   )

 

                            图1                         图2

A.010111        B.111111        C.011111        D.100101

【答案】C

【知识点】数据编码

【详解】本题考查的是数据编码。不允许左转,左转为红灯01,允许直行和右转,直行和右转为均绿灯11,所以编码为011111。故选C。

8.(2024湖北)曹雪芹的《红楼梦》前80回大约有61万字,加上高鹗续写的40回共有约73万字。一个汉字存储时占用2个字节,如果要把《红楼梦》全书做成电子书(加注标点符号),电子书的大小约为(   )

A.1.5MB         B.700MB        C.100MB       D.5KB

【答案】A

【知识点】数据编码

【详解】本题考查的是字符和数据编码。根据提供的问题,我们需要计算《红楼梦》全书做成电子书后的大小。这个问题与图片中的浏览器窗口内容、网络地址、按钮或文字文本无关。已知《红楼梦》全书共有约73万字,一个汉字存储时占用2个字节。因此,我们可以计算出全书所需的字节数为:730,000字 × 2字节/字 = 1,460,000字节。为了将字节数转换为更常用的存储单位MB,使用以下公式:1MB = 1,024KB = 1,024 × 1,024字节。所以,全书的大小约为:1,460,000字节 ÷ (1,024 × 1,024字节/MB) ≈ 1.39MB。

但是,考虑到电子书通常会加注标点符号,这些标点符号也会占用一定的存储空间。因此,我们可以合理推测,加上标点符号后的电子书大小会略大于1.39MB,但远小于其他选项(700MB、100MB)且明显大于5KB。电子书《红楼梦》全书(加注标点符号)的大小最接近1.5MB,所以正确答案是A。

9.(2024江苏)一段音频的参数为“44.1KHz,32位,单声道,8秒”,该音频的采样频率为(   )

A.44.1KHz       B.32位          C.单声道      D.8秒

【答案】A

【知识点】数据编码

【详解】本题考查的是声音编码。采样频率指的是每秒对音频信号进行采样的次数,它决定了音频的清晰度和频率范围。在这个问题中,采样频率被明确给出为“44.1KHz”。

 

← 上一篇 专题01 数据与信息 下一篇 → 专题03 算法与问题解决