欢迎访问文稿网!

数据与信息的定义

范文之家 分享 时间: 加入收藏 我要投稿 点赞

数据与信息的定义

    维基百科把大数据定义为一个大而复杂的、难以用现有数据库管理工具处理的数据集。

    广义上,大数据有三层内涵:

    一是数据量巨大、来源多样和类型多样的数据集;

    二是新型的数据处理和分析技术;

    三是运用数据分析形成价值。

    当然,这样的定义我们暂且不评价它是否全面,但是至少从一个侧面说明了大数据将对科学研究、经济建设、社会发展和文化生活等各个领域产生革命性的影响。

    在研究大数据之前,我们首先要明确什么是数据,什么是信息,以及两者之间的关系。这是研究大数据的一个重要的认知前提。

    首先,我们认识一下什么是信息。

    作为知识层次中的中间层,有一点可以确认,那就是信息必然来源于数据并高于数据。我们知道像2.6秒、50米、300吨,或者大楼、桥梁这些名词是没有联系的,孤立的。只有当这些数据用来描述一个客观事物和客观事物的关系,形成有逻辑关系的数据结构时,它们才能被称为信息。

    显然,信息除了自然属性或者社会属性,还包括价值判断,特别是社会价值判断。只有具备了属性或价值判断,这些描述性名词才可以被称为信息,否则就会成为数据或者没有意义的符号。

    因此,本书给出以下定义:

    定义1.1 信息是指对事物的价值判断与属性描述。

    举个例子:1.75米,如果作为一个正方形的边长,在计算正方形面积时,它就是个数据。同样是1.75米,如果用来描述一个约会对象的身高,那么传递出来的就是信息。

    现在,我们来认识一下什么是数据。

    我们经常说把“冰水混合物的温度规定为0℃”。通过水、温度、0℃这些词,在我们的思维结构中就形成了对客观世界的印象。而这些约定俗成的字符就构成了研究的数据基础。

    当我们在刻画客观世界的时候,在给出的信息中,为了精准地描述事物的自然属性或者社会属性,或者为了精准地对事物的使用价值或者其他社会价值做出判断,就需要借助数学手段,特别是数字方式进行描述。因此,这样就产生了信息的重要组成部分——数据。

    因此,本书给出如下定义:

    定义1.2 数据是指对信息的数字化解构。

    笼统地说,数据是使用约定俗成的字符,对客观事物的数量、属性、位置及其相互关系进行抽象表示,以适合在这个领域中用人工或自然的方式进行保存、传递和处理。

    而约定形成的标准在不同的时间和空间中会有变化,这意味着在不同的种族、不同的宗教、不同的文化及国家之间,对于描述客观世界的标准和符号会产生差异。这是产生信息不对称的根本原因,所以不同环境下的主体在描述同一客体时,会出现不同的数据。例如,中国古代是按照月亮的变化理解时间,而西方则用太阳的变化理解时间。

    因此,对于大数据、数据、信息的定义和理解成为本书写作的一个大前提。

221381
领取福利

微信扫码领取福利

微信扫码分享