数据科学是一个跨学科领域,它使用科学方法,过程,算法和系统从许多结构化和非结构化数据中提取知识和见解,从而为组织中的高层决策提供依据。。
数据科学与数据挖掘,机器学习和大数据有关。
数据科学是“统一统计,数据分析及其相关方法的概念”,以便“理解和分析数据的实际现象”。
它融合了数学,统计学,计算机科学,信息可视化,通信,信息科学和领域知识等许多领域中的技术和理论。
图灵奖获得者吉姆·格雷(Jim Gray)将数据科学视为科学的“第四范式”(经验,理论,计算现在是数据驱动的),并断言“由于信息技术和数据泛滥的影响,科学的一切都在发生变化”。
关于数据科学的定义仍未达成共识,有人认为它是一个流行词。
大数据正在迅速成为各种规模的企业和公司的重要工具。
大数据的可用性和解释改变了旧行业的商业模式,并创造了新的业务。
数据驱动型企业到2020年的总价值为1.2万亿美元,较2015年的3,330亿美元有所增长。
数据科学家负责将大数据分解为可用信息,并创建有助于公司和组织的软件和算法确定最佳操作。
由于数据科学与大数据之间的紧密联系,随着大数据继续对世界产生重大影响,数据科学也对世界变化发挥着巨大作用。