中易网

大学的哪个专业是研究数据挖掘的?

答案:1  悬赏:0  
解决时间 2021-12-27 18:45
大学的哪个专业是研究数据挖掘的?
最佳答案
数据挖掘属于计算机科学与技术方向中的数据分析方向,也有在数学专业中开设。
数据挖掘技术是一种数据处理的技术,是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中、人们事先不知道又潜在有用信息和知识的过程。数据挖掘需要根据数据仓库中的数据信息,选择合适的分析工具,应用统计方法、事例推理、决策树、规则推理、模糊集、甚至神经网络、遗传算法的方法处理信息,得出有用的分析信息。数据挖掘过程是一个反复循环的过程,每一个步骤如果没有达到预期目标,都需要回到前面的步骤,重新调整并执行。
从数据本身来考虑,通常数据挖掘需要有信息收集、数据集成、数据规约、数据清理、数据变换、数据挖掘实施过程、模式评估和知识表示等8个步骤。
(1) 信息收集:根据确定的数据分析对象抽象出在数据分析中所需要的特征信息,然后选择合适的信息收集方法,将收集到的信息存入数据库。对于海量数据,选择一个合适的数据存储和管理的数据仓库是至关重要的。
(2) 数据集成:把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享。
(3) 数据规约:执行多数的数据挖掘算法即使在少量数据上也需要很长的时间,而做商业运营数据挖掘时往往数据量非常大。数据规约技术可以用来得到数据集的规约表示,它小得多,但仍然接近于保持原数据的完整性,并且规约后执行数据挖掘结果与规约前执行结果相同或几乎相同。
(4) 数据清理:在数据库中的数据有一些是不完整的(有些感兴趣的属性缺少属性值),含噪声的(包含错误的属性值),并且是不一致的(同样的信息不同的表示方式),因此需要进行数据清理,将完整、正确、一致的数据信息存入数据仓库中。不然,挖掘的结果会差强人意。
(5) 数据变换:通过平滑聚集,数据概化,规范化等方式将数据转换成适用于数据挖掘的形式。对于有些实数型数据,通过概念分层和数据的离散化来转换数据也是重要的一步。
(6) 数据挖掘过程:根据数据仓库中的数据信息,选择合适的分析工具,应用统计方法、事例推理、决策树、规则推理、模糊集、甚至神经网络、遗传算法的方法处理信息,得出有用的分析信息。
(7) 模式评估:从商业角度,由行业专家来验证数据挖掘结果的正确性。
(8) 知识表示:将数据挖掘所得到的分析信息以可视化的方式呈现给用户,或作为新的知识存放在知识库中,供其他应用程序使用。
数据挖掘过程是一个反复循环的过程,每一个步骤如果没有达到预期目标,都需要回到前面的步骤,重新调整并执行。不是每件数据挖掘的工作都需要这里列出的每一步,例如在某个工作中不存在多个数据源的时候,步骤(2)数据集成的步骤便可以省略。
步骤(3)数据规约(4)数据清理(5)数据变换又合称数据预处理。在数据挖掘中,至少60%的费用可能要花在步骤(1)信息收集阶段,而至少60%以上的精力和时间是花在数据预处理
我要举报
如以上问答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
什么是溶脂减肥 7大注意事项须知
在大学里我感觉没有目标,不知道以后要干什么
性激素六项怎么检查?检查费用是多少
图片那个是我儿子,他的漏斗胸应
起个店铺名称,有文采的进
水管井中可以明敷消防火灾报警系统线管吗
征求房屋设计样板
唐山哪拔阻生智齿好啊,拔过的说下啊,拖就算
员工多次违纪,想最后警告一次如反复再犯就与
开春我要种菜,楼顶天台哪有人做防水啊?
qq内置头像这个是什么动物啊
大三阳患者日常饮食该怎样注意呢?
七彩阳光幼儿园(深圳宝安区)地址在什么地方,
走在街上的,是来来往往 形态各异的人 怎么缩
不知道自己说的话是不是对的 用四个字成语 怎
推荐资讯
手机上可以安装什么软件可以把照片做成视频,
为什么人老了会牙齿有缝,怎样可以解决这
埋头的意思是什么?埋头的释义是什么啊?
升力的意思是什么啊?请解释下!
文昌纏斗的意思是什么?文昌纏斗的释义是什么
东航万里行积分兑换的奖励机票,包含机建燃油
篮球紧身裤要正好的还是大一点的
从福州仓山区到福州殡仪馆,搭公交车怎么去
詰質的意思是什么?詰質的释义是什么啊?
因能变与果能变 有什么区别?
地板蛀虫商家要不要赔偿
出马仙,仙家被封了是咋事看不到听不到
手机登qq时,显示手机磁盘不足,清理后重新登
刺客的套装怎么选啊?