深蓝海域KMPRO

数据挖掘时应注意的问题

2017-03-13 16:15

数据挖掘时应注意的问题
        1数据挖掘方法的选择
        由于数据挖掘方法功能的各不相同,所以要针对挖掘需求和目标,采用适合的模式和算法,特别是在 对多个数字档案馆进行跨馆、跨库挖掘的时候,各馆可能采用不同的数据库系统内核,如ORICLE、SQL SERVER、DBII等等,且各馆馆藏内容也大相径庭,所以在进行数据挖掘的时候应立足于所处的数字化馆藏环境,在方法的选择上有的放矢,不能一概而 论。
        2数据挖掘结果的准确性
        即对数据挖掘质量的控制问题。数字档案馆数据库中涉及大量的数据信息,在这些海量数据面前,不 可避免的会出现冗长,甚至错误的数据,所以在进行数据挖掘时,应根据数据挖掘任务的不同,选择适合的挖掘类型和算法,并对出现的错误数据进行修正、处理、 加工,为档案馆提供科学合理的各种分析报告和相关预测信息,指导档案馆工作人员采取正确手段,并为档案馆改进服务、作出决策提供智力支持。
        3用户隐私的保护
        档案馆利用数据挖掘技术优化服务,提高管理水平的同时,也不可避免的增加了侵犯用户隐私权的可 能性,因为用户在利用数字档案资源的过程中涉产生大量的个人信息,这些信息包括:用户的姓名、工作、学历、兴趣等,它们一旦被其它别有用心的人所获取,用 户就有可能受到,进而造成用户对档案馆的反感,影响到用户的二次利用,所以档案馆应该妥善保管这些信息,建立有效的隐私保障机制,不能在未得到用户授权的 情况下将他们的个人隐私泄漏出去。
        4人力资源的保障
        数据挖掘脱胎于计算机领域,要在基于知识管理的数字档案馆中实施数据挖掘必然离不开优秀的计算 机专业人员和管理人员,但只强调专业技术,忽视对其业务技能的培养,也会制约数字档案馆的发展,所以在数字档案馆建设过程中,需要加强对专业技术人员的档 案知识补充,同时调整档案馆管理人员的知识结构,使他们尽可能的掌握必要的网络、数据库基础知识。
       从实体管理到信息管理,从信息管理到知识管理已是档案馆发发展的不可逆转进程,基于知识管理的数字档案馆是档案馆发展的必然组织形式。数据挖掘可以快速有效地分析和处理来自数字档案馆内外的海量数据和信息,使隐性知识显性化,显性知识结构化,为数 字档案馆的科学管理和服务水平的不断提高提供了有力支持,使档案馆向着知识化的方向发展,随着信息技术的不断深入和挖掘算法的不断改进,数据挖掘必将与数 字档案馆的知识管理结合得更加紧密,显现出更加强大的生命力。

相关推荐