2013-05-21 22:03
在信息学集过程中,搜索引擎已经成了帮助人们寻找相关信息的重要工具。但是,由于数据本身具有分布、异质、动态、半结构或非结构等特征,这无疑给信息检索工作提出了挑战。目前的搜索引擎普遍存在着查全率和查准率不高的现象,任何一个简单的查询都至少返回数以万计的检索结果,而其中只有很少一部分与用户真正的检索要求有关。另外,对自然语言理解能力差,不支持个性化查询,对多媒体内容的检索尚不成熟等都是搜索引擎亟待解决的问题。
针对上述问题,智能搜索引擎的研究正处于蓬勃发展的阶段。实际上,用户在使用搜索引擎检索信息的同时,会在服务器上留下大量的有用信息,即用户注册信息。服务器上的日志文件、用户代理服务器日志,用户机器上的文件,这些文件中隐含了大量有用的信息,如根据用户对检索结果的选择处理,用户在文档上停留的时间,以及是否在该文档进一步访问其他链接到该页的文档等。
利用挖掘技术,特别是用户访问信息挖掘技术,可以发现用户的访问兴趣,并且用户提供个性化的的搜索结果。在发现了用户的访问兴趣之后,通过智能代理技术,随时搜索网上相关信息以及监控信息的更新,然后通过主动推送技术,将用户感兴趣的信息实时主动推送到用户面前,免去了用户被动搜索的困扰,实现智能搜索的一个新的服务领域。
另外,通过对一段时间内用户的大量搜索词的分析,也可以得出与某一个检索词相关的信息,而通过用户对搜索结果的进一步操作,可以找到相关信息中的权威信息,作为今后个性化服务时代优先提供的结果,使用户得到的搜索结果更加精确。智能搜索引擎在语义理解和个性化方面的研究,对于知识管理过程中再知识获取方面有着十分重要的作用,知识管理是建立在知识获取和共享的基础之上的。