2017-03-11 10:55
HP-TRS企业信息门户实现方案
HP-TRS企业信息门户实现在惠普和TRS成熟的系列产品基础上,功能覆盖到信息的整个生存周期,包括信息采集、信息发布、信息分类导航和查询、信息服务以及信息传播。具体实现方案如下。
一、网络化、全方位的信息采集手段
信息采集是建立企业信息门户的重要一步,提供全面、权威、及时、准确的信息是企业进行正确决策、开发产品、把握商机、开拓市场、对外合作交流的关键。TRS分别针对不同的数据格式和数据源提供了综合的解决方案:
基于Web空间的网页搜索引擎TRS Transcend
TRS Transcend可以帮助您从互连网上成批或有选择地收集您感兴趣的信息,它通过一个智能机器人收集您指定的Web站点上的信息。对于搜索到的信息,一方面您可以使用TRS Catalog进行标引加工处理,然后用TRS Indexer工具入库到TRS 数据库中,也可以选择先入库,再用后台分类工具进行数据库联机标引,建立类Yahoo!的网站、网页搜索引擎应用;另一方面您可以通过该搜索,建立网站或网页的镜像应用。
个人信息管理和信息收集平台TRS InfoCenter
TRS InfoCenter可以帮助您利用元搜索引擎搜索互联网的信息,并且在需要的时候可以在本地建立网页镜像;可以帮助您随时收集和管理桌面的文档、邮件以及上网浏览的网页信息,建立自己的知识信息库,供查询、浏览和进一步利用。
支持各种流行格式的文档和数据处理专家TRS CEL
TRS CEL是数据加工、预处理、辅助标引和数据库加载的集成环境。它能够灵活、方便、有效地对北大方正或华光激光照排系统生成的S2文件、PS文件、PS2文件、HTML文件、Word文件、PDF文件、ISO2709文件等多种格式,进行文本转换,并进一步提供浏览、标引、压缩和装入TRS数据库等多种功能。并且通过提供将照排文件转换输出为标准的PDF和HTML文件,有效实现了原版式文件的上网和浏览。
专为电子化媒体网站而设计的网络出版采编系统TRS Exchange
TRS网络出版采编系统是为建立电子化媒体网站而设计的业务系统,主要完成上网信息的收发,流转,审校以及实时发布等任务。该系统有利于实现无纸办公,使工作过程更加合理,提高工作效率。利用该系统不仅可以通过合理的工作流程把上网信息发布到网站上,还可以利用TRS全文信息检索系统为发布的信息提供基于内容和标引的检索服务。
二、安全、高效的Internet/Intranet信息发布平台
信息发布是企业信息门户的基本要求,是实现企业信息共享的主要途径。惠普和TRS为企业信息发布提供了安全、高效的信息发布平台。
Web是信息发布的最简单途径,但用普通Web服务器来发布信息显然无法满足具体应用中在易维护性、安全性、检索等需求。TRS信息发布的宗旨就是提供简单高效的方法,使数据库中的信息能够根据用户的各种需求,通过Web服务器发布Internet/Intranet上。利用TRS信息发布系统,一方面可以把Web站点繁杂的维护工作转换为数据库记录的维护,轻松管理海量数据,另一方面,可以利用动态访问数据库技术实现信息检索、动态导航、简繁内码自动转换等普通Web服务器所无法实现的功能。
基于4年多来在Internet/Intranet应用信息系统开发方面积累的经验,TRS目前可以提供多层次的信息发布方式,满足多种应用的需求。用户既可以完全依赖TRS的发布功能,轻松完成Web站点的全部维护工作,也可以把TRS信息发布的各种功能按照“组件”的形式使用,按照自己的意愿创建Web服务。
为了满足用户对信息发布的不同需求,TRS提供以动态发布为主的Web应用服务器和以静态发布为主的静态页面发布系统二种解决方案,并且可以协同工作,共同为Web站点建设服务。
TRS Web应用服务器包括TRS Web控制台和TRS Web Plugin两部分,是Web浏览器和TRS数据库服务器之间的中间层。它利用数据库技术和动态网页生成技术,通过频道维护工具可以方便地将数据库中的信息按照一定的导航策略发布到Web服务器,为Web服务器提供各种信息服务。
TRS静态网页信息发布系统可以方便地按照各种设置将数据库中的数据自动生成HTML文件,加载到Web服务器上,并可按设定的时间每天自动进行。通过这种方式,Web站点维护人员只需维护数据库,系统就会定时更新Web服务器的网页。
三、国内外领先的多语种智能信息内容检索引擎
检索是人们访问企业信息门户快速获取信息的主要手段。许多用户喜欢使用检索引擎,可以说,好的检索引擎是一个好站点的关键。检索对一个信息量较大的站点是一个重要的用户接口元素。作为通常的规则,当站点内容超过200个页面,就应该提供检索接口。为了满足用户对海量信息的检索要求,TRS分别推出了文档数据库检索引擎、关系型数据库内容检索引擎以及网站网页检索引擎。
TRS是全文检索的著名品牌,TRS系列检索引擎系统充分利用TRS强大的信息检索功能和高性能满足对海量检索一切数据来源,包括Text, HTML, Postscript, WPS, S2/PS2/PS, Microsoft Office, Adobe PDF, RDBMS等结构化数据。
全方位检索功能,内核支持多语种, 同时支持结构化数据和非结构化数据的检索、多达48种检索逻辑,每次检索可以跨越最多50个数据库等。
领先的查询性能,TRS对海量数据业界领先的查询功能是得到大量实际应用检验的,能够确保在大量并发用户对海量数据库具有秒级响应。TRS领先的检索响应时间是在多种先进技术的支持下取得的,包括SKIP技术、索引高效压缩、搜索优化、Cache技术、大内存技术、多线程技术以及Web服务和检索服务的分布式体系结构。对52年人民日报(1947-1998)100多万篇文章,超过10亿汉字(2.1G)的各种检索条件的实际测试表明,检索平均响应时间为0.7秒 (PII400, Windows NT Server)。
智能检索有效改善检索效果,TRS提供中文字词混合索引机制,既能保证查准率,又不丧失查全率,彻底解决了中文全文检索的难点,同时主题词典的检索控制和智能相关排序(Relevance Ranking),能够极大地改善检索的效果。
空间膨胀上的新突破,TRS采用多种数据和索引压缩技术,使得空间膨胀率达到创纪录的0.0-0.3左右。TRS空间膨胀率方面的技术突破不是以牺牲检索速度为代价的,相反由于减少了数据库访问I/O次数, 检索速度得到了提高,对于规模小的数据库,可选择不压缩。
多语种检索核心,TRS内核支持ASCII、GBK、BIG5、Unicode(ISO10646/UCS2)多种编码,有效解决了多语种的全文检索问题。
TRS文档数据库检索引擎是基于TRS文档数据库管理系统及其全文检索核心技术开发而成的,由TRS全文检索服务器、TRS管理员工具和TRS Web应用服务器组成。TRS管理员工具是TRS全文检索服务器的客户端工具,支持TCP/IP协议;TRS Web应用服务器是TRS全文检索服务器和Web 服务器的中间件。该系统可以广泛的应用在专利、法律法规、文献情报资料等电子资料库的建设中。
TRS关系型数据库内容检索引擎是基于关系型数据库管理系统(DB2、Oracle、Informix、Sybase、SQL Server)及其全文检索核心技术开发而成的,由TRS全文检索服务器、TRS管理员工具、TRS Web应用服务器和TRS for RDBMS网关组成。该系统可以监控数据库中数据的更新,自动维护数据索引,利用强大的TRS全文检索引擎,实现对数据库中文本或文档的内容检索。该系统可以广泛地应用在海量数据库应用系统中,可以大大提高对海量数据库的文本查询能力。
TRS网站网页检索引擎是基于TRS网页搜索引擎和全文检索核心技术开发而成的,由TRS全文检索服务器、TRS管理员工具、TRS站点检索和TRS Web CGI组成。该系统可以在Internet/Intranet上自动搜索最新的网页信息,自动建立和维护索引,并自动生成信息导航页面的Web导航系统,从而可以快速准确地检索到网络上或网站上的信息。
四、满足不同用户需求的信息在线服务应用
企业信息化的最终目标是实现网络化的电子交易,通过建立企业信息门户,使企业与银行的业务连接、与客户的直接服务、和与供应商的协作,可以实现网上的各种商务活动,包括产品经销、客户服务、市场活动等。TRS企业信息门户除提供信息发布外,还为不同的用户需求提供了多层次的在线服务。
会员管理
TRS提供了独立的用户管理机制。用户可以申请成为本站点的会员,享受会员的服务。非会员用户只能得到一些基本资讯服务。系统区分会员与非会员身份,对于会员可提供全方位的信息资料,提供高质量的服务;对于非会员,提供初级服务。
信息导航服务
对于企业的各类信息,按照合理的分类建立导航服务。
查询服务
在页面中,提供方便的查询服务,查询可以按照分类,关键词等进行,也可以进行基于全文内容的全文检索。
相关信息指导
在浏览信息的过程中,系统自动列出与当前浏览内容相关的资料,提供相关浏览。
电子邮件服务
定期将咨询信息制作成“商情速递”信息,并通过电子邮件为会员及时提供个性化服务。
网上论坛
在网上为用户提供一个提出问题、讨论问题和解决问题的社区,拉近企业与用户的关系,建立企业与用户的反馈机制,使企业更好地为用户服务,满足市场和用户的需求。
精品拍卖
可以在网上进行精品的拍卖,所有会员可以参加竞拍。
英文界面
设计中英文两种界面,对于有条件建立英文资料库的信息,可以在英文界面中访问。对于中英文有对应文件的信息,可以在中英文之间切换。
统计分析工具
利用网站分析工具分析页面和栏目的访问率;利用TRS的服务器日志文件和分析工具分析用户的检索需求。利用这些信息调整站点内容。
TRS ADO COM和TRS Javabeans开发接口
TRS采用数据层、业务逻辑层和页面表现层三层体系结构,在提供以上应用模块的同时,还提供了标准的ADO COM和Javabeans组件应用开发接口,使用符合工业标准的开发工具,如ASP和JSP技术,提供了进一步快速开发上层Web应用的能力。
五、突破传统概念的信息传递途径
在人们的日常生活工作中,报纸、书本、期刊杂志、广播、电视一直承担着传统的信息传播媒介的角色。自从Internet出现以来,Web网站逐渐发展成为一种新型的传播媒介,并且势不可挡,冲击着传统的信息传播领域。它所具有的信息传播快、信息容量大、传播区域广、交互服务满足个性化的需求等诸多特点,越来越受到人们的青睐。随着数字信息的急剧膨胀、上网人数的急剧增多,Web网站这种在线的信息服务手段,已明显受到基础通讯设施及硬件平台的局限。随之而来的一种新型的信息传播载体CD-ROM将正好解决并弥补了这个缺陷。信息的数字化,使得在传统的媒体存在的同时,各种数字媒体将象雨后春笋蓬勃发展。信息通过Internet/Intranet发布,通过CD-ROM光盘发行和存档。
在Web上发布和出版的大量信息,可以方便地使用CD-ROM分发,快速、高效地制作和生产高质量的CD-ROM数据产品, 这就是TRS 光盘出版系统。TRS光盘出版系统将带给您:
1.网上发布的信息可以立即制作CD-ROM信息产品 - 下发或销售或存档;
2.和TRS企业版数据兼容;
3.和TRS企业版的检索功能和性能相同;
4.基于Web浏览器界面,容易使用,能够充分利用浏览器的内置特性,如书签、电子邮件、打印和文件下载等把超文本和全文检索完美地结合在一起;
由于Internet 的迅速发展,企业与机构的业务运作方式已开始出现一种根本性的转变。大量企业正迅速转向全球性商务,用电子方式把遍布全球的客户与供应商联系起来。在这种具有根本性转变的推进过程中,Internet应用已不再被局限于围绕着业务应用本身,而是被延伸到用于客户直接的访问和提供最快捷的信息传递服务,企业的每个部分和每个相关应用都已经或即将被扩展到Internet上。为适应这种普遍性,Internet的信息技术基础设施必须经历根本性的转变,EIP将成为大量企业的主要应用模式,提供个性化的用户界面。今天的企业应该把企业信息门户看作一条利用信息资源吸引新客户以及密切客户关系的重要途径。