按照微软的说法,Tahoe是集文档管理、文档索引/检索和协同工作于一身的企业门户。Tahoe的文档管理包括版本控制、文档的作者与密码属性管理、文档发布控制、签发控制等功能。在文件索引方面,Tahoe可以进行全文检索,也可以对网站、文件系统、Exchange服务器、Lotus服务器等多种信息源进行检索。
除此之外,在Tahoe系统中还可以采用人工方法对文档进行分类处理,在处理过程中,Tahoe的分类助理可以学习人工分类规则,当样本达到一定数量,分类助理就可以自动进行分类。
Tahoe由文档服务器、索引服务器和检索服务器组成。这些服务器既可以安装在一台机器上,也可以分装在三台机器上。使用时,既可以以WWW方式进入Tahoe,也可以通过MSOffice中的Tahoe插件进入,还可以直接从Windows文件系统进入。
微软的策略是只提供知识管理系统平台,而针对各行各业的知识管理解决方案由经微软认证的合作伙伴提供。
Lotus与微软在知识管理领域各有所长:Lotus像一个老谋深算的智者,微软更像一个门槛精的小伙。Lotus先建立一个严格的体系,然后再一步步推进;微软则不太在意体系,缺什么就做什么。Lotus的难点在于它所建立的体系是否能被各界人士认同,而微软的问题是体系不严密。
IBM:挖掘文本
在文本挖掘软件中,IBM的TextMiner很有代表性,其主要功能是特征抽取、文档聚集、文档分类和检索。
TextMiner的特征抽取器能从文档中抽取人名、组织名和地名以及由多个字组成的复合词。此外,特征抽取器还能抽取表达数字的词汇,例如,\"钱\"、\"百分比\"、\"时间\"等。抽取完特征以后,有相似特征的文档就被自动聚集成一个集合。利用这一功能,知识管理系统可以从大量文档中找到相关文档。TextMiner还可以对文档进行自动分类。
Autonomy:去除冗余
在中国,知道Autonomy公司及其技术的人不多。但实际上,Autonomy及其CEO迈可·林奇(MikeLynch)在知识管理界的知名度很高。迈可·林奇1991年毕业于剑桥大学,主修神经网络。他受模式识别所用的概率算法的启发,创立了Neurodynamics公司,以概率论中的贝叶斯公式和香农的信息论作为其技术的理论基础,开发出文本挖掘产品。1998年,Autonomy公司看中林奇的技术,以400万美元并购了林奇的公司,林奇也成为Autonomy公司的CEO。




