Autonomy最核心的产品是ConceptAgents。在经过训练以后,它能自动地从文本中抽取概念。
在林奇看来,按照香农的信息论,文档中除有效概念外,还有大量的冗余信息。而词或短语是否为冗余可根据它在文档中的随机度(概率)来判定。如果能滤去冗余,就可从文档中自动抽取出表达文档主题的概念。在林奇的方案中,先要对系统进行训练,处理一些文档,由使用者对非冗余概念做出认定和识别。按照贝叶斯概率理论,这一步实际上是让系统获得关于概念的先验概率。系统在随后的自动处理中根据这些概念在文档中出现的实际情况,按贝叶斯公式求出后验概率,以此作为冗余过滤的依据。这一方法与语种无关,由于每个用户都要对系统进行个别训练,因而系统的文本挖掘天然就具有高度个性化的特点。到目前为止,包括报业巨头默多克的新闻集团在内的一批知名公司已经成为Autonomy的客户,Compaq公司也已经将Autonomy的技术和产品纳入其知识管理解决方案并在客户中推广。
TelTech:服务知识管理
TelTech的创始人JoeShuster是一个化学工程师,他曾创建并出售了一个成功的低温工程专业公司。这一段工作使Shuster深切感受到从公司外获取专业知识的困难。基于此,Shuster于1984年创建了TelTech公司。
TelTech提供三类服务:第一类服务由专家提供。TelTech拥有数千名签约专家,他们主要是有成就的学者、退休的资深专业人士和愿意提供资询服务的专业人士。TelTech并不试图将这些人的知识存入计算机,再以专家系统的方式提供服务,而是维护专家档案,当客户需要用服务时,TelTech的知识工程师就帮助客户分析问题,并向客户推荐数位专家。第二类服务是专业文献检索,用户可以自已通过TelTech的门户网站进行检索,也可以在知识工程师的帮助下进行检索。第三类服务是产品与厂商检索,这种服务也是通过其门户网站提供。
TelTech成功的关键是建立了高性能的知识结构。它采用主题法,其主题词表分为不同专业,共有3万多个,由数位知识工程师维护,每周更新500~1200个词。




