有很多专家都对这样的挑战很熟悉了,就是在第一次个人电脑革命之前就出现的发现数据的挑战
【IT专家网独家】今天的图书馆仍然没有严格限制卡片类别来发现信息。现在,他们使用现代的企业搜索平台来对大量的网络数据进行排序。同时,当理解技术的图书馆评估每项技术的时候,他们做了大量的研究工作。
至少,在位于加利福尼亚伯克里的Librarians Internet Index (LII)是这样,这个公共资金的企业正在管理一系列的推荐的图书馆——以及诊断——网络链接。组织维护了一个MySQL数据库,里面有超过2万条记录,任何人都可以通过免费的网站来搜索。但是几年之前,对LII的陈旧的搜索引擎的不满增加了,前主任Karen Schneider说。
要浏览LII的网站很困难,陈旧的搜索引擎并没有充分利用每个条目中经过认真维护的元数据标签。所以组织开始评估更好的选择,雇用了一位搜索顾问和真正的用户来测试不同的平台。LII最终选择了加利福尼亚州El Segundo的Seamark Navigator,这是一家采用关系型导航技术的搜索和信息访问平台,可以平衡LII的元数据。Schneider也在这条路上学到了很多东西。
“人们这样认为是因为他们可以进行很好的Google搜索,他们了解搜索技术,”Schneider说。“但是还有很多人并不了解如何选择搜索工具。”
这个说法得到了位于马萨诸塞州Framingham的IDC研究公司研究副总裁Susan Feldman的赞同。许多企业对搜索的看法仍然很狭窄——就只有搜索文档或者网站——并且在选择技术之前并没有做足功课,她说。所以,不论是LII的Schneider还是IDC的 Feldman都分享了他们关于评估企业搜索平台的专业贴士。
1. 了解可能性,然后开发需求
理解对于搜索引擎平台来说,今天什么是可能的是非常重要的,Feldman说。搜索引擎只是一个潜在的应用程序。
“我所听过的最大的误解(来自企业)就是,‘我们只需要搜索引擎’,” Feldman说。“他们通常就会得到一个简单的搜索引擎,然后发现当他们的要求增长的时候,他们无法对其进行调整。通常,他们至少想要一定程度上的分类以便于浏览。”
其他的搜索应用程序包括指南式导航、浏览工具、文本挖掘和商务智能等轻量级的功能。一旦他们了解了什么是可能的,企业就必须要考虑短期和长期的目标,Feldman说,在开始的时候提出一些问题来。是在内部搜索,还是面对客户,或者两者都有?所有可以用搜索平台技术进行优化的信息任务是什么?其他部门如何使用搜索——或者已经在使用某种类型的搜索技术了?
2. 考虑糟糕的搜索技术的成本
在购买技术的时候,了解一下现在浪费在寻找信息方面的钱数是有帮助的,Feldman说。例如,最近的IDC研究公司发现,平均知识工人每周花费9.5个小时来寻找信息。根据企业内知识工人的数量的不同而有所区别,按照工资数额而迅速攀升——这就是了解浪费在糟糕的信息检索上面的资金的开始点。当工人无法找到信息的时候,这个成本在增加——例如,丢失了一个销售文档或者必须重新创建文档——成本增加得更快,Feldman说。
3.调查整合性需求,信息类型和源
一旦用户们搜索成功并且检索到了信息,他们能进一步采取动作才是重要的,Feldman说,整合性需求通常是其它企业所需要的。在一个面向客户的网站中,这可能意味着与事务系统的整合,所以用户可以在发现他们产品需求的时候下一张订单。对于企业搜索,它可能意味着与商务智能应用程序、目录管理系统、文档仓库,或者访问控制系统之间的整合。公司还会考虑搜索平台可能需要处理的各种各样的目录,Feldman说,其中包括文档、客户记录、事务系统数据库记录,富媒体,以及第三方信息源。
4.深挖实现和维护需求
除了理解技术需求之外,企业还要严密关注搜索供应商的实现过程、时间线,以及他们要支持新系统所需要的内部工作,Feldman说。例如,一些平台可能需要一个兼职或者全职的管理员。还有其他一些需要考虑的技术问题,包括:平台的规模如何?需要搜索的信息量有多大——这个数据量的增长速度有多大?响应时间怎么样——什么情况是可以接受的?在系统中更多,或者不同种类的数据搜索时,响应时间会如何变化?目录如何缓慢前进并建立索引?
5.灵活性焦点
搜索引擎方面的相关等级决定了返回的查询结果的顺序——但是“相关”这个词的定义也是各种各样的。所以Feldman建议评估相关等级是否,或者如何,通过定制来满足独特的需求。这一点对于LII也非常重要。
“现在,我们可以调整每个元数据字段的权了,”Schneider说。“在追踪搜索日志的时候,我们会发现我们为某个字段赋予了太大的权,所以我们要防止这一点。”
企业可能还想要考虑他们是否想要多个界面或者不同的,根据不同类型的用户来定制。
6.仔细检查与安全
信息安全和访问控制是一个在评估搜索平台的时候需要考虑的巨大的问题,Feldman说。例如,一个平台如何限制结果,以便于用户只能看到他们被授权看到的信息?搜索平台是否可以在文档级别上实现对其他系统的安全?平台是否与现有的访问控制系统有接口?
7、用真正的用户、查询和数据来评估平台
一旦企业列出了一个简短的供应商列表,真实世界类型的测试是必要的,Schneider和 Feldman都同意这一点。这就是为什么LII在真正用户查询中对工具进行“各种苛刻的”测试的原因,Schneider说——正是在测试指南式导航和浏览特性的时候,Siderean平台真正跳了出来。看到不同搜索引擎所提供的五花八门的结果,真是有意思,她说,根据技术处理结构和非结构数据的方式,进行填充(识别复数和单词的变化)和简单的拼写检查。
TechTarget授权文章,严禁转载