| 关键字搜索 |
| 这是一种最常见的搜索方式,把一个或多个关键字作为搜索条件。同时支持多种逻辑运算操作符。Cooling Search 关键词搜索支持多国语言,不受地域的限制。 |
| 语义搜索 |
语义搜索将理解语句含义作为搜索前提。机器通过不断学习,正确对句子进行分词并通过概率计算准确得出切割语句的最佳结果,理解用户搜索语句的含义。Cooling Search 除了对中文语句可以进行语义搜索之外,外文也同样得心应手。
对权重的调节
在语义搜索中,Cooling Search 会调节权重,同样一个关键字,在一篇文章的所在位置不同,出现次数不同,使得这个关键字在每一篇文章所占的权重也会有很大的差异。权重是衡量文档是否符合用户搜索的结果的一个很重要的标志。
对词性的认识
Cooling Search 能够对一个关键词的在语句中的词性做出标注。这样系统就能更准确地理解语句的语义,具有以下优点:
1. 更准确地理解句子含义,消除歧义。
2. 给出的搜索结果更加符合用户的需求。
3. 结合权重调节和词性标识,可以有效增加搜索效率。
|
| 相似度排名 |
系统将利用生成索引时为各种概念动态计算出的理论值来评估内容的相似度。相似度可以视为查询文字和结果文档中文字在概念上的吻合度。对相似度进行排序,查找出需要搜索的内容与正文最接近的文章,提高用户搜索的准确性。
使用相似度排名有以下主要优点:
1. 通过排序可以将更符合用户期望搜索的结果提前,从而更加符合用户的满意度。
2. 管理者可以针对各自业务的需求和每个员工的各自角色自定义相关度。
3. 准确地实施相似度可以提供搜索的准确率,节省时间。
|
| 信息整合 |
传统的多个数据库搜索,目前给搜索带来了很多问题。传统的数据库关系复杂,使用多个接口连接多个数据库。 搜索所用的时间长,往往会出现网络延迟,这是在搜索中致命问题。Cooling Search 采用信息整合方式,将多个数据库整合在一起,只用一个接口搜索各个不同的数据库里的信息。这样做的优点有:
1. 实现搜索的批量性。
2. 搜索的速度快,这是传统数据库所不能达到的。
3. 只需要一个接口,进入所有的数据库。
|
| 自动分类 |
自动生成分类
如今现代企业的类别越来越多,企业内部的对专业知识的要求越来越高,对系统的分类要求也越来越高。现在搜索的目录也应该能够处理各种信息格式,包括结构化数据和非结构化数据、HTML、XML等。Cooling Search 能够分析各种格式的信息,同时也创建了各种细化的分类,能够让专业的人士节省时间,集中在自己所需要的文档中。
Cooling Search 采用了一种整体式方法生成分类目录,实现了机器自动化和人工手动加入之间的平衡。主要优点有以下几点:
1. 人工参与和修改与机器自动生成并行。
2. 可以分析不同的语言。
3. 具有灵活的管理能力。
4. 用户可以准确了解自己所想要了解的板块信息。
5. 提高搜索效率。
行业目录库
系统需要提供多个子系统满足用户需要非常精确的搜索结果的需求。 Cooling Search 通过不断地调研当前流行的类别划分,将原本的大类例如:经济,体育等细化成更小的单元,例如:微观经济,宏观经济等。使用户搜索到的内容更符合自己的理想标准。Cooling Search 又根据行业分成自己的行业库。将经济分成29个小行业,体育分成32个小分类,另外还有旅游,天气,科技这些细小分类12个。精细的分类和高准确率的优势已经在上海日报等分类系统应用中得以体现。
|
| 自定义搜索展现 |
| 由于非结构化数据的存贮格式非常多样,搜索的结果往往会以多种形态展现,这给不同搜索客户端的显示带来困难;而且,在企业信息化门户建设中,往往会要求数据以统一、规范的形式进行展现。Cooling Search 把搜索结果与展现通过MVC的模式进行分离。在服务端,搜索结果通过多种接口形式分发到客户端;在客户端,用户可以通过自定义的模板,自行定义各类展现方式。 |
| 搜索建议 |
在具体的搜索应用中,用户往往会通过一个或多个关键词来表达搜索意愿。由于自然语言天然存在的歧义性,尤其在没有上下文语境的前提下,一个关键词往往会有多种含义。搜索建议能够在遇到歧义的时候,主动提供建议,方便用户缩小搜索结果的范围,提供更精确的搜索结果。
如:用户在搜索框中输入“D700”,这时“搜索建议”会根据该关键词对应的不同含义,询问用户的搜索意图是,照相机、笔记本电脑还是手机。
|
| 自动信息补全 |
| 当用户在输入搜索条件的同时,自动信息补全会根据目前存在的关键字,自动提示可能匹配用户输入的搜索条件。 |