| 简介 |
| 自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,,所以它与语言学的研究有着密切的联系,但又有重要的区别。自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统。因而它是计算机科学的一部分。 |
| 背景 |
近几年来,人们一直在研究如何通过语义分析来处理人类的自然语言。但自然语言十分复杂,存在着大量的歧义与不确定性。
举例一: “我把羽毛球拍卖了。”
这句话可以理解为“我把 羽毛球拍 卖了”。或者理解为“我把 羽毛球 拍卖了”。
举例二: “An aggressive policy was raised at meeting。”
“aggressive”有侵略性的意思,也有积极的意思,整句话可以理解为在会议上提出了一个侵略政策或者理解为在会议上提出了一个积极的政策。
举例三: “衣服被放在沙发上,它很干净。”
这句话所要表达的到底是“衣服很干净”还是“沙发很干净”呢?
单看三句话,无论是人还是计算机都很难理解。人们依靠上下文关系可以看出正确的组合,可是对于机器来说就很难判别。Cooling搜索 在传统的语义分析方法之上,做到了能够像人一样,依据上下文语境来消除歧义,准确地判定句子结构理解句子真正的含义。 |
| 价值 |
Cooling搜索具备的自然语义分析能力,能够理解非结构信息包含的真实语义,将大大提升搜索服务的质量。目前主流的互联网搜索产品中,都是基于关键字严格匹配的方式来实现,这些搜索产品并不能读懂信息的语义。因而,根据这种方式得出的搜索结果,往往会和用户原始搜索意图完全不匹配。Cooling搜索的搜索服务,能够通过自然语言分析,理解每一篇文档的真实语义,并通过语义结合关键字去搜索特定的信息,使得搜索结果能够准确地符合用户的搜索意图。
Cooling搜索目前的自然语言处理由汉语分词、词性标注、语法树构建、句子成分标注、语义量化几步完成。下图以"股指期货相当赚钱"为例,对整个处理过程进行了描述:

|