| 自然语言复杂性 |
近几年来,人们一直在研究如何通过语义分析来处理人类的自然语言。但自然语言十分复杂,存在着大量的歧义与不确定性。
举例一:
“我把羽毛球拍卖了。”
这句话可以理解为“我把 羽毛球拍 卖了”。或者理解为“我把 羽毛球 拍卖了”。
举例二:
“An aggressive policy was raised at meeting。”
“aggressive”有侵略性的意思,也有积极的意思,整句话可以理解为在会议上提出了一个侵略政策或者理解为在会议上提出了一个积极的政策。
举例三:
“衣服被放在沙发上,它很干净。”
这句话所要表达的到底是“衣服很干净”还是“沙发很干净”呢?
单看三句话,无论是人还是计算机都很难理解。人们依靠上下文关系可以看出正确的组合,可是对于机器来说就很难判别。Cooling Search 在传统的语义分析方法之上,做到了能够像人一样,依据上下文语境来消除歧义,准确地判定句子结构理解句子真正的含义。
APE有着多年汉语输入法的开发经验,将输入法的整句输入技术以及多年积累的语法模型应用到Cooling Search 中。 |
| 语言多样性 |
世界上有多少种语言?一说七千多种,一说五千多种,一说两千多种,无一定论。使用人口超过100万的语言也有140多种,语言用语法来连贯,就算在相似的语言,例如:德语与英语。
之间的语法也有着细微的不同。如果每一种语言都按照语法来建立模型分析语义的话,无论对计算机或人,都是相当大的工作量。而Cooling Search 使用的统计模型,不依赖于语法。Cooling Search 所能识别的不是一种文字,而是一类文字,如东亚语系(汉语、日语、韩语),拉丁语系(英语、法语、德语)。 |
| 技术优势 |
| Cooling Search 无论是从语义分析来说,还是从语言的判断分析能力来讲,所使用的理念都是应用最适合的模型解决多个问题。所以Cooling Search 在能够正确的分析出语句含义的同时也对语言没有任何的限制。这给搜索带来更多的便利。 |