文章
Slash Boxes
评论

Solidot 登录

登录

[ 创建一个新帐号 ]

Powerset试用

matrix 发表于 2007年12月19日 08时15分 星期三   Printer-friendly   Email story
来自谁为中国政府工作部门
livepine 写道 "Powerset是一个自然语言搜索引擎。今年早些时候它获得了施乐帕洛阿尔托研究中心(PARC)所研发的自然语言处理技术,标榜能够理解人类所使用的自然语言。这同Google、百度、雅虎之类的搜索引擎有极大的不同。后者利用关键字搜索,因而检出的结果同使用者原本的意图可能有很大差别,而且也很难判断自然语言中大量存在的同字不同意等模糊情况。一个自然语言搜索引擎,如果真像其名称所指的那样,就可以克服这些困难,更加准确地达到使用者想要的信息。事实上到目前为止还没有任何技术进展能够完整地识别一门自然语言,但基于特定句式的单句理解已经有了颇多的成果。人们可以把不太复杂的单句用逐字分析的方法纳入特定的语法结构,然后根据解析出的语法结构来判断单字的意义,并转化成计算机所能够识别的查询条件。Powerset的搜索技术应该大致基于此。 最近收到了Powerset试用的邀请,于是来体验一把。网站的重点之一是自然语言搜索演示。与我原本期待的不同,这里你不能随意输入任意的句子,而只能在一大组提供的句式中填空,例如A说了B什么,X画了什么,之类。演示所采用的索引数据库不是整个互联网,而是英文wikipedia。这大概也是因为相对整个互联网散漫的语言而言,wikipedia更有组织,更能够正确建模的缘故。此外演示还提供了一个powermouse功能,用图示的方法列出两个名词和一个关系(动词)的结构。例如你可以填写man和woman,然后引擎列出男人和女人之间所有可能的关系和动作。不过还不能智能到归纳所有男人和所有女人,例如结果里就不会田亮和郭晶晶的故事。具体的试用例子请看这里。"
This discussion has been archived. No new comments can be posted.
显示选项 门槛:
声明: 下面的评论属于其发表者所有,不代表本站的观点和立场,我们不负责他们说什么。