Solidot 登录
[ 创建一个新帐号 ]
全面了解 Powerset
35公里 写道 "人们期待已久的自然语言搜索引擎 Powerset 终于亮相, Powerset 将改变人们从 wikipedia 搜索和发现资料的方式。基于 PARC 专利许可,以及专有的搜索技术的 Powerset 将是自然语言搜索技术的一种突破,它可以就任何主题或领域,从 wikipedia 的文章中抓取句子的含义。
这是 Powerset 改变人们消费网络内容的第一步,与基于关键词搜索的传统搜索引擎不同,Powerset 尝试理解句子的含义并进行匹配,以下是关于 Powerset 的发展历程。
这是 Powerset 改变人们消费网络内容的第一步,与基于关键词搜索的传统搜索引擎不同,Powerset 尝试理解句子的含义并进行匹配,以下是关于 Powerset 的发展历程。
2006年10月2日
Matt Marshall 在 venturebeat.com 撰写了一份声明来吸引风险资金。
一个不容忽视的高科技创业公司,Powerset,即将获得 1000万美元风险资金对抗 Google
我们耳闻一个叫做 Powerset 的高科技创业公司,声称其搜索技术优于 Google。该公司由人工智能与自然语言技术专家 Barney Pell 创办,他的业务创想已经深入硅谷的风险投资者。
接着,Pell 在他的博客中谈了他的看法:
Powerset与自然语言搜索
两天以后,VentureBeat 就以前的声明发表了一篇很长的更新, 因为太长,我们只节选其中一部分:
关于 Powerset 与自然语言搜索的更多细节
Matt Marshall 2006年10月4号
我们说过会告诉你们更多 Powerset 的细节,这个不为人知的公司准备以一种新的搜索技术超越 Google。Powerset 的杀手锏是自然语言搜索,它会理解人们的自然语言。比如,如果你在 Google 中输入“Books by Children”,Google 一般会忽略那个 "by",并搜索所有与 "books" 和 "children" 有关的页面,因为没有搜索引擎能理解句子中的语意,一些公司,如 Ask Jeeves,曾尝试过,你可以以问句向 Ask Jeeves 提问,但如果你的问题太复杂,Ask Jeeves 就会无所适从,因为它只能回答事先准备好的特定问题。
虽然 Google 也知道自然语言的重要,却没有在这个领域获得重大突破。这很好理解,正象 Powerset 的 Barney Pell 说的那样,人们已经接受使用那些专门的搜索语言,就是关键词语言。很多搜索引擎能够识别一些高级查询语法,比如,搜索那些不含某个关键词的页面,但人们并不容易记住这些搜索语法,而每个搜索引擎的语法各不相同。最终,Google 的核心引擎建立在这种关键词语言上,而它们很难改变建立在这个基础上的各个层面。
Pell 因此而来,Powerset 尝试解决自然语言问题,将自然语言作为搜索的核心引擎,来理解时间,地点,语气等等,他们并没有给出确切的发布日期。
就在第二天,10月5日,搜索专家 Danny Sullivan 正式向 Powerset 提出质疑:
“那是痴人说梦,10年前就有人这么痴了,现在又轮到 Powerset。目前,那是一个你根本没法使用的搜索引擎,但这些炒作无疑还会继续。为了阻止这些行为,让我来讲讲自然语言搜索的历史。”接着 Danny Sullivan 用了非常长的篇幅,回顾了1995年以来的自然语言搜索历史,因为太长,这里不再赘述。
现在,看看2008 年5月12日
Powerset 正式发布,这是 Powerset 改变人们消费网络内容的第一步,与基于关键词搜索的传统搜索引擎不同,Powerset 尝试理解句子的含义并进行匹配。
Powerset 的首页
Powerset 目前面向以下领先的自由内容提供者进行搜索:
- Powerset 对 wikipedia 英文版的250万篇文章进行搜索
- 针对很多问题,Powerset 从开放的共享知识库 Freebase 获得答案。
Powerset 的搜索结果页包含以下实用功能: Factz – 当用户输入一个搜索主题,Powerset 会从 wikipedia 中总结出一些相关资料。
Dossiers – Powerset 会根据 Freebase 和 Wikipedia 作一个总结,以便用户对某个主题的概况有一个快速的了解。
Answers – 对很多问题,Powerset 自动根据 wikipedia 和 freebase 中的资料,生成一个答案表。
Semantic Highlighting – 与用户问题语意相关的搜索结果会加亮显示。
Minibrowser – 搜索结果会以大纲形式显示。
Article Outline – 一个导航工具条会随时漂浮在旁边帮助用户快速进入文章的某个章节。
Summary of Factz – 会自动生成文章的内容总结。
Explore Factz – 可以生成相关主题文章的链接。
Powerset 常见问题:
为什么 Powerset 的搜索只限于 Wikipedia?
Wikipedia 是网络上千千万万用户查找高质量信息的源泉,通过对 Wikipedia 的搜索,Powerset 不仅提高了搜索质量,还提供了一种对知识进行总结归纳的新方法。当然,Wikipedia 只是开始,接下来,Powerset 还会将触角伸向更多资源。
什么是 Freebase?
一个由 Metaweb 提供的自由开发的世界知识库,Powerset 的一些问题的答案来自 Freebase。
“Powerset”是什么意思?
太文字游戏了 - 译者。
相关文章
Powerset试用
[+]
livepine 写道 "Powerset是一个自然语言搜索引擎。今年早些时候它获得了施乐帕洛阿尔托研究中心(PARC)所研发的自然语言处理技术,标榜能够理解人类所使用的自然语言。这同Google、百度、雅虎之类的搜索引擎有极大的不同。后者利用关键字搜索,因而检出的结果同使用者原本的意图可能有很大差别,而且也很难判断自然语言中大量存在的同字不同意等模糊情况。一个自然语言搜索引擎,如果真像其名称所指的那样,就可以克服这些困难,更加准确地达到使用者想要的信息。事实上到目前为止还没有任何技术进展能够完整地识别一门自然语言,但基于特定句式的单句理解已经有了颇多的成果。人们可以把不太复杂的单句用逐字分析的方法纳入特定的语法结构,然后根据解析出的语法结构来判断单字的意义,并转化成计算机所能够识别的查询条件。Powerset的搜索技术应该大致基于此。
最近收到了Powerset试用的邀请,于是来体验一把。网站的重点之一是自然语言搜索演示。与我原本期待的不同,这里你不能随意输入任意的句子,而只能在一大组提供的句式中填空,例如A说了B什么,X画了什么,之类。演示所采用的索引数据库不是整个互联网,而是英文wikipedia。这大概也是因为相对整个互联网散漫的语言而言,wikipedia更有组织,更能够正确建模的缘故。此外演示还提供了一个powermouse功能,用图示的方法列出两个名词和一个关系(动词)的结构。例如你可以填写man和woman,然后引擎列出男人和女人之间所有可能的关系和动作。不过还不能智能到归纳所有男人和所有女人,例如结果里就不会田亮和郭晶晶的故事。具体的试用例子请看这里。"
全面了解 Powerset
|
登录/创建一个账号
| 顶部
| 搜索讨论
声明:
下面的评论属于其发表者所有,不代表本站的观点和立场,我们不负责他们说什么。











