YEXP

YEXP

“人肉搜索引擎”Ark:让你搜索社交生活

来源:互联网

2005年10月,加州大学伯克利分校计算机科学硕士Patrick Riley独自一个人到德国慕尼黑的路德维希-马克西米立安大学担任为期9个月的访问学者。像每个初到异国的人那样,他遇到了“文化冲击”(Cultural Shock):慕尼黑不同于毫无拘束的旧金山与硅谷,这让他有点焦虑和孤独。他渴望认识新的人—尤其是那些和他有着共同兴趣和关注的伙伴。但他很快意识到,没有一种工具能让他真正做到这件事。

Patrick Riley(一财网配图)

“我能用Google搜索到那里的任何东西,除了人。”Patrick对《第一财经周刊》说,“我之前以为已经有人解决了这个问题,但是并没有。”

这段经历让他萌生了创造一款“人肉搜索引擎”(People Search)的想法。只是Facebook效应引发的“All things social”浪潮还没席卷大部分人生活的时候,你很难搜索到关于一个人真正有价值的“个性化”信息。而当派对场所、教育职业技能、兴趣、宗教信仰、政治主张和婚姻状态等信息都变成人们分享在Facebook、LinkedIn、Twitter和Google+等社交工具上的数据,且总量呈几何级爆炸式增长的当下,通过一款搜索工具找到一个你需要找到的人,毫无疑问变得容易了。

Patrick Riley找到了合适的机会把一款关于“人”的搜索产品变成现实。这款产品被称作“Ark”,中文意思是“方舟”。3个月前,它刚从聚集了最聪明的创业者的硅谷创业孵化器Y Combinator毕业,并获得了来自Andreessen Horowitz、SV Angel和Greylock Partners等硅谷顶级投资机构总共420万美元的种子期(Seed Stage)投资—这几乎是历史上最大的种子期融资规模。Patrick相信,充足的种子基金能让这款改变搜索引擎的产品摆脱一切羁绊、不受外界控制地快速发展。“我们不希望投资者在我们的董事会里对每个决定投票,我们完成融资就想回去写代码。”他对《第一财经周刊》说。

Ark界面(一财网配图)

Ark的办公室位于伯克利以东约20英里的小镇奥林达(Orinda),离旧金山和硅谷相对较远。但它却相对形成了一个独特融洽的氛围:Patrick Riley从本科到博士学位的所有经历全部来自加州大学伯克利分校,Ark的另一位联合创始人兼首席技术官Yiming Liu是伯克利信息技术在读博士和搜索技术专家,目前的18名正式员工的大部分也都来自伯克利。他们计划在接下来的暑假从伯克利招收大量的前端工程师和搜索引擎工程师实习生,用两个月让Ark的“人肉搜索”体验显着提升到一个高度,然后正式发布。在年底之前,他们的规模将达到50人。

5月下旬在纽约举行的TechCrunch Disrupt上,Patrick Riley用一幅图解释了Ark可能会是什么:左侧圆圈是Google,右侧的是Facebook。他问台下听众:“如果Google和Facebook之间休战的话,它们会一起做什么?”答案是:一款关于社交网络信息的搜索引擎。

但它们现在水火不容。“我不明白为什么人们总认为是Facebook屏蔽了Google的爬虫?事实上大约600万个Facebook的页面都被Google抓取了。问题在于Google并不想让自己的搜索结果太多来自Facebook,它们宁愿希望这些结果来自Gtalk和Google+。”Patrick对《第一财经周刊》说。相反,他相信如果Facebook下决心进攻搜索的话,会很快就成为世界第二大搜索引擎。但这并不是Facebook的优先级,而且它只能搜索到自己页面上的信息—其他几乎任何独立的平台,包括Twitter、LinkedIn和Google+,都会限制Facebook的渗入和抓取。

“而我们是一款中立的搜索引擎。”Patrick说。他认为Ark的长期使命是,成为一款搜索社交生活的工具(Search Your Social Life)。

作为一款搜索人的社交生活工具,Ark的工作原理是:索引来自Facebook、Twitter、LinkedIn、Meetup、Mixi(日本领先社交网站)和人人网等社交平台上关于用户的个人注册信息,把这些信息聚合起来分析处理—当人们通过关键词和Ark的数十项过滤选项进行搜索后,它会自动呈现出你想找到的人的列表。

它可能会出现以下的情景:你的地理位置标签选择为“北京国贸”,活动选项是“瑜珈”,你或许就能找到可以下班之后一起去瑜珈会所办打折卡的人。如果你从伦敦到北京做大学访问学者,设置城市为北京,设定就读学校是北大、清华或人大等任何一所中关村附近的高校,锁定专业是“汉语言文学”的学生,就能找到最合格的中文辅导老师。你还可以搜索供职公司是百度或腾讯,职位是产品经理,性别为男的家伙们,然后按照搜索结果挨个发信息询问是否可以做你新创建的公司的产品合伙人。如果你只记得你三个月前在一个聚会上邂逅的女生叫Miranda,她说她的星座是双子座,正在北京电影学院表演系念大三—把这几项结果勾选和填写一下,那么当时你忘了要她的电话号码好像也没什么可后悔的了。

而这些数据都来自于社交网站上用户的个人页面填写的信息,以及滚动更新的“信息流”。从搜索角度,这是一个相当具有挑战的任务:首先是人们关心的隐私问题,其次是一个人的信息和自我描述可能来自不同的社交网站—比如在Facebook上更多是个人生活,在LinkedIn上更多是职业信息,在Meetup上更多是兴趣社团,如何通过这些零散的碎片化的信息辨认出它们属于同一个人,仅仅是通过一个名字、性别和城市这些简单的标签?还有,当人们在社交网络上对自己的信息做出重大更新之后,Ark需要多久才能抓取到它们,然后把它们呈现在自己搜索的结果里?

Ark声称他们可以解决用户对隐私问题的顾虑,比如在一个人注册为Ark的用户时,它授权Ark可以提取和索引他的个人数据。Ark会提供不同的标签,标记出这个人在社交网络上哪些信息可以选择被公开搜索,而哪些信息仅为个人可见,以从产品设计上取悦用户来赢得他们的信任—Ark需要在这个前提下从各个社交网站上提取尽可能庞大的数据和信息。

这只是挑战的开头。“抓取社交网站上的数据其实是我们的工作中最容易的部分,”Ark联合创始人、首席技术官Yiming对《第一财经周刊》说,“真正有挑战的部分是如何对这些大量的关于人的个性化数据进行智能分析和校正,以确保它们的精准。”

它最终实现的结果是People Rank(人的排序)。正如同Google的最大价值在于创造了一套页面排序(Page Rank)的算法那样,Ark的搜索引擎工程师们正在通过一套能精确判断出哪些关于人的搜索结果最符合搜索者的预期的算法,并最终把这些被搜索出来的“人”,按照精确度和相关性的排序呈现在人们面前。Patrick说,他们已经获得了相关的知识产权和专利。

如果真能实现的话,这显然是搜索的重要进步。搜索革命一直也是Ark的孵化训练营Y Combinator的创始合伙人保罗·格雷厄姆(Paul Graham)最关注的未来趋势之一,最近几届Y Combinator毕业的创业公司中有若干家都与搜索相关,比如与Ark同届的二手车信息搜索引擎Carsabi,以及前两届毕业的与Ark颇为相似的Greplin—它允许人们在自己的Facebook、电子邮箱、Gtalk、Twitter和LinkedIn等数据中进行搜索,管理自己的社交网络信息。但从搜索自己的社交信息,到通过海量的社交网络数据搜索到自己希望找到的那个人,显然并不是一个层面。

Ark也在同时开发基于移动平台的版本,这是它为什么疯狂扩张团队的原因。而移动版Ark甚至可能与它在电脑上的版本同时正式推出。其实,移动版的Ark看上去更像是一个帮助你寻找陌生人的应用程序。当你从一个城市飞到另一个城市,按照你事先勾选好的搜索选项,Ark会根据你所在的地理位置推送给你它认为你最需要认识的人:当你从芝加哥起飞的航班在旧金山国际机场落地之后,你打开手机上的Ark应用,它会按照你的搜索设置,找到可能会和你一起出现在旧金山自然博物馆或Great American音乐厅的同道,以及可能在SF New Tech创业者定期Demo和聚会上遇到的潜在合作伙伴。甚至可以显示他们的地理位置离你还有几英里—如果离得太近的话可以直接约喝一杯咖啡。

这有点类似当前硅谷相当热门的“认识陌生人”的一系列社交工具—比如基于地理位置和社交网络信息的Highlight和Banjo。Highlight在今年奥斯汀的SXSW大会上迅速火爆,它可以帮助你找到社交网络上的老朋友并认识新的朋友,设计也很漂亮。Banjo去年7月发布后9个月即获得了100万名的用户,超过了Facebook、Path、Pinterest和Twitter的早期用户成长速度。

尽管在将用户连接在一起这事上每个玩家都有一套办法,但Ark是一款属性不同的产品。Patrick对《第一财经周刊》透露:不同于Highlight和Banjo需要登录才能寻找和搜寻附近的好友和陌生人信息,未来的Ark移动版甚至无需登录就可以直接搜索,而且更多的标签和过滤选项能帮助人们找到更符合他们需要的“陌生人”。“它的架构是基于搜索设计的。”看上去,它做了一切Google和Facebook可能做但没做的事,也因此引来了Facebook的兴趣—Patrick声称Facebook在5月曾与他们接触商谈收购的可能性,但被他以想做一些更酷的事为理由拒绝了。此外,他还透露,腾讯一位“首席××官”(C Level)级别的高管以个人名义投资了Ark。

但他同时小心翼翼地表示Ark并非Google的竞争者,而是一个补充。社交网络的爆炸产生了庞大的社交化数据,只是这些海量数据在互联网上很少获得被直接发现的机会。人们并不能通过Google找到它们,而Ark将来可以与这些数据发生更密切的关系。“所以我们希望让大家知道的是:请你们使用Google,但那些在Google上搜不到的东西,用Ark。”

所谓在Google上搜不到的东西,就是Ark所谓的“Search Your Social Life”(搜索社交生活)。在未来,它包括的可能并不仅仅是人的基本信息。

当你要去参加一个派对,你怎么记住派对的地址?你可能会说Gmail或Facebook,但如果你不记得这些信息在哪里发生的了呢?也许你用Evernote,但你仍然需要自己把信息复制下来,然后记录在Evernote里,但这是不是最简单的方法?

Ark试图让人们相信,这些从社交网络上产生的信息流都可以通过搜索的方式呈现在你的面前。比如当你又记不住要参加的派对的地址,甚至忘了一开始是在Gmail邮件、新浪微博还是QQ的对话中获得消息源的话,用Ark搜索或许将帮你解决这一切。它可能来自你的社交网站信息流(包括你与好友在互相空间上的留言),更可能来自不同社交网络平台的各个角落—可能你通过派对的时间和主题的搜索,在其他人的社交网络信息流中找到了这个地址。社交网络的庞大数据并不仅仅用来让Facebook和Twitter们给你推送所谓的精准广告,它还应该帮助人们触及一些从未到达过的新疆界,比如关于“社交生活”的一种新的搜索引擎。

但这些功能目前还未能出现在Ark的产品中—整个Ark的搜索仍处于测试的早期。但已经有人尝试着接近了Ark关于“搜索社交生活”的图景。两年前毕业于Y Combinator的Greplin,近日已经改头换面成另一个品牌Cue。在可以搜索个人在社交网络上一切个人信息的基础上,Cue通过导入和整合人们这些庞杂的个人社交数据,帮助你自动管理行程、地址、联系人、旅行计划、会议安排和社交媒体更新。它将更像是个人生活助理而并非仅仅是一款搜索工具,正如Cue的Slogan所说的那样:预知未来(Know What's Next)。

而这一切关于未来的管理和预知都是基于社交网络的生活展开的。当一个与Ark有着同样背景的公司逼近一个近似目标的时候,不知道这对Ark意味着什么。

不过这至少说明它们都有着看似很难实现,但或许可以变成现实的使命。这样的使命会让一个创业变得不同且充满刺激。“Google一开始想做的不过是一个卖给大公司的企业搜索引擎,但它后来的使命变成了整合全人类的信息,Foursquare一开始的目的就是签到,但它现在的愿景是让人们的生活变得更容易,”Patrick对《第一财经周刊》说,“Ark是一款基于人的搜索引擎,从长期看,它是你搜索社交生活的工具。”

人肉搜索引擎