Google副总裁——今天的搜索有多成熟
搜索已成为互联网运转的核心,也是Google业务的重中之重。
/ a/ f! K: I3 g y! R E7 l5 Z Udi Manber是Google搜索部门副总裁,主要负责搜索业务算法研究。他的工作高度机密,因为Google不想让人了解其中的玄机。不过Google近来开始少量向外界公布自己的核心搜索业务的情况。Udi在Google总部接受了我们的专访。% R( m5 X! C# U5 C/ Q6 _ R4 E) _
' b# G# ~" N, H8 m/ h6 g 今天互联网搜索有多成熟?
* ]& O& o% v, I: L4 o) s# @) [* {/ i7 @8 A; }2 R! k2 ~
Udi:做个类比,一个15岁的年轻人认为他很成熟。一个19岁的人认为他异常成熟。不过,每过几年你都会意识到以前都不太成熟。网络搜索就好像15岁的人,不过很明显,我们现在比5年,10年,15年前成熟多了。& j$ \6 b. J( e% P9 r6 V5 U
9 T( @) P/ O! _! ? 你毕业于亚利桑那大学,然后在雅虎,亚马逊网站,A9工作过,2006年,你来到Google。你从这些不同的经历学到了不同的东西吗?或者只是公司名片的电话号码改改而已?
, W! _/ S8 d0 S2 [
" d, i9 l D( B p6 \! }7 V Udi:现在的公司规模更大一些,也更好。现在的团队比我以前共事过的要大。我们投入更多的资源在团队上。# N0 j0 D/ \, G5 I8 L( L& \# {
! J5 t2 J$ X: |% a( x3 T9 q" a, J# k
在网络发展的早期,我还记得AltaVista,HotBot和WebCrawler这些搜索引擎的存在。; G5 U8 s- X* p& a7 a
! m" }1 L0 n- g9 t. Q& [% u
Udi:我也记得它们。当时这些搜索引擎看上去非常精美和成熟,现在回首又是另外的感受了。1 K% N- A3 w: U" C3 x
. ^! w1 e9 f9 C9 A H9 ~. w% U 搜索引擎变得更有用了。不过10年之前,人们并未想到我们将会通过一个搜索框来获取信息,现在,这种方式显得理所当然了。10年之后又会怎样呢?* F+ `0 q: i7 a7 _( P
+ F* E! [& y4 n! l
Udi:10年前,还是有一些人知道这一点。不是吹牛,我当时就很清楚这一点。这就是我为什么在90年代转行搜索行业的原因,因为每个人都在谈论信息革命。很明显有一场信息革命,信息的存储,传输等,你需要找到它们。
& t6 G2 c8 b4 _
$ u$ O/ ]5 _9 C! s$ u) b 在巨量信息中找到想要的东西成为这场革命的关键。虽然现在这一点已经很明显了,不过在6到7年前,这一点还不是很清晰。我们认为Google之所以现在这样的成功,原因是创始人 Larry Page和Sergey Brin 10年前就看清了这一点,然后投身其中。
( }5 T0 k) @! p J# w/ w3 {: K; X8 ?. c: k
90年代初,只有很少的人从事搜索研究,领域也很有限,象司法搜索,医学搜索,药物搜索等,当时,如果你要找一个信息,你得让专业人士来完成,你告诉他自己要找的东西,他来给你执行搜索。我们认为,人们应该自己来完成搜索,不必找专业人员,这就是一场革命。$ G' x4 `; M- B* T1 v4 S
& N7 a4 q" V2 B 我预计,未来人们希望搜索到更多的东西,因为现在有很多东西在Google上还搜索不到。
" y( N* g0 F$ R [: X
. e: [+ M0 ~9 _ 10年前,如果你能够找到问题的答案就很满足了,现在,如果你在第一或第二个搜索结果中找不到答案的话就会不满意。这种转变很好,人们的期望就是我们将从事的事情。; v& ~# W: z( t0 ]; |
% s6 E8 I! ~6 Y 搜索技术的一个有趣趋势是个人化。比如我喜欢照相机,如果我进行一年的搜索工作,Google就会明白我喜欢照相机。个人化技术有多成熟?# M$ }3 Z1 E; A8 D. C
0 Z1 \- K( w6 u z# i
Udi:是的。如果你允许,我们将保存你的搜索历史,并且用它来改进你随后的搜索。个人化技术不是要彻底改变你的搜索结果,它只是略微的调整你搜索的结果。即使你很喜欢照相机,你的搜索页面上仍然有大量与照相机无关的东西,如果参照搜索历史,那么结果就会好很多。
! w4 D/ V" r" F t) b/ S. `0 c0 p$ W- L7 z# o1 M ~, F
现在人人都加入了社交网络,那么整个互联网搜索与个人搜索之间有交叉层吗?6 p% s- l/ I/ ~# Y# S: U, Y g5 N/ r6 B
: {; ]: X- \4 S( | Udi:我们能够用个人信息来改进你的搜索。比如,你搜索了1百次照相机,这就会告诉我们很多信息。如果你的朋友执行特定的搜索,它们也是一种信号。
- b: V d& T! e: h$ l- p5 q7 \# S- P% M- A% b: i1 m
Google搜索结果的确定性怎么样?比如,在不同的时候执行相同的一个搜索,结果会一样吗?因为你们有这么多的服务器,搜索结果会在这些系统之间缓慢的发生变化吗?如果我明天在波士顿进行一个搜索,或者在没有开启同步功能的情况下搜索,结果会不会不同?
3 |6 i( }& r' Z3 |" g5 P: M) c% J/ T1 p0 y# _# T$ }
Udi:搜索结果是通过系统来进行过滤的。系统以很快的速度来完成搜索工作。如果你在不同的服务器集群上进行相同的搜索,那么在一定的时间,其结果可能有轻微的不同。同样,如果你在不同的时间执行相同的搜索,结果有可能有所差别,因为有些结果可能我们刚好在5分钟之前进行了收录。
; `' u2 t* b4 L. r
2 N" U0 U4 T5 e 我们收录信息的速度确实很快,如果世界上有事情发生,你可以在1个小时内搜索到与这一时间相关的众多页面。时效性对我们来说非常重要。* Y. n' }# f4 H( Y5 c) R
9 O0 Y5 F# Y! X8 f9 a% c 另一个因素取决于位置。如果你在不同的国家进行相同的搜索,甚至你用一样的语言进行搜索,你得到的结果会不一样。我们会根据国家的不同改变搜索结果。
% @) j. z" |. A% D p* U
( C, j7 ~, d8 F h- E4 X 通用搜索的情况如何?人们在多大程度上会用到它?
- F: w4 k# h# C
& ]0 W0 L$ g: P2 c! q. d: O Udi:我们希望你来Google.com搜索到你想要的任何东西,我们会想法判断出你要的是一段视频,一本书,或者当地的信息。根据你的搜索,我们将在搜索结果页面上插入不同的媒体类型,象图片,你不需要再去Google的图片页面找图了。+ ]$ T1 M) |3 M1 y/ ?, K
. s7 ] d; y, k$ `8 w 你们如何将色情信息从搜索结果页面上清除?现在人们不想要两类信息,一是垃圾信息,二是色情内容。' }9 f$ |+ m% r! Z" K
% \4 z6 w! b) I Udi:我们在这方面投入了大量的精力。我们专门有一个团队在从事色情信息的清除工作,这种清除范围不仅是在美国,而是在全球范围。我认为我们的工作很出色。不可能百分之百的清除,但它们的数量已经很少了。我们对这一点相当重视。
, ^/ Z8 i& I! R- ]4 r! Y
! { J6 C! c: y' C0 B( M 和垃圾信息一样,这是否有些像猫和老鼠的游戏?
$ p8 X1 u( c1 d, S4 U" l5 M8 Y5 c W
Udi:不尽然。我觉得,大部分色情网站并不想欺骗你,而垃圾信息网站的目的是要欺骗你,色情网站已经有自己的客户群,他们不需要去欺骗。色情网站的身份很好确认。! A$ W# q' @' N% \
$ m4 ?0 j- ?' `4 f% y( @
我对命令行界面搜索的回归很好奇,和常规的搜索相比,命令行搜索的不同点在哪里?人们需要专门学习命令行搜索方式么?" g9 I5 Z: m" [. R
# s9 w6 Z: H7 Y' R5 N |- _ Udi:我们不想强迫人们去学习专门的语法与命令。我们希望在用户不需要学习的情况下理解他们的想法。不过这也不排斥用命令行搜索。我们只是给专业人士提供一个专业搜索方式。
4 ^; w) |# a$ F# F: ^: e/ e: X+ l6 D# t
目前,行业垂直搜索已经发展壮大,比如化学,医疗,健康,司法搜索。你们会进入这一领域吗?" S$ o7 E2 a3 K- ^! Y6 n
- d a( q! x# q& q5 y4 [7 S
Udi:我们的发展方向是通用搜索。我们希望在Google搜索中融入全部的东西。我们的结果界面中已经包括了专业搜索的东西。% J; O: e c2 \, _' w! F/ m
+ R% T& r( B% a3 J 在视频和相片方面,计算机会不会有朝一日会判断出内容,而无需人们使用文字标签?
0 S+ w2 R4 s% ~# ]# ^) c; \4 B, B: Y `. L
Udi:我认为我们能够在这方面做得更好。图片本身不会告诉我们它表达的是什么,因此,图片的元数据将变得越来越重要。7 f# A( n( X1 [* {9 f& M
5 V `' t1 _$ _: b; P/ J" S+ @
用户创建内容的模式会让你们在这方面更进一步吗?比如,挖掘Flickr和Picasa网络相册中的信息。: H! U0 _* E* q: ~
) Z4 C0 R# w) O: V: R Udi:肯定会有所帮助。
$ v2 @3 {' Z" G7 z
* ?3 U; T$ a( l 对于很多搜索来说,我们得到了维基百科全书的内容。你认为这是好事还是坏事?维基百科当中已经包括了大量的连接到自身的链接,是不是这个原因提高了它的搜索排名?
# F! u `; l+ h# Q5 i% d
+ Z) G) M5 s8 P& A2 m3 g/ I Udi:我认为,如果对用户搜索信息有帮助,这就很好。- Q4 E! ]1 b7 ]$ M( t1 D7 j0 e3 m
H5 J* \6 b. n3 [ ]
; P/ R0 R1 M7 [& V& y9 [/ q
来源: CNET中国7 U8 l. S, \1 O
. w/ G. f1 Q& i1 \/ L" a
[ 本帖最后由 arkin 于 2008-6-8 00:02 编辑 ]