English | 繁体 | RSS | 网站地图 | 收藏 | 邮箱 | 联系我们
首页 新闻 机构 科研 院士 人才 教育 合作交流 科学普及 出版 信息公开 专题 访谈 视频 会议 党建 文化
  您现在的位置: 首页 > 新闻 > 综合报道
“科学与中国”院士专家巡讲团在天津举行报告会
  文章来源: 发布时间:2005-12-05 【字号: 小  中  大   


“科学与中国”院士专家巡讲团在天津举行报告会


    12月3日下午,“科学与中国”院士专家巡讲团在南开大学伯苓楼一楼报告厅举办主题报告会,邀请中国科学院院士、第三世界科学院院士马志明研究员作题为“Google搜索与因特网的数学”的报告。此次报告会由南开大学副校长陈永川教授主持,近400名来自天津市各大高校的师生到场聆听了报告。

    马志明院士首先演示了Google可以在0.36秒内搜索出26,000项相关页面,而排在最前面的就是我们最感兴趣的。由此引申到报告的第一部分——利用网络拓扑结构对网页进行排序。他说,实际上,我们的这个世界就是一个网络,因特网把我们的世界连成一体。Google搜索可以在极短的时间内把网页排序,根本原理就是利用网络的拓扑结构判断网页的重要性。马志明院士用一个形象的比喻来解释这一原理。在申请升职、提级的时候,或者申请博士答辩的时候,你会说你的文章多么重要,但是很可能评审专家们并不明白你的成果有多重要。现在流行的办法就是问你这些成果被引用的次数以及是否有国际权威引用,这两条往往是外行评价内行的一个办法。虽然这不应该是唯一的评价标准,但是在其他方法失效的情况下却是很有效的。Google在给出页面排序时也有两条标准,一是看有多少超级链接指向它;二是要看超级链接指向它的那个页面重要不重要。这两条直观的想法就是Google搜索的数学基础,是Google最基本的工作原理。

    马院士说,这样一个基本原理是和你们同年龄或者比你们年龄还小的两个年轻人发现的。1998年斯坦福大学的Sergey Brin和Larry Page想到了用上述原理刻画网页重要性,发表了一篇文章,并且把他们的算法取名叫做PageRank。这不仅是理论上的发现,文章发表之后他们就办公司实践了PageRank算法,并且非常成功。他们就是Google公司的创办人。

    马志明院士从图论的角度解释Google的排序原理:一是看这个页面对应顶点的度;二是要给连在这个顶点上的边一个权重,表明这个超级链接的重要性。具体的讲就是把所有的页面看作图里面的点,然后给每一个页面一个数量,用这个数量来刻画页面的重要性,这样网页的重要性就脱离了它的具体内容。我们只需从网络拓扑结构出发研究网页的重要性,最后转变为求有向图关联矩阵的非负特征向量,这样就可以用矩阵论来研究随机复杂网络。图论里面的这么一点知识解决了这样一个大的问题。而且按照这个原理对网页排序具有三个特点:第一,排序与问讯的问题无关;第二,排序与网页的内容无关;第三,只需要知道网页的图的结构。

    马志明院士指出,现在不同的公司包括微软研究院,Google公司,因特尔公司等都在相互竞争,都在研究怎样淘汰大量的垃圾页面,提高网页搜索的质量。然而,提高网页搜索质量的关键是算法的收敛速度。我的一位博士后用马氏链的办法解决了WWW2005一篇文章中关于算法收敛速度的猜想,而且证明的结论比这个猜想还广,可见数学真的很有实际意义。

    他说,随机复杂网络虽然是在经典图论的基础上发展起来的,但是它们之间存在很大的差别。复杂网络和图的不同之处在于网络是动态的、随机的,结点是大量的。在图论里面,我们可以问去掉哪几个点这个图就不连通了。对于随机复杂网络,我们要的是去掉百分之几的点网络就不工作了。网路和图,在我们日常生活中到处都有。例如信息网络:WWW,Internet,计算机共享,Email网,专利使用;技术网络:电力网,电话线路网;交通运输网:航线网,铁路网,公路网,自然河流网;社会网:演员合作网,友谊网,论文引用;姻亲关系网,科研合作网;生物网:食物链网,神经网,新陈代谢网,蛋白质网,基因网络等等都是随机复杂网络。这些领域相差甚远,但是人们发现,它们形成的随机复杂网络具有惊人的相同的统计特征:第一,小事件现象:网络中任意两点间距离的平均值很小;第二,聚集现象:网络中有足够多的三角形;第三,无标度现象:顶点的度的分布满足Scaling free规律。

    马志明院士报告的第二部分讨论了因特网上病毒传播的阈值问题。他说,传统的疾病传播,把人和人之间的接触看作是等概率的,人跟人接触之后被传染的机会也是等概率的,这样所有的疾病都有一个传播的临界值。而一些统计物理学家证明,因特网上只要出现病毒,哪怕出现的概率很小,也会传播开来,也就是说网络上病毒的传播阈值是零。用随机复杂网络研究疾病预防会节约很多成本。预防疾病传统的方法是随机挑选百分之几的人打预防针,但是这不是最好的方法。随机选点将所有的结点平均化了,然而实际上有些结点的度数很高。接触传染的疾病预防应该基于网络模型,根据网络不均匀、不对称的分布特点,预防疾病较有效的方法是随机选取边,按照边来选择预防对象,这样可以最快的找到度数高的节点,并且可以节省很多人力和物力。例如对艾滋病的预防,非洲有些地方就是这么做的,效率非常高。

    在报告内容的第三部分,马志明院士介绍了随机复杂网络的研究现状。他说,目前人们在社会网络或计算机网络上传染过程、网络顶点故障对通讯网络性能的影响、网络相变与网络动态系统、蛋白质基因的网络结构等方面已经有了一些初步的研究。虽然,现在关于随机复杂网络的研究仍处于初级阶段,至今还没有成熟的理论框架和系统的程序和方法来研究复杂网络,甚至关于随机复杂网络的哪些属性属于最重要的研究目标这样一个基本问题都没有清楚的答案。但是,随机复杂网络蕴涵了很多深刻、有趣的数学难题,这些正吸引着国际一流的科学家。近年来Science,  Nature,  Physics Rev. Letter等杂志上发表了大量研究和探讨复杂网络的文章。随机复杂网络的研究是一大片没有开垦的土地,在这里面有大量的工作值得我们去投入。

    最后,马志明院士总结道,现在网络的影响已经遍及世界的各个角落,研究随机复杂网络对社会发展具有战略意义,而数学正是研究它的有力、高效的工具。今后,我们需要继续研究发生在网络上的各种过程行为及其应用。随机复杂网络与自然科学、社会科学相互交叉融合,具有巨大的理论和应用前景。如果大量的老师和同学参与进来,就可能会做出开创性的工作。随机复杂网络是一个真正的交叉学科,它将成为跨学科研究的生长点,它的发展和广泛运用,都将有力地推动学科间的整合和交叉学科的诞生与繁荣。

    马志明院士生动精彩、内涵丰富、深入浅出、高瞻远瞩的报告激起了广大师生的强烈反响,受到了与会者的广泛好评。报告的同时,南开BBS上还进行着现场报道,共发消息30余篇,引发了同学们的热烈讨论。随着报告的结束,进入现场提问环节。来自天津市各大高校的数学学院、计算机学院、物理学院等不同专业的青年学子纷纷举手踊跃提问,马志明院士一一给予耐心、详细的解答。马志明院士深厚渊博的学识、精彩丰富的演讲和新颖独到的见解博得了与会师生热烈的掌声。

  打印本页 关闭本页
© 1996 - 中国科学院 版权所有 京ICP备05002857号  京公网安备110402500047号  联系我们
地址:北京市三里河路52号 邮编:100864