第541章 Hadoop - 大时代之巅

听过许亮杰的话，周不器又叫来首席技术官程秉皓，也详实沟通了一下搜索的事。
　　
　　新浪的爱问搜索，就是他带队做出来的。
　　
　　如果他去年不离开新浪，说不定凭借此功劳，就能晋升为新浪的cto了。
　　
　　不过，他现在是紫微星的cto，也一点不差。
　　
　　程秉皓的看法跟许亮杰差不多，而且更加地本土化。
　　
　　“百度为什么做内容？因为在国内做搜索，做内容是唯一能够生存下去的方式。”
　　
　　程秉皓的看法更加的锐利直接。
　　
　　在国内做搜索，跟硅谷不一样，要根据法律法规，要移除和屏蔽一些内容。以及要贴心的为用户考虑，通过一些深度算法，帮助用户移除一些深度的专业化内容。
　　
　　因为越专业越小众，越庸俗越大众。
　　
　　要想获取最多的大众用户的喜爱，不能提供太专业的内容，而是要提供一些浅白易懂、不那么复杂的搜索结果。
　　
　　比如百度那边已经在做机器学习，也就是最早期的人工智能。即通过用户搜索结果以及对搜索结果的反馈，来让机器学习。从而在未来搜索的时候，让机器帮忙推荐更符合大众口味的最优解。
　　
　　这就又产生了一个好处，可以进一步的缩小检索范围。
　　
　　百度的搜索技术比不上谷歌，差距之大……远远超出想象。其实也不止百度了，雅虎、微软也一样。
　　
　　谷歌能在最短的时间内，在海量的互联网数据中搜索出相关内容，然后根据算法排列，呈现在用户电脑前。
　　
　　可其他的搜索引擎不行。
　　
　　要想给用户提供最快的响应速度，怎么办？
　　
　　最简单的方法，就是缩小检索目标。
　　
　　谷歌检索10亿条信息，百度就检索1亿条信息。
　　
　　信息来源少了，搜不出想要的答案，也就不奇怪了。
　　
　　所以，百度要想坐稳国内第一的宝座，就一定、只能、必须做内容。通过自产的内容，来弥补检索技术方面的弱项。
　　
　　这种方法，没法满足高端用户的需求，却可以满足全社会中80%的用户需求了，这就够了。
　　
　　可以说，百度的李总通过正面退怯、背后游击的方式，完成了对谷歌在搜索领域霸权的挑战，并且成功了。单从这一点来说，可比微软、雅虎等巨头强了不少，那伙人还在苦哈哈的想跟谷歌玩技术呢。
　　
　　玩个屁啊，根本不是一个量级的。
　　
　　在大数据处理的领域，全球科技公司都要依靠一个叫hadoop的开源核心架构。这个架构来源，就是谷歌对自身算法理论的公开，却没有公开算法细节。所以雅虎和阿帕奇就牵头合作，召集了一大批顶尖科学家，根据谷歌的算法理论，做出了这个大数据处理系统。
　　
　　可问题很多，距离谷歌公布的一些关键指标存在数倍的差距，苦苦没法解决，只能咬牙接受。包括微软、亚马逊、阿里、华为、脸书、雅虎、百度等巨头，都要使用这个开源系统。
　　
　　只有谷歌不用。
　　
　　不仅不用，他们还在2010年完成了系统的更新……把原来的理论推翻，上线了一个更先进更高端的大数据管理系统。
　　
　　也就是说，全世界科技巨头们使用的大数据管理系统的底层架构，比谷歌淘汰的那个旧版本，还要落后几倍的效率。
　　
　　巨头们当然也抗争，想做出超越hadoop的东西。
　　
　　国内的代表就是百度。
　　
　　在07年的时候，百度股价一路飞起，上下振奋。李彦红决定代表华夏，做一个世界级的开创性项目出来，起名“金字塔”计划。
　　
　　抽调了百度最精英的核心技术人员，又从外面招来了一个专家团队，带头人赫然就是现在紫微星研发中心的负责人杨振坤！
　　
　　这个大计划，不用java、python，甚至连c++都不用，直接用c语言写代码。
　　
　　可谓是雄心壮志。
　　
　　当时，百度从最高层到一线开发人员，都充满激情，毕竟这是一次叫板硅谷的大事，做成了足以扬我国威。
　　
　　项目组疯狂加班，百度大厦12层西侧的灯每天晚上都亮一宿。
　　
　　做了两年，项目成功了！
　　
　　可是，最后百度还是回归到了hadoop的阵营中。
　　
　　为什么？
　　
　　因为有一个小项目组，拿来hadoop的代码简单包装，重写了api，然后拿过去跟百度耗时两年、斥巨资打造的金字塔系统比较性能。
　　
　　结果，小项目组以微弱的优势取胜了！
　　
　　李彦红看到这个结果，顿时心灰意冷，如同被泼了一盆凉水。
　　
　　hadoop是开源项目，是全世界的开发者们一起去更新、促进，潜力巨大。原创的如果没有巨大优势，再加上职场政治，就只能是朝开源的方向走了……
　　
　　阿里云的初期，曾遇到过巨大困难，被业内深深质疑。因为最早期的时候，王建博士判断错了，也要搞一个类似hadoop的大数据系统，半抄半改，还是糊了。后来看到亚马逊云成功了，才恍然大悟，赶紧调头改变方向，这才取得了成功。