辣根小说 > 都市言情 > 大时代之巅

第541章 Hadoop

推荐阅读: 塔露拉,我还是个孩子啊六岁小奶团:七个哥哥亿万团宠农门医色:田妻粉嫩嫩天机秘藏你的诺言重返人生极品仙尊混都市超神:开局表白天使彦空间之彪悍农家女恐怖时代:我有一个妖魔编辑器仙师无敌绝世医妃温意清末之帝国崛起穿越之青青麦穗世子妃她有两幅面孔震惊,全城豪门抢着跟我认亲!我真的不是隐世高人绝对征服系统镇光司大唐昏君异界之一念一世界宇智波的阴阳师天尊萌萌哒绝世刀尊重生之君临都市顾落歌重生民国烽火花都之仙王重生唐风盛莞莞慕斯渣大佬的100种方法天神学院灵武至尊巡河诡事这种崩坏穿越是出bug了吧大叔,别来无恙撩火小妻:傲娇冷少是头狼逆天成凰:重生假千金杀疯了冷琉璃君无霜首富千金爱上我:特种之王大明圣皇纪小姐的甜蜜独家我的好感度系统有问题大佬家的小心肝野翻了末世之吞噬崛起倾世神医:傲娇帝尊,强势撩神医团宠:嫡女皇妃美又炸诡夜黎明造梦人从锦衣卫开始无敌枪战系统末世纵横特别事务管理局天降财运当噩运来敲门药香小农女,王爷宠不停绝世毒妃不好惹从废灵根到仙门老祖战神归来发现多了一个小丫头绝品相师这真的是特摄扮演系统?孩子到底是谁的神棍有背景从猎魔人到帝国之主一人之开始的道爷医者传承地球主神绝宠狂妻:凰命逆天无敌炼丹师和平精英之洛神大陆灵武永恒灰巫师开局当卧底,逼我掀桌子无尽世界穿梭者万古最强宗都市狂兵天才萌宝:坑个爹地送妈咪农门巧媳妇直播间的神豪都市逍遥狂兵斗罗之混天斗罗深渊游戏之超人领主奶爸圣骑士长生在武侠世界混在万族之劫快穿:萌宠来袭,男神轻点宠漫威世界里的赛亚人续写《陈情令》暖爱之独家拥有我明明很弱却不死陆铭霍雨桐男神大人,别过来!GT病毒进化者穿越成了太上长老腹黑帝女要逆天黑色家族的秘婚:魅宠7分77秒忘尘重生之林以宣神皇殿原来我已经满级了盛世妖后:暴君,别来无恙佛系少女不修仙夫人你究竟瞒了我多少帝少爆宠:娇妻霸上瘾相府丑女张无夭秦淮喜事紫气复苏:开局觉醒万法祖师堂神灵们的沙盒游戏修罗少爷太嚣张重生暖婚:傲娇总裁有点暖婉宁青山魔尊最强魔女想要独占我灵气复苏之回收系统末世超级大地主天狐缘军火贩子的抗战独占金枝夏天苏贝贝捡到一个神光棒50块上单,只好去LCK打替补孤光纪
听过许亮杰的话,周不器又叫来首席技术官程秉皓,也详实沟通了一下搜索的事。
  
  新浪的爱问搜索,就是他带队做出来的。
  
  如果他去年不离开新浪,说不定凭借此功劳,就能晋升为新浪的cto了。
  
  不过,他现在是紫微星的cto,也一点不差。
  
  程秉皓的看法跟许亮杰差不多,而且更加地本土化。
  
  “百度为什么做内容?因为在国内做搜索,做内容是唯一能够生存下去的方式。”
  
  程秉皓的看法更加的锐利直接。
  
  在国内做搜索,跟硅谷不一样,要根据法律法规,要移除和屏蔽一些内容。以及要贴心的为用户考虑,通过一些深度算法,帮助用户移除一些深度的专业化内容。
  
  因为越专业越小众,越庸俗越大众。
  
  要想获取最多的大众用户的喜爱,不能提供太专业的内容,而是要提供一些浅白易懂、不那么复杂的搜索结果。
  
  比如百度那边已经在做机器学习,也就是最早期的人工智能。即通过用户搜索结果以及对搜索结果的反馈,来让机器学习。从而在未来搜索的时候,让机器帮忙推荐更符合大众口味的最优解。
  
  这就又产生了一个好处,可以进一步的缩小检索范围。
  
  百度的搜索技术比不上谷歌,差距之大……远远超出想象。其实也不止百度了,雅虎、微软也一样。
  
  谷歌能在最短的时间内,在海量的互联网数据中搜索出相关内容,然后根据算法排列,呈现在用户电脑前。
  
  可其他的搜索引擎不行。
  
  要想给用户提供最快的响应速度,怎么办?
  
  最简单的方法,就是缩小检索目标。
  
  谷歌检索10亿条信息,百度就检索1亿条信息。
  
  信息来源少了,搜不出想要的答案,也就不奇怪了。
  
  所以,百度要想坐稳国内第一的宝座,就一定、只能、必须做内容。通过自产的内容,来弥补检索技术方面的弱项。
  
  这种方法,没法满足高端用户的需求,却可以满足全社会中80%的用户需求了,这就够了。
  
  可以说,百度的李总通过正面退怯、背后游击的方式,完成了对谷歌在搜索领域霸权的挑战,并且成功了。单从这一点来说,可比微软、雅虎等巨头强了不少,那伙人还在苦哈哈的想跟谷歌玩技术呢。
  
  玩个屁啊,根本不是一个量级的。
  
  在大数据处理的领域,全球科技公司都要依靠一个叫hadoop的开源核心架构。这个架构来源,就是谷歌对自身算法理论的公开,却没有公开算法细节。所以雅虎和阿帕奇就牵头合作,召集了一大批顶尖科学家,根据谷歌的算法理论,做出了这个大数据处理系统。
  
  可问题很多,距离谷歌公布的一些关键指标存在数倍的差距,苦苦没法解决,只能咬牙接受。包括微软、亚马逊、阿里、华为、脸书、雅虎、百度等巨头,都要使用这个开源系统。
  
  只有谷歌不用。
  
  不仅不用,他们还在2010年完成了系统的更新……把原来的理论推翻,上线了一个更先进更高端的大数据管理系统。
  
  也就是说,全世界科技巨头们使用的大数据管理系统的底层架构,比谷歌淘汰的那个旧版本,还要落后几倍的效率。
  
  巨头们当然也抗争,想做出超越hadoop的东西。
  
  国内的代表就是百度。
  
  在07年的时候,百度股价一路飞起,上下振奋。李彦红决定代表华夏,做一个世界级的开创性项目出来,起名“金字塔”计划。
  
  抽调了百度最精英的核心技术人员,又从外面招来了一个专家团队,带头人赫然就是现在紫微星研发中心的负责人杨振坤!
  
  这个大计划,不用java、python,甚至连c++都不用,直接用c语言写代码。
  
  可谓是雄心壮志。
  
  当时,百度从最高层到一线开发人员,都充满激情,毕竟这是一次叫板硅谷的大事,做成了足以扬我国威。
  
  项目组疯狂加班,百度大厦12层西侧的灯每天晚上都亮一宿。
  
  做了两年,项目成功了!
  
  可是,最后百度还是回归到了hadoop的阵营中。
  
  为什么?
  
  因为有一个小项目组,拿来hadoop的代码简单包装,重写了api,然后拿过去跟百度耗时两年、斥巨资打造的金字塔系统比较性能。
  
  结果,小项目组以微弱的优势取胜了!
  
  李彦红看到这个结果,顿时心灰意冷,如同被泼了一盆凉水。
  
  hadoop是开源项目,是全世界的开发者们一起去更新、促进,潜力巨大。原创的如果没有巨大优势,再加上职场政治,就只能是朝开源的方向走了……
  
  阿里云的初期,曾遇到过巨大困难,被业内深深质疑。因为最早期的时候,王建博士判断错了,也要搞一个类似hadoop的大数据系统,半抄半改,还是糊了。后来看到亚马逊云成功了,才恍然大悟,赶紧调头改变方向,这才取得了成功。