手机浏览器扫描二维码访问
自己必须拿出完全体来对付这帮同样有梦想的年轻人!
宁子默自信地笑笑,乘着抿一口咖啡的时间在脑子里将峰语搜索的关键技术汇集成册。
把杯子从嘴边拿开的时候,宁子默脑子里有关峰语搜索关键技术的封印,
已然打开!
“说到搜索,人们往往会简单地认为搜索只是抓取爬虫从网络上抓取的结果。但实际上,搜索并没有人们想象的那么简单。”
宁子默将杯子轻轻地放在桌上,笑着扫了三人一眼,细细地解释到:
“我们谈到大数据搜索,其核心一定是体量极大的数据量。这种体量的数据存储、索引和检索,已经不单单是数据库结构能去实现并解决的。
大数据量的数据存储和搜索一定要有对应的文件存储检索系统,它必定是一个面向大规模数据密集型应用的、可伸缩的分布式文件系统。
我们【bing】除了在搜索和爬虫上用心外,最核心的部分还是背后那套围绕在bfs(bingfilesystem)文件系统的核心技术体。这套系统的设计目标,与许多传统的分布式文件系统有很多相同之处。比如,性能、可伸缩性、可靠性以及可用性。
但bfs的还是以应用负载情况和技术环境的分析为基础着重考虑,不管现在还是将来,bfs和早期的分布式文件系统的设想都有明显的不同。所以我们重新审视了传统文件系统在设计上的折衷选择,衍生出了完全不同的设计思路。
首先,组件失效被认为是常态而不是意外。bfs需要管理成百上千存储机器,同时被相当数量的用户终端机访问。bfs组件的数量和质量导致在事实上,任何给定时间内都有可能发生某些组件无法工作,某些组件无法从它们目前的失效状态中恢复。
当我们遇到过各种各样的问题,比如应用程序bug、操作系统的bug、人为失误,甚至还有硬盘、内存、连接器、网络以及电源失效等造成的问题。所以,持续的监控、错误侦测、灾难冗余以及自动恢复的机制必须集成在gfs中。
其次,以通常的标准衡量,我们的文件非常巨大。数gb文件都可能非常普遍。每个文件通常都包含许多应用程序对象,比如web文档。
当我们未来需要处理快速增长并由数亿个对象构成的、数以tb的数据集时,采用管理数亿个kb大小的小文件的方式是非常不明智的,尽管有些文件系统支持这样的管理方式。因此,设计的假设条件和参数,比如io操作和block的尺寸都需要重新考虑。
第三,绝大部分文件的修改是采用在文件尾部追加数据,而不是覆盖原有数据的方式。对文件的随机写入操作在实际中几乎不存在。一旦写完之后,对文件的操作就只有读,而且通常是按顺序读。
大量的数据符合这些特性,比如:数据分析程序扫描的超大的数据集;正在运行的应用程序生成的连续的数据流;存档的数据;由一台机器生成、另外一台机器处理的中间数据,这些中间数据的处理可能是同时进行的、也可能是后续才处理的。
对于这种针对海量文件的访问模式,客户端对数据块缓存是没有意义的,数据的追加操作是性能优化和原子性保证的主要考量因素。
第四,应用程序和文件系统api的协同设计提高了整个系统的灵活性。比如,我们放松了对bfs一致性模型的要求,这样就减轻了文件系统对应用程序的苛刻要求,大大简化了bfs的设计。
bfs还引入了原子性的记录追加操作,从而保证多个客户端能够同时进行追加操作,不需要额外的同步操作来保证数据的一致性。”
端起咖啡又喝了一口,宁子默已经习惯了身边这四人目瞪狗呆的状态。
放下杯子,宁子默再也懒得去解释那些技术细节,但还是提点到:
“bfs一早就规划了四大核心技术体,其中涵盖了第一个部分的分布式基础设施,包含的模块有文件系统(file),分布式锁服务(chubby)和数据化序列协议(protocolbuffer)。
而第二部分是分布式大规模数据处理模块,其中包含分布式运算程序的编程框架和对应的数据查询语言。他们或许和sql和类似,但实际上它应该被称之为dsl(domain-specificlanguage)。
第三部分则是分布式数据库技术,它包含的模块就有分布式数据存储系统(bigtable)和数据库分区系统(sharding)。
最后一部分当然包含数据中心优化技术,这些技术中包括综合考虑的数据中心高温化,还有电池与服务器相应整合技术等。”
撇了撇嘴,宁子默皱着眉头说,“搜索引擎是一个全盘技术的考虑,但我仅仅只举了一个很简单的例子,并且其应用范围还只是在网页搜索结果当中,并没有提及一整个生态的整体考虑。
但我所说技术方面的内容,远比我现在讲给你们听的内容要复杂的多。每一个单项里都会包含大量工作人员相应的工作成果,确实不是短期内可以去实现的。
但好在我们【bing】团队的目标明确啊。”
“梦想还是要有的,万一实现了呢?”宁子默撇着嘴挑了挑眉毛。
这个轻挑的动作,在kaltix三人组的眼里却郑重如斯。
办公室里鸦雀无声,除了必要的眨眼,好半天都没有一个人有多余的动作。
《终于情深》 后来我们会怎样 高冷总裁不存在的恋爱 我们,只是朋友。 [综英美] 斯塔克小姐翻车了 用心感受 [重生]学霸也挂科 念于墨上那年 爱卿,龙榻爬不得 圣女的屠龙悖论[西幻] 日初月星 给你一点甜 天亮说晚安 哥哥教我 重生之写手人生 穿成了豪门真千金的对照组 沧源天青 京港蝶眠 假如爱有时差(骨科兄妹乱) 对照组女配不干了[快穿]
这是一个名叫仙魔大陆的世界。朱文婷出生自东柳城朱氏家族,机缘巧合之下救了天门宗创史人天宗老人学会了天宗十剑这门稀有功法,取得武斗大会的胜利而当上了下一任的城主,拥有享之不尽的荣华富贵,可惜这一切美好未来都被魔神殿给破坏了,魔君英不凡为获得神器而一手摧毁了东柳城四大家族,朱文婷从一个大小姐转变为孤儿,她立誓只要自己不死,就一定要亲手杀死魔君英不凡,摧毁魔神殿为自己的族人报仇雪恨。武境六道人道境玄武境地理境天平境阴阳境帝王境传说两境仙境魔境功法等级低级中级高级稀有级兵器分类普通兵器王器神器炼丹术淬体丹回魂丹破境丹化毒丹如果您喜欢完美女仙,别忘记分享给朋友...
关于席先生请接招结婚纪念日她抓到老公和小三偷情,震怒之下她也去找了牛郎一夜情!转眼间,牛郎成了云京市赫赫有名的席总裁,还想用一纸婚书与她合作。斗渣男,虐小三,这个男人分分钟把她宠上了天。结婚前不能上我床。结婚后禽兽,出尔反尔!说好的高冷霸道总裁,转眼间就成了恋妻忠犬。她敞开心扉想要与他共度余生,突然冒出来个女人说自己不过是个替代品...
关于私宠100婚闪婚总裁超霸道一朝重生,虐莲花灭渣男,她定要灭掉上一世所有踩在她头顶欺辱她的人!本以为依旧会单枪匹马斗尽仇敌,却不想遇到了人生外挂楚荣轩!看着人神共愤,多金霸气的邮轮大鳄楚大少,她果断抱大腿!只谈风月,不谈感情!可谈着谈着,他们行驶的轨道似乎就变了方向。楚少,我和那个人只是普通朋友楚少,那是我表哥楚少,我和我闺蜜不是百合楚少心理阴影太大,一脸不信!她心累的放弃解释算了算了,分道扬...
关于首辅家的锦鲤娇妻沈烟因为一场意外的车祸,穿越回古代,成了被换亲的万人嫌肥婆。亲爹不作为,后娘心肠歹毒,就连嫁的穷县令丈夫也对她避之不已!沈烟的斗志被激起了,减肥逆袭发家致富,一路锦鲤体质扶持丈夫一路高升,成了当地的贤臣。就在男人以为抱得美人归时,沈烟不痛不痒给了他和离书,从此两不相欠。看着她决绝的身影,首辅大人红了眼挽留烟烟,可不可以再给我一次机会,为夫还你一个十里红妆?...
心潮澎湃,无限幻想,迎风挥击千层浪,少年不败热血!如果您喜欢天道罚恶令,别忘记分享给朋友...
罗南刚醒来,就身处影视世界,自己是谁?做挑战任务,可以恢复记忆?身边是双人滑女伴刘菲,可他受伤了,刘菲要配给邵北笙?那怎么行!挑战邵北笙,挑战滑冰极限,快点儿恢复记忆,罗南拼了!第一个世界陪你逐风飞翔除了竞技挑战,似乎还可以挑战别的?第二个世界北京爱情故事要杨紫曦给自己唱征服?如果您喜欢影视世界去挑战,别忘记分享给朋友...