Facebook 与大数据的巨大飞跃
Facebook今天是一个世界范围的现象,已经赶上了年轻人和老年人.2004年由一群哈佛大学的学生推出,预计这样的愤怒.在短短十年的时间里,它如何管理这个巨大的飞跃?
拥有约12.3亿用户数量,Facebook绝对比其他社交媒体网站高.这个成功背后的原因是什么?这个博客是试图回答其中的一些查询.
显而易见的是,存储系统和高技术知识的存在有助于各种用户数据的支持,如管理消息,应用程序,个人信息等,而这些数据都不会停止.当网站的用户数量超过世界上的汽车数量时,网站会做什么?它如何管理这么大量的数据?
有关于大数据的相关问题?请加群640193172提及他们,我们共同讨论.
数据中心:Facebook的焦点
Facebook的数据中心分布在尖端服务器和巨大内存银行的30万平方英尺的面积上; 它的数据传播超过2300万英尺的光纤电缆.他们的系统旨在以光速运行数据,确保一旦用户登录到他的配置文件中,一切工作更快.用30兆瓦的电力,他们必须确保它们永远不会失电.仓库可存储高达300 PB的Hive数据,入场日速率为600 TB.
每台电脑都是通过热量同步而不是比一个匹配盒子来冷却的,但对于Facebook电脑来说,照片显然更大.传播到一个巨大的领域,有冷却系统和风扇,有助于平衡这些系统的温度.随着计数的增加,存储系统的卡车每天不断涌入,员工正在失去计数.
Hadoop&Cassandra:技术向导
大数据的使用已经发展,为了Facebook的存在,大数据至关重要.一个像这样大的平台,需要一些技术,使他们能够解决问题和存储大量数据.Hadoop是Facebook上采用的许多大数据技术之一,对于一天中每一分钟都在增长的公司来说,这不足够.Hadoop是一个高度可扩展的开源框架,它使用低成本服务器集群来解决问题.Cassandra使用的其他技术之一是Cassandra.
Apache Cassandra最初是在F acebook开发的, 由两位熟练的印度人Avinash Lakshman和Prashant Malik(前身为作者(亚马逊发电机))而负责其收件箱搜索功能,后者是一名技术人员.它是一个开源的分布式数据库管理系统,旨在处理许多商品服务器上的大量数据,提供高可用性,无单点故障.
Cassandra为跨多个数据中心的群集提供强大的支持.因此,Cassandra旨在运行在数百个节点的基础架构之上.某些时候有失败,但是Cassandra管理它的方式使得任何人都有可能依赖这项服务.
Facebook与其他社交媒体网站一起,避免使用MySQL,因为获得良好效果的复杂性.卡桑德拉已经超过了其余部分,并证明了其获得快速成果的能力.Facebook最初开发了Cassandra来解决引擎搜索的问题,并且在处理同时读取和写入请求的能力方面要快速可靠.Facebook是一个平台,可以立即帮助您连接到远近的人,为此,它需要一个执行和匹配品牌的系统.
本篇文章是由济南达内为您呈现,希望给您带来更多更好的文章,喜欢的朋友们可以添加微信公众号.
更多济南达内相关资讯,请扫描下方二维码