《大型分布式网站架构设计与实践 》

magic
2017-09-21 / 0 评论 / 4 阅读 / 正在检测是否收录...

1.如何实现基于HTTP协议和TCP协议的RPC调用,它们之间有何差别?
RPC信息协议由两个不同结构组成:调用信息和答复信息。
它们之间通过中间件实现,既是说它们通过使用RPC 代理作为中间件,中间件是他们之间通信的关键桥梁。 RPC 允许进程之间的通信和数据交换,可配置 RPC
代理服务器。
http协议是应用层协议,里面的http协议有能够写出好几本书。

2.常见的分布式系统存储解决方案有哪些?
阿里就有开源分布式项目,其中TFS,Tair,以及OceanBase就是典型的分布式系统存储解决方案。
现在的分布式存储系统、分布式文件系统、分布式缓存、分布式数据库的软件项目就很多。正是因为分布式系统的软件多,免费开源的都十来种,正因此才会产生出这个问题。

还有,分布式文件系统集群Ceph、FastDFS、MFS、Hadoop中的HDFS、MooseFS等等。
分布式文件系统未来发展新星Ceph,Ceph不仅仅是一个文件系统,还是一个有企业级功能的对象存储生态环境。
看到国内很火的开源项目“FastDFS”,这个FastDFS分布式文件夹系统,最关键的是开源的项目,同还是个轻量级的文件系统。
然而,比较关心分布式存储部署是否方便,存储操作是否便捷。

3.常见的Web攻击手段和防御方法?
互联网上目前最常见的DDOS攻击,Web网站代码漏洞,Shell提权,XSS攻击,CRSF攻击, SQL注入攻击,跨站点伪造请求,DNS污染。
DDOS攻击这些主流危害大、最泛滥的攻击。

4.如何进行集群的监控?
淘宝的采集工具Tsar;Twitter 开源项目Zipkin;分布式的监控系统Ganglia 。
还有开源的优秀监控软件 Nagios、Cacti、Zabbix和各种监控插件。
现成的开源监控软件、监控工具非常多可提供选择,关键的一定还是如何使用好它们。关键点是好工具,要懂得这么用,和怎么用好它。再好的工具,使用恰当才能发挥出其最大优势。

5. 说说您读完试读样章后的启发
淘宝大师级人物写的书。
样章主要介绍了常见的分布式系统存储解决方案,文中介绍mysql.hbase,redis,lucene实际应用的经验,包括MySQL的分布式扩展、HBase的API及使用场景、Redis的使用等。memcache
的安装配置例子,讲解基本功能和原理,文章中配图,列举了实践场景中生动的例子。
目前分布式系统在互联网大型网站应用中属于比较新颖的IT技术,对于开放的互联网来说,对于这样一个前沿的大型网站技术架构,这一块具有相当的挑战性。
当前互联网得到迅猛发展,大型网站已经越来越多,数据级别已经要用大数据来形容它了。那么需要面对技术瓶颈问题也迎面而来,新的需求也在跟着变化。

从试读章节可以深刻感受到作者资深的经验和思维的深度,书中以实际工作经历展开论述,对架构技术有系统论述,是一本专门论述的好书。对研究大型网的读者来说,我认为这是一本很好的书,值得推荐细读!

6. 这些大型的互联网应用是设计出来的?还是演化出来的?
大型的互联网应用确实是进化而来,经过一系列复杂的演化过程。
好的大型的互联网网站架构都是“进化”出来,没有适用一切的全能架构吧!有高性能网站架构模式或框架,但没有一成不变的高性能网站架构技术实现!
但是互联网大型网站经过这十多年的发展,总体架构大家都比较相近。现成的技术、方案各家公司都有不同的名称,可他们的核心思想是相似,底层技术百变不离其中。
假如没有大型网站的需求,不是实际生产中遇到瓶颈,急迫需要这些分布式解决方案。如果没有了这些原因,怎么会有以后的事情发生。
看看书中开篇内容,资深技术专家就有如下的阐述:
2008年,TB网随着访问量/数据量的巨增,以及开发人员的增长,原有的架构体系已经无法支撑,于是在那一年TB网将系统改造为了一个大型分布式的网站。作者目前就职于阿里集团,清晰地看到了目前TB这个大型分布式网站的架构体系,这个架构体系其实是非常多方面的技术的融合,要掌握好最重要的首先是看清全貌,但这也是最难的。本书向大家展示了一个大型分布式网站需要的技术的全貌。
互联网在不断演变,需要解决的问题也在变化中。

0

评论 (0)

取消