CG树顶端节点集群的设计与实现

Pubertyly

发布日期: 2018-10-02 20:20:25 浏览量: 161
评分:
star star star star star star star star_border star_border star_border
*转载请注明来自write-bug.com

摘要

本文描述了一个CG树顶端节点集群的设计与实现,主要内容有:

  1. 详细阐述了顶端节点集群的设计方案。该方案维持集群节点间的通信,当集群内节点失效时能及时发现;负载均衡器(LB)能够将客户端的请求通过一定的调度策略转发给下面的真实服务器(RS);能够保证所有真实服务器上的数据库的一致性。

  2. 实现了一个顶端节点集群的系统原型,技术分析和实验结果表明,该集群系统具有稳定性和高可用性。

  1. 搭建了一个测试系统,对客户端的请求进行分析处理,返回客户端需要的信息,并测试顶端节点集群的性能。根据测试结果分析顶端节点和顶端节点集群之间的性能差异,证明设计方案的有效性。

[关键词] 集群 CG树 LVS 顶端节点集群

Abstract

This paper describes the design and implementation for the top node cluster in CG-Tree. The major contents include:

  1. A detail design solution for the top node cluster is described. It can maintain the communications among cluster nodes and detect node faults whenever cluster fails. The load balancer (LB) can forward the client’s request to the real server (RS) by selected strategy. The databases on all real servers are kept consistency.
  2. A prototype of the top nodecluster is implemented. The technical analysis and experimental result showthat the cluster is with stability and highly availability.
  3. A test system is built to analyze and process the request from clients, return the required information to clients, and test the performance of the top node cluster. Accorded to the test results, the difference of the performance between the top node and the top node cluster is analyzed to show the effectiveness of the design solution.

[Keywords] Cluster, CG-Tree, LVS, Top Node Cluster

第一章 引言

1.1 研究背景

1.1.1 集群技术

Internet 的飞速发展给网络带宽和服务器带来巨大的挑战。从网络技术的发展来看,网络带宽的增长远高于处理器速度和内存访问速度的增长。热门网站引发前所未有的访问流量,很多网络服务因为访问次数爆炸式地增长而不堪重负。一些新兴的网络技术如视频点播,动态网页,CGI 等带来更大的网络带宽需求。这时单一的计算机系统,如单处理器或者SMP 系统,往往因为巨大的网络负载而不堪重负,其存在着诸多的问题,主要表现在:扩展能力差并且扩展的代价昂贵;升级导致的服务中断会带来巨大的商业损失,并造成原有计算资源的浪费;单点故障发生的概率较高导致无法提供持续的可靠服务。解决网络服务的可伸缩性和可靠性已是非常紧迫的问题。

通过高性能网络或局域网互联的服务器集群[1]正成为实现高可伸缩的、高可用网络服务的有效结构。这种松耦合结构的服务器集群系统有下列优点:

  • 提高性能

    一些计算密集型应用,如:天气预报、核试验模拟等,需要计算机有很强的运算处理能力。这时,一般都使用计算机集群技术,集中几十台甚至上百台计算机的运算能力来满足要求。提高处理性能一直是集群技术研究的一个重要目标之一。随着网络的普及和计算机硬件性能的不断提高,集群系统的应用领域越来越广,目前集群系统主要应用于Web服务、Cache服务、媒体服务、科学计算以及数据库应用等领域。

  • 降低成本

    组成集群系统的 PC 服务器或RISC 服务器和标准网络设备因为大规模生产降低成本,价格低,具有很高的性能价格比。若整体性能随着节点数的增长而接近线性增加,该系统的性能价格比接近于PC 服务器。所以,这种松耦合结构比紧耦合结构的多处理器系统具有更好的性能价格比。

  • 提高可扩展性

    用户若想扩展系统能力,不得不购买更高性能的服务器,才能获得额外所需的CPU和存储器。如果采用集群技术,则只需要将新的服务器加入集群中即可,对于客户来看,服务无论从连续性还是性能上都几乎没有变化,好像系统在不知不觉中完成了升级。

  • 增强可靠性

    集群技术使系统在故障发生时仍可以继续工作,将系统停运时间减到最小。集群系统在提高系统的可靠性的同时,也大大减小了故障损失。

目前集群系统因其诸多的优点,已被广泛应用于 Web 服务,Cache 服务,媒体服务,科学计算及数据库等领域。

1.1.2 CG树简介

对于视频点播这种大流量的服务需求,服务器这一端的带宽将在很大程度上影响媒体服务的质量,如果将服务器节点限制在单个局域网内,媒体集群将受到网关流量的制约而提供很有限的服务。

CG树[2,3]是适用于分布式集群的一种模型,CG树将集群的节点分级分层,组织成以前端调度节点为根节点,服务器池的所有节点分组管理的树形结构。该模型下前端负载均衡器不必跟服务器池的所有节点通信,有效减少了前端节点的负载。集群节点采用分级分层的结构,能有效减轻集群前端负载均衡器的负担,并能有效地减少跨网络集群节点间的通信开销,具有较高的实用价值,是跨网络集群的一个较好的解决方案。

如图1-1是一棵CG 树的结构图。

在以往的CG树的实现中,顶端节点(如图1-2)需要负责处理客户端的请求,数据库的查询,CG森林的维护,资源的调度等任务,导致顶端节点的压力非常大,成为了整个系统的瓶颈。其中,数据库的查询操作占据了节点的绝大多数的资源。对于此,本文对顶端节点的性能做出过测试,在千兆局域网内选择了1台计算机作为顶端节点,其详细配置为:

  • 操作系统:Ubuntu10.10
  • Linux内核版本:Linux 2.6.35
  • CPU:Intel® Core™ 2 Quad CPU Q8400 2.66GHz(四核)
  • 内存:2GB
  • 数据库:MySQLServer 5.1

然后客户端不断地发送请求,由客户端记录发送请求和收到响应的数量。实验结果表明,顶端节点在满负荷的条件下,每秒钟只能执行数据库查询一万次左右,即每秒钟可以处理客户端的一万次左右的资源请求。如果系统面向全世界服务,其性能显然无法满足客户的需求,因此,顶端节点成为了整个系统的瓶颈。

1.1.3 系统的提出

为了解决这一问题,本文提出了一种将顶端节点修改为顶端节点集群(如图1-3)的做法。这种做法的思路是,用分布的做法让多台服务器组成顶端节点集群来分担原来单个顶端节点的工作,从而提高系统的整体性能。顶端节点集群由两层计算机组成,第一层仅仅负责请求的转发,第二层由多台计算机组成,作为真实服务器,负责请求的处理,其数量取决于整个CG树的规模。由于顶端节点仅仅在选择真实服务器的时候需要与客户端通讯,真正提供服务时是由真实服务器与客户端直接进行通讯的,因此,基于CG树结构的服务器在管理规模上几乎没有限制。

1.2 研究工作

本文设计与实现了一种CG树顶端节点集群的设计方案,主要包括以下内容:

  • 集群整体架构的设计:设计了一种可用的集群方案,引入了心跳机制,通过心跳的传递使负载均衡器了解每个节点的运行状态,同时通过TCP消息的传递,保证了各个节点数据库的一致性。
  • 调度策略的设计:实现了轮转调度、源地址哈希调度、加权轮转调度三种种可用的调度策略。
  • 集群的实现:使用UNIX/Linux下Socket编程技术以及多线程技术,实现了本文设计的集群系统,包括负载均衡器和真实服务器两大模块的实现以及数据库连接池的实现。
  • 性能测试:模拟了一个基于CG树的视频点播系统,在系统正常工作的条件下,测试了网络的丢包率,测试了顶端节点和顶端节点集群的性能,分析并比较了顶端节点集群与以往顶端节点之间的性能差异,并且对数据库的一致性进行了简单的测试。
  • 最后,本文对顶端节点集群的设计方案和测试结果给出了结论,提出了系统存在的缺点,对未来的研究方向做出了展望。

1.3 论文结构

本论文共有七章。

  • 第一章为引言。本章首先分析了以往CG树所存在的问题,从而引出了将CG树的顶端节点改为顶端节点集群的想法。
  • 第二章为相关技术介绍。主要介绍了本文中用到的相关技术。
  • 第三章为系统设计。本章主要介绍了CG树顶端节点集群的设计方案。
  • 第四章为系统实现。本章主要介绍了CG树顶端节点集群的具体实现。
  • 第五章为实验部分。在校园网的实验环境下进行了相关测试,并对实验结果进行了分析。
  • 第六章为总结与展望。提出了本文研究工作的结论和不足,并对课题给予展望。
  • 最后是参考文献与致谢。

第二章 相关实现技术简介

2.1 Socket通信简介

所谓socket[4]通常也称作“套接字”,应用程序通常通过“套接字”向网络发出请求或者应答网络请求。有两种常用的Socket类型:流式Socket(SOCK_STREAM)和数据报式Socket(SOCK_DGRAM)。流式Socket是一种面向连接的Socket,针对于面向连接的TCP服务应用;数据报式Socket是一种无连接的Socket,对应于无连接的UDP服务应用。

  • 用户数据报协议(UDP)

    UDP是一个简单的传输层协议,应用进程往一个UDP套接字写入一个消息,该消息随后被封装到一个UDP数据报,该UDP数据报进而又被封装到一个IP数据报,然后发送到目的地。UDP不能保证UDP数据报会到达其最终目的地,不保证各个数据报的先后顺序跨网络后保持不变,也不保证每个数据报只到达一次。

  • 传输控制协议(TCP)

    TCP不同于UDP,它提供客户与服务器之间的连接,TCP客户首先与服务器建立一个连接,然后通过该连接与服务器交换数据,然后终止这个连接。TCP提供了可靠的数据传输和流量控制,但是其开销要大于UDP。

在本文的设计方案中,心跳信息的传递使用UDP协议,数据库更新信息和节点之间的其他信息的传递使用TCP协议。

2.2 多线程技术简介

由于本文涉及的系统涉及到多个功能模块的并发操作,对于并发操作主要有两种方式实现:多进程结构和多线程结构。在多进程结构中,程序通过创建子进程来实现并发操作,如此可以充分发挥多核CPU的性能。然而创建子进程的开销是非常昂贵的,每创建一个子进程,需要把父进程的内存映像复制到子进程,且进程间的通信非常复杂。而线程则可以解决上述问题,线程的创建和切换的开销要比进程小得多。同一进程内的所有线程可以共享相同的全局内存,使得线程之间易于共享信息,随之而来的同步问题则可以通过互斥量来解决。

为了提高系统运行的效率,本系统将采用多线程技术实现任务的并发操作。本系统使用的是POSIX线程[5],也称为Pthread。

2.3 MySQL数据库简介

MySQL[6]是最流行的开放源码关联数据库管理系统。关联数据库将数据保存在不同的表中,而不是将所有数据放在一个大的仓库内。这样就增加了速度并提高了灵活性。MySQL的SQL指得是“结构化查询语言”。SQL是用于访问数据库的最常用标准化语言,它是由ANSI/ISO SQL标准定义的。MySQL数据库服务器具有快速、可靠和易于使用的特点。

第三章 系统设计

3.1 整体结构

3.1.1 整体结构的设计

以往的CG树由一个顶端节点负责控制一个CG森林,顶端节点需要负责整个集群系统的维护、客户端请求的处理以及资源的调度等等,这样使得顶端节点的负担很重,成为整个系统的瓶颈,为了解决这一问题,本文提出了将顶端节点改为顶端节点集群的办法,其结构图如图3-1所示。

顶端节点集群为两层结构,第一层是一台负载均衡器,第二层由若干台真实服务器组成。负载均衡器负责接收第二层节点的心跳信息,保存它们的相关信息。第二层的每台服务器都维持一个同样内容的数据库,保存CG树叶子节点上相关资源的信息。由负载均衡器接受客户端的请求,然后按照一定的转发策略转发给第二层的真实服务器,真实服务器通过数据库查询操作得到保存客户端请求资源的CG树节点,将查询结果发送给客户端。

3.1.2 与LVS的比较

LVS[7]是基于IP层负载均衡技术的典型代表。用户通过虚拟IP地址(Virtual IP Address)访问服务时,访问请求的报文会到达负载均衡器,由它进行负载均衡调度,从一组真实服务器选出一个,将报文的目标地址Virtual IP Address改写成选定服务器的地址,报文的目标端口改写成选定服务器的相应端口,最后将报文发送给选定的服务器。真实服务器的回应报文经过负载均衡器时,将报文的源地址和源端口改为Virtual IP Address和相应的端口,再把报文发给用户;或者真实服务器直接将回应报文的源地址和源端口改为Virtual IP Address和相应的端口,发给用户。

以LVS为代表的典型集群在结构上一般分为三层:负载调度器(load balancer),它作为整个集群系统对外的前端,负责将客户的请求发送到后台的一组服务器上执行,客户不需要知道真实服务器的IP地址;服务器池(server pool),位于后台的一组真正提供应用程序服务的服务器,他们之间通过传递心跳信息来维持可用的服务器列表;共享存储(shared storage),它为服务器提供一个共享的存储区,这样很容易使得服务器池拥有相同的内容,提供相同的服务。

图2-1展示了一个LVS系统的基本结构。

LVS集群由负载调度器、服务器池和共享存储三大部分组成,本文的设计方案借鉴了LVS,同样有一个负载调度器,一组真实服务器。因为CG树顶端节点处理客户请求仅仅需要查询数据库,因此,不需要设置共享存储。

对于MySQL分布式数据库,LVS的一般做法是使用高冗余的同步集群(MySQL Cluster)或者相对简单的异步集群(MySQL replication)来实现。同步集群的特点是配置和管理方便,不会丢失数据,但是其需要较多的内存且速度一般。异步集群的特点是使用主从(mater/slave)模式,速度较快,但是往往会导致主数据库的压力过大且可能会丢失数据。无论哪种数据库集群,其都会产生较大的数据冗余。

在本系统的应用中,客户端的请求是查询所需资源的地址,而数据库的更新操作只有在CG树叶子节点上的资源更新时才会发生。因此,本文根据这个特点设计了一种简单的数据库的维护方式,即每台真实服务器保留一个数据库的完整副本,从而提高数据库的查询效率。

3.2 心跳的设计

心跳机制[8]是高可用集群的重要技术之一。心跳周期性的检测集群中节点机器的工作状态,当节点机器的工作状态发生改变时,能够通知集群软件的其他部件。

本集群将采用心跳机制来维持系统的高可用性,由第二层的真实服务器周期性地向第一级的负载均衡器发送心跳信息,以告知负载均衡器其最新的状态。负载均衡器接收到心跳信息后,更新节点的状态信息,记录节点的心跳时间,同时设置一个心跳超时时间,其一般为心跳周期的2到3倍,若负载均衡器在超时时间内没有接收到真实服务器的心跳信息,则认为该节点发生故障,将节点状态设为故障。在实际应用上,可在心跳信息中捎带其他信息,如节点的工作负载等。

因为心跳的发送频繁,为了减少网络通信的开销,本文使用UDP协议来进行心跳的传递。

3.3 数据库一致性的保持

因为本文的设计方案中,集群中第二层的所有节点使用内容相同的数据库,因此保持数据库的一致性就是我们要关心的问题之一。

在本文的设计方案中,负载均衡器和真实服务器都要创建一个用于数据库更新的线程,CG树节点向负载均衡器发出数据库更新消息,当负载均衡器接受到数据库更新消息后,通过TCP将更新消息转发给每一台真实服务器,由真实服务器执行数据库的更新操作,从而保证每台服务器数据库的一致性。

3.4 调度策略的设计

本文为了提供整个集群的可用性,共实现了三种请求的转发调度策略[9],分别是:

3.4.1 轮转调度

轮转调度是最简单的调度策略,当负载均衡器接收到客户端的请求时,将请求轮询式的转发给第二层的节点。使用这种调度策略,负载均衡器的负担最小,同时,当客户端请求资源少而频繁时,此调度策略具有非常高的效率。但是,当请求服务时间变化比较大时,轮转调度算法容易导致服务器间的负载不平衡。

  1. // 轮转调度算法
  2. // 假设有一组服务器S = {S0, S1, …, Sn-1},一个指示变量i表示上一次选择的服务器,W(Si)表示服务器Si的权值,大于0表示服务器可用。变量i被初始化为n-1,其中n > 0
  3. j = i;
  4. do {
  5. j = (j + 1) mod n;
  6. if (W(Sj) > 0) {
  7. i = j;
  8. return Si;
  9. }
  10. } while (j != i);
  11. return NULL;

3.4.2 源地址哈希调度

通过源调度哈希转发即通过哈希函数将客户端的IP映射到唯一的一台服务器上。该调度算法可以使请求得到较均匀的分布。

  1. // 源地址哈希调度算法
  2. // 假设有一组服务器S = {S0, S1, …, Sn-1},W(Si)表示服务器Si的优先级,0表示服务器不可用。ServerNode[]是一个有256个桶(大小可调整)的Hash表,变量i表示上一次选择的服务器,变量ip表示客户端IP,getNext表示使用轮转获取下一个可用节点。算法的初始化是将所有服务器顺序、循环地放置到ServerNode表中
  3. j = hash(ip);
  4. if (W(Sj) == 0) {
  5. j = getNext(i);
  6. }
  7. Return Sj;
  8. hash(unsigned int ip) {
  9. return (ip * 2654435761) & HASH_TAB_MASK;
  10. }
  11. // 其中,2654435761UL是2到2^32 (4294967296)间接近于黄金分割的素数。
  12. // 2654435761 / 4294967296 = 0.618033987

3.4.3 加权轮转调度

为了解决集群第二层服务器性能可能存在差异的问题,可以使用加权轮转调度。其具体实现就是根据每台服务器的性能为每个节点设置一个优先级,性能越好,优先级越高。当服务器向负载均衡器注册时,同时告知优先级信息。在客户端发来请求时,负载均衡器根据优先级转发给第二层的真实服务器。

  1. // 加权轮转调度算法
  2. // 假设有一组服务器S = {S0, S1, …, Sn-1},W(Si)表示服务器Si的优先级,变量i表示上一次选择的服务器,变量cw表示当前调度的权值,max(S)表示集合S中所有服务器的最大权值,gcd(S)表示集合S中所有服务器优先级的最大公约数。变量i初始化为-1,cw初始化为零。
  3. while (true) {
  4. i = (i + 1) mod n;
  5. if (i == 0) {
  6. cw = cw - gcd(S);
  7. if (cw <= 0) {
  8. cw = max(S);
  9. if (cw == 0)
  10. return NULL;
  11. }
  12. }
  13. if (W(Si) >= cw)
  14. return Si;
  15. }

例如,有三个服务器A、B和C分别有权值4、3和2,则在一个调度周期内调度序列为AABABCABC。当第二层服务器性能差异较大时,相对于轮询转发,此转发策略可以提高每台服务器的使用效率。

第四章 系统实现

4.1 LB模块的实现

LB模块运行于集群第一层的负载均衡器上,负责转发客户端的请求、维持集群的运作、转发数据库更新消息等。

4.1.1 LB模块的主要数据结构

LB模块的主要数据结构为:

  1. class TopNode{
  2. /**< 存放节点信息的容器 */
  3. vector<Node *> nodeVector;
  4. /**< 转发请求时,下一个节点的序号 */
  5. vector<Node *>::size_type m_nextNode;
  6. /**< m_nextNode的互斥锁 */
  7. pthread_mutex_t m_nextNodeLock;
  8. /**< property的互斥锁 */
  9. pthread_mutex_t m_propertyLock;
  10. /**< threadNum的互斥锁 */
  11. pthread_mutex_t m_threadNumLock;
  12. /**< 数据库更新的互斥锁 */
  13. pthread_mutex_t m_dbUpdateLock;
  14. /**< 接收心跳的端口 */
  15. int m_heartbeatPort;
  16. /**< 接收消息的端口 */
  17. int m_messagePort;
  18. /**< 接受数据库更新消息的端口 */
  19. int m_dbPort;
  20. /**< 对外提供服务的端口 */
  21. int m_servicePort;
  22. /**< 客户端请求转发策略 1:轮转调度 2: 源地址哈希转发 3:加权轮转调度 */
  23. int m_policy;
  24. /**< 提供服务的套接字 */
  25. int m_sockfd;
  26. /**< 接受请求计数 */
  27. int m_count;
  28. /**< 二层服务器的数量 */
  29. int m_rsNum;
  30. /**< 数据库连接池 */
  31. ConnPool *m_pool;
  32. };
  33. /** @brief the arg of the function thread_handleRequest */
  34. struct requestArgs{
  35. /**< 指向TopNode */
  36. TopNode *topNode;
  37. /**< 客户端的地址结构*/
  38. struct sockaddr_in cliaddr;
  39. /**< 客户端的socket套接字*/
  40. int connfd;
  41. /**< 客户端的请求内容*/
  42. string *request;
  43. };
  44. class Node
  45. {
  46. /**< store node's priority information */
  47. s_propertyMesg m_sProMesg;
  48. /**< 数据库更新的套接字 */
  49. int m_sockdbfd;
  50. /**< 节点ID */
  51. string ID;
  52. /**< 节点状态 */
  53. int status;
  54. /**< 节点接收请求的端口 */
  55. int m_servicePort;
  56. /**< 节点上次发出心跳的时间 */
  57. time_t heartBeatTime;
  58. /**< 节点接收请求的地址结构 */
  59. struct sockaddr_in m_serviceAddr;
  60. /**< 节点状态的互斥锁 */
  61. pthread_mutex_t statusLock;
  62. /**< 节点心跳时间的互斥锁 */
  63. pthread_mutex_t heatBeatTimeLock;
  64. };

4.1.2 LB模块的接口

RS模块提供的接口为:

  1. class TopNode{
  2. /**< 初始化 */
  3. void init();
  4. /**< 轮询获得下个可用节点 */
  5. Node *getNextNode();
  6. /**< 读取配置文件 */
  7. void readConf(char *);
  8. /**< 对外提供服务 */
  9. void *serve(void *arg);
  10. /**< 接收心跳 */
  11. void *receiveheartbeat(void *arg);
  12. /**< 接收消息 */
  13. void *receiveMessage(void *arg);
  14. /**< 检查各字节点状态 */
  15. void *changeStatus(void *arg);
  16. /**< 对请求进行处理 */
  17. void *handleRequest(int, const struct sockaddr_in *, string *);
  18. /**< 对消息进行处理 */
  19. void *handleMesg(int, const struct sockaddr_in *);
  20. /**< 通过IP获得下个可用节点 */
  21. Node *getNextNodeByIP(uint32_t);
  22. /**< 通过负载获得下个可用节点*/
  23. Node *getNextNodeByLoad();
  24. /**< 通过优先级获得下个可用节点*/
  25. Node *getNextNodeByProperty();
  26. /**< 处理数据库更新消息*/
  27. void *handledbUpdate(int);
  28. /**< 接受数据库更新消息*/
  29. void *dbUpdate(void *arg);
  30. };
  31. class Node
  32. {
  33. /**< 连接服务器,返回套接字 */
  34. int connectServer();
  35. /**< 关闭套接字 */
  36. void closeServer(int);
  37. /**< 向服务器发送消息 */
  38. void sendtoServer(int, char *, size_t);
  39. };

4.1.3 LB的启动流程

  • 读取配置文件。从配置文件中读取服务端口等相关信息,同时读取数据库的相关配置。
  • 初始化数据。初始化程序运行所需要的数据,包括网络地址结构、数据库连接池等。
  • 创建提供服务的线程。该线程用于处理客户端发过来的请求,并将请求的内容转发给第二层的真实服务器。
  • 创建接受数据库更新消息的线程。该线程用于处理CG树发送过来的数据库更新消息,并将消息转发给每一台服务器。
  • 创建接受消息的线程。该线程用于接受所有节点发送过来的消息,并对消息进行处理。
  • 创建控制线程。该线程用于控制整个程序的运行,包括日志更新,节点状态的检测等功能。
  • 创建接受心跳的线程。该线程接受真实服务器发送的心跳信息,并记录真实服务器的状态。

4.2 RS模块的实现

RS模块运行于集群第二层的真实服务器上,负责处理客户端的请求,并把处理结果发送给客户端。

4.2.1 RS模块的主要数据结构

RS模块的数据结构为:

  1. class RealServer{
  2. /**< 负载均衡服务器的地址 */
  3. char m_lbIP[20];
  4. /**< 负载均衡服务器的接收心跳的端口 */
  5. int m_lbHbPort;
  6. /**< 负载均衡服务器的接收消息的端口 */
  7. int m_lbMessagePort;
  8. /**< 节点ID */
  9. string m_ID;
  10. /**< 提供服务的端口 */
  11. int m_servicePort;
  12. /**< 接收数据库更新的端口 */
  13. int m_dbPort;
  14. /**< 数据库连接池 */
  15. int m_property;
  16. /**< 数据库连接池 */
  17. ConnPool *m_pool;
  18. /**< 处理请求数 */
  19. int m_connNum;
  20. /**< 处理数据库更新次数 */
  21. int m_dbNum;
  22. /**< 提供服务的套接字 */
  23. int m_sockfd;
  24. /**< 日志文件 */
  25. FILE *m_log;
  26. };
  27. /**< 用于创建线程时传递参数 */
  28. struct requestArgs{
  29. /**< 指向RealServer */
  30. RealServer *realServer;
  31. /**< 客户端的地址结构*/
  32. struct sockaddr_in cliaddr;
  33. /**< 客户端的socket套接字*/
  34. int connfd;
  35. /**< 客户端的请求内容*/
  36. string *request;
  37. };

4.2.2 RS模块的接口

RS模块提供的接口为:

  1. /**< 发送心跳 */
  2. void *heartbeat(void *arg);
  3. /**< 向LB注册 */
  4. int registerToTopNode();
  5. /**< 初始化服务器 */
  6. void init();
  7. /**< 对外提供服务 */
  8. void *serve();
  9. /**< 处理客户端请求 */
  10. void *handleRequest(int, const struct sockaddr_in *, string *);
  11. /**< 读取配置文件 */
  12. void readConf(char *);
  13. /**< 数据库更新 */
  14. void *dbUpdate(void *);

4.2.3 RS的启动流程

  • 读取配置文件。从配置文件中读取负载均衡器的IP和端口的相关信息,同时读取数据库的相关配置。
  • 初始化数据。初始化程序运行所需要的数据,包括网络地址结构、数据库连接池等。
  • 创建提供服务的线程。该线程用于处理负载均衡器转发过来的客户端请求,并将处理结果发送给客户端。
  • 创建接受数据库更新消息的线程。该线程用于处理负载均衡器发送过来的数据库更新消息,对数据库进行更新。
  • 向负载均衡器注册。向负载均衡器发送注册消息,告知负载均衡器自己的服务端口、优先级等信息。
  • 创建发送心跳信息的线程。该线程按照一定的周期向第一层的负载均衡器发送心跳信息。

4.3 数据库连接池的实现

数据库连接池负责分配、管理和释放数据库连接,它允许应用程序重复使用一个现有的数据库连接,而不是再重新建立一个。在高并发的条件下,数据库连接池可以明显提高数据库操作的效率。因此,为了提高效率,本系统实现了一个简单的数据库连接池。

4.3.1 数据库连接池的数据结构

数据库连接池的数据结构为:

  1. /** @brief 存放每个连接的地址和状态*/
  2. typedef struct _sConStatus
  3. {
  4. /**< 数据库连接地址 */
  5. MYSQL *connAddr;
  6. /**< 数据库连接状态 0:空闲 1:使用中*/
  7. int status;
  8. }sConStatus;
  9. class connPool {
  10. /**< 数据库地址 */
  11. string m_strHost;
  12. /**< 数据库用户名 */
  13. string m_strUser;
  14. /**< 密码 */
  15. string m_strPwd;
  16. /**< 数据库名 */
  17. string m_strDbName;
  18. /**< 数据库服务器端口 */
  19. int m_intMysqlPort;
  20. /**< 最大连接数 */
  21. int m_intConnNum;
  22. /**< 存放连接的容器 */
  23. vector<sConStatus *> m_vectorConn;
  24. /**< 从连接的地址,快速找到索引 */
  25. map<sConStatus *, int> m_mapVI;
  26. /**< 从连接快速找到状态 */
  27. map<MYSQL *, sConStatus *> m_mapMysqlScs;
  28. /**< 互斥锁 */
  29. pthread_mutex_t m_mutexScs;
  30. };

4.3.2 数据库连接池的接口

数据库连接池对外提供的接口为:

  1. /**< 初始化数据库连接池 */
  2. int init(char *strHost, char *strUser, char *strPwd, char *strDbName, int intMysqlPort, int intConnNum);
  3. /**< 创建一个数据库连接 */
  4. MYSQL *createOneConn();
  5. /**< 从连接池取一个连接 */
  6. MYSQL *getOneConn();
  7. /**< 将连接放回连接池。以便其他人用*/
  8. void retOneConn(MYSQL *pMysql);

第五章 实验及其结果分析

5.1 实验环境

在千兆局域网内选择了6台计算机,其详细配置为:

  • 操作系统:Ubuntu10.10
  • Linux内核版本:Linux 2.6.35
  • CPU:Intel® Core™ 2 Quad CPU Q8400 2.66GHz(四核)
  • 内存:2GB
  • 数据库:MySQLServer 5.1

5.2 实验测试与分析

5.2.1 丢包率测试

测试方法:由三台计算机作为客户端,不断的发送UDP请求并记录发出的请求次数,服务器记录收到的请求次数。

UDP数据报格式:

测试结果:当发送速率在40万次/秒、50万次/秒、60万次/秒、65万次/秒的条件下,服务器收到包的成功率分别为100%、99.89%、93.19%、84.12%。

发送速率(万/秒) 接受成功率
40 100%
50 99.89%
60 93.19%
65 84.12%

结果分析:在丢包率允许的范围内,服务器每秒钟最大可以接受50万次左右的请求,未来整个系统的搭建应该考虑网络的上限。

5.2.2 顶端节点性能测试

测试方法:选择一台计算机作为CG树的顶端节点,同时建立一个数据库,其规模为200万条记录,记录资源的相关信息。客户端不断的发送请求,每次请求1到10个资源,服务器负责查询数据库,将保存资源的CG树节点IP告知客户端。客户端记录收到的响应数,服务器端记录处理的请求数以及数据库查询操作的次数。

测试结果:在满负荷的条件下,服务器平均每秒钟处理客户端请求1790次,数据库查询操作9836次。

图5-1记录了顶端节点的CPU、内存以及网络使用等负载情况。

结果分析:从图5-1中可以看出,CPU的使用率已经达到了90%以上,而每秒钟数据库的查询操作只有不到一万次,整个系统的性能会收到严重的制约。

5.2.3 顶端节点集群性能测试

测试方法:类似于上小节的测试方法,将顶端节点改为顶端节点集群,一台计算机作为负载均衡器,分别选择2、3、4台计算机作为真实服务器,进行同样的测试。

测试结果:当真实服务器的数量分别为2、3、4台时,整个集群平均每秒钟处理的请求数分别为3746次、5346次、7670次,平均每秒钟数据库查询次数分别为20600次、29405次、42190次。

满负荷运行时,真实服务器的负载情况如图5-2所示。

当挂载四台真实服务器时,整个集群最大负荷条件下,负载均衡器的负载情况如图5-3所示。

结果分析:将顶端节点改为顶端节点集群后,整个系统的处理能力大大加强。表5-1给出了性能测试的统计结果。

真实服务器数量 客户端请求数(次/秒) 数据库查询次数(次/秒) 性能
0(即顶端节点) 1790 9836 1
2 3746 20600 2.09
3 5346 29405 2.99
4 7670 42190 4.28

根据表中数据可以看出,整个系统的性能几乎是和真实服务器的数量成正比的。

另外,由图5-3所示,因为负载均衡器仅仅负责转发,所以在真实服务器满负荷的条件下,负载均衡器的CPU使用率只有15%左右,在网络条件允许的情况下完全可以挂载更多的服务器,从而继续增强整个系统的处理能力。

5.2.4 数据库一致性测试

测试方法:使用五台计算机组成顶端节点集群,由另外一台计算机向集群发出插入、更新、删除记录的消息,由每台真实服务器统计执行操作的次数,并人工检查几个数据库是否保持了一致性。

测试结果

  • 首先测试数据库插入,每次插入一条数据,整个集群的插入效率是每秒钟插入18500条记录。
  • 然后测试更新语句的执行,每次更新一条记录,整个集群的更新效率是每秒钟更新16000条记录。

  • 最后测试删除语句的执行,每次删除一条记录,整个集群的删除效率是每秒钟删除15000条记录。(以上的测试数据会随着数据库的规模改变以及查询条件的改变而有所波动)

  • 最后检查所有数据库的内容,可以保证所有数据库内容一致。

结果分析

由于每台服务器上都有一个数据库,所以数据库更新时,所有的真实服务器都需要进行更新,真实服务器的增加不会使整个集群的效率增加,反而会增加网络的负担。但是由于CG树数据库更新操作较少,大部分的数据库操作都是查询操作,因此数据库一致性保持上所损失的性能是可以接受的。

5.2.5 数据库更新与查询综合测试

  • 测试方法:使用五台计算机组成顶端节点集群,由另外的计算机分别发出客户端请求和数据库更新消息,统计满负荷下集群处理客户请求的数量。

  • 测试结果:当以每秒钟1000次左右的速率发送数据库更新消息时,整个集群每秒钟可以处理客户请求7600次左右,数据库查询42000次左右。

  • 结果分析:当数据库更新操作数量有限时,对整个集群客户端请求处理能力影响不大。考虑到CG树节点更新频率不高,因此本文的集群方案是可行的。

第六章 总结与展望

本章对本文的工作做了一个全面的总结,并指出了不足之处和下一步的研究内容。

6.1 工作总结

  • 本文首先介绍了一种适用于分布式集群的模型——CG树,并且分析了CG树顶端节点存在的问题,然后引出了将顶端节点改为顶端节点集群的想法。

  • 然后本文介绍了一种顶端节点集群的设计方案,包括心跳设计、数据库一致性的保持以及调度策略等内容。

  • 随后,本文给出了顶端节点集群的详细设计,并利用socket编程以及多线程技术实现了顶端节点集群。

  • 最后,本文利用顶端节点集群搭建了一个简单服务器,并对其性能进行了测试,并与以往的顶端节点做出了比较。实验结果表明,顶端节点集群处理客户端请求的能力明显提高,具有一定的可行性。

6.2 课题展望

本文的实现方案中,第二层的所有服务器都使用相同的数据库,有较大的数据冗余,同时增加了数据库同步的开销,如果数据库的规模达到一定的程度,可以考虑将第二层的服务器分组,从而进步一减轻每台服务器的负担。

另外,本文的系统建立于数据库更新操作不频繁的基础上,如果要应用于数据库更新频繁的平台,数据库的更新策略需要修改。

本文的实现只针对Linux操作系统,在系统的实现中大量用到了Linux系统相关的API,今后如果有意把系统用在面向跨平台应用上,这些部分都需要进行扩充和修改。

参考文献

[1] William Stallings. 操作系统——精髓与设计原理(第五版)[M],北京:电子工业出版社,2006.

[2] 刘维峰. 分布式媒体集群的设计与实现[D],厦门:厦门大学,2005.

[3] 吴国才. 基于CG树的分布式服务器集群的设计与实现[D].,厦门:厦门大学,2008.

[4] W.Richard Stevens,UNIX网络编程卷一:套接字联网API(第三版)[M],北京:人民邮电出版社,2010.

[5] W.Richard Stevens,UNIX环境高级编程(第二版)[M],尤晋元等译,北京:人名邮电出版社,2006.

[6] MySQL官方网站,http://www.mysql.com/.

[7] 章文嵩. LVS项目介绍[Z],http://www.linuxvirtualserver.org/zh/lvs1.html,2002.

[8] 李大夜. 基于Linux的集群和心跳设计[D],哈尔滨:哈尔滨工业大学,2006.

[9] 章文嵩. LVS集群的负载调度[Z],http://www.linuxvirtualserver.org/zh/lvs4.html,2002.

致谢语

大学本科生活即将结束,回首总结这四年的求学生涯,许多老师、同学和朋友给予了我真诚、无私的指导和帮助,在此我要表示我最真挚的感激和谢意。

首先,我要衷心感谢指导我完成毕业设计的老师。老师对我们认真负责,严格要求,从课题确定到最后论文的定稿,为我们倾注了许多的心血与汗水。在毕业设计期间,老师每周都抽出时间与我们讨论,了解我们毕设的进展,并提出了许多宝贵的建议和意见。正是由于老师的严格要求和悉心指导,本文才得以顺利完成。

其次,我要感谢在这四年里教导我的所有老师们,是你们的辛苦付出让我在计算机学科道路上不断成长,不断成熟。

感谢实验室里的几位学长,在毕业设计中给了我很大的支持。

最后,特别感谢我的父母和家人,一直以来你们给予了我最大的关爱和帮助。在这二十年的学习生活中,正是因为有了你们作为我的坚强后盾,我才能在人生道路上一往无前,也正是有了你们,在我遇到挫折的时候,你们给了我避风的港湾。

上传的附件 cloud_download 毕业设计-文档和代码.7z ( 920.85kb, 0次下载 )
error_outline 下载需要15点积分

发送私信

走在一起是缘分,一起在走是幸福

18
文章数
20
评论数
最近文章
eject