Skip to main content

Fujitsu

English | 日本語

China

本技术介绍参考了以下链接
English

2014年9月10日

实现高容错性广域SDN的分布式的控制器集群技术
实现不间断运行的大规模网络


株式会社富士通研究所(注1)(以下简称,富士通研究所)开发了以下技术。

开发背景

以OpenFlow(注2)为代表的传统SDN(Software Defined Networking),由于网络控制器采用的是集中控制型构造,若将广域网络(该网络由转送大量通信数据包的交换机构成)重新作为SDN使用时,随着用户数量的增加,控制器负载集中会导致服务不流畅。此外,当控制器自身发生故障时,管理的交换机也会出现无法控制的问题。

富士通研究所致力于研究开发分布式的控制器集群技术,该技术可将多台控制器逻辑上作为1台控制器并使其运作,可集中控制上千台规模的交换机(图1、图2)。

这一技术基于以下两种模块,用于追加控制器应用的应用控制模块,将OpenFlow控制器作为组件连接的分布式控制器模块。因此,是一种可以根据负载不同将应用、控制器组件与服务器资源一起追加的技术。

yya

图1 控制器的各种部署方式


yyb

图2 分布式的控制器集群的详细情况

课题

分布式的控制器集群与集中型控制器不同,需要多个分布式控制器对应模块以协调方式运行。因为无论哪个模块发生了故障,都需要继续进行处理,所以当一部分控制器发生负载集中或故障时,很难自动切换,造成该控制器所管理的交换机群处理延迟,以及无法继续控制等问题。

开发的技术

富士通研究所开发了通过使用分布式的控制器集群,实现能够自动分散控制负载的负载均衡技术,以及发生故障时能自动切换控制器实现不中断的恢复技术。

开发的技术有以下特点:

1. 负载均衡技术

针对分布式控制器对应模块开发了新的负载检查功能(图3)。由此,可以收集控制器组件的各个负载信息(CPU使用率,交换机数量等)(图3中的1)。协调系统可检测负载的不平衡,例如从模块的管理号码中选出一个分布式控制器对应模块作为“领导”,定期检查负载信息(图3中的2)。当“负载均衡判断逻辑”认为需要负载均衡时,会根据CPU使用率和交换机数量的策略,通过“交换机变更逻辑”选择要变更的交换机, 实现负载均衡(图3中的3)。将变更后的交换机和控制器组件的对应关系登记到协调系统上(图3中的4),按照更新后的分布式控制器对应模块信息切换交换机,进行负载均衡(图3中的5)。


yyc

图3 均衡负载技术概要

2. 不间断恢复技术

富士通研究所开发了一种新的分布式控制器对应模块的故障检查功能(图4)。被选出的分布式控制器对应模块作为“领导”,要检测控制器组件的故障(图4中的1、2),并选定新的控制器组件负责接替管理发生故障的控制器下面的交换机(图4中的3)。基于CPU使用率或交换机数量等控制器组件的负载信息,为了实现自动分散负载更新控制器或交换机对应信息(图4中的4),没有发生故障的分布式控制器对应模块通过与更新信息联动、切换管理交换机的控制器(图4中的5),以实现不间断服务。通过负载均衡技术决定替换的控制器,可防止因控制器组件的负载急剧上升造成的处理中断的问题。

另外,即使“领导”模块自身发生故障,协调系统也可检测出会话的中断,选出新的“领导”,新“领导”模块将选定新的控制器管理原“领导”下的交换机。


yyd

图4 停止状态下的恢复技术概要

效果

该技术适用于分布式的控制器集群,能应对突发的负载波动,即使控制器发生故障时也可继续运行网络服务,实现广域网的稳定和高可靠运行。

例如,传统的控制器,为了避免由于故障导致网络停止,使用热备份方式(提供主系统和待机系统)的情况下,假如有10个域,每个域各需2台,合计需要20台控制器。然而,分布式的控制器集群只需在通常使用的10台上加上1台待机系统,共计11台控制器即可,使控制器台数减少一半。

今后

对于通信运营商的网络等基础网络,该技术可实现高可靠性且稳定的网络运行,并降低部署成本和运营成本。

富士通研究所正继续推进面向分布式的控制器集群的管理控制技术的研究开发,目标2015年实现实用化。

注释

注1 株式会社富士通研究所

社长 佐相秀幸

总公司所在地 日本神奈川县川崎市

注2 OpenFlow:

一种将交换机或路由器的控制部分与数据转发部分进行分离,实现集中控制的技术。