可识别虚拟桌面系统性能退化原因的自动分析技术

本技术介绍参考了以下链接
English

2018年01月25日

可识别虚拟桌面系统性能退化原因的自动分析技术

株式会社富士通研究所(注1)(以下简称,富士通研究所)开发出了一种技术,可以识别虚拟桌面系统中响应下降等性能退化的原因。

开发背景

在保持高安全性的同时,可实现工作方式不受环境限制的虚拟桌面系统,正在成为一种重要的ICT基础设施得到推广,它主要用以支持多元化的人才活动,从维护生产力的角度来看,虚拟桌面系统的稳定运行显得尤为重要。另一方面,由于OS或业务应用程序更新等临时性的集中访问、用户增加、存储系统配置变更等各种因素,导致响应恶化或会话断开,会给系统运行管理员在识别原因及解决问题时带来很大负担。

课题

为了识别虚拟桌面系统性能退化的原因,需要综合判断服务器、存储器、网络和将这些虚拟化的系统状态,确定瓶颈位置及其原因。为此,运行管理员需要找到可疑位置,有效获取详细的统计信息和日志信息,通过反复分析来确定原因。但这种分析可能会增加设备的处理负荷,导致新的响应恶化。因此,需要在尽量减少对系统影响的情况下,耗费时间和精力进行反复分析。特别是存储器,经常因工作开始或应用更新等集中访问而引起阻塞,这是造成瓶颈的主要原因。但由于基于短数据单元进行读写,访问频率高,因此很难通过日志对其进行记录和分析。

开发的技术

此次,我们开发出了业界首个通过监测虚拟桌面系统网络上的数据包,来分析由存储造成瓶颈的技术,并结合已开发的服务器之间的虚拟网络分析技术(注2),开发出了一种自动识别虚拟桌面系统瓶颈位置的技术(图1)。通过该技术,运行管理员可以全面调查导致性能退化的原因并采取对策,而不用花费时间对过程进行划分来寻找原因,也不会给运行中的系统增加负担。开发的技术特征如下:

frdc-20180125-img-01

图1 开发的技术概要

  1. 存储性能分析技术

    与服务器、虚拟设备之间的网络不同,存储网络的短数据通信较多,监测所有数据包时,数据量会变得十分庞大。为此,我们开发出了业内首个性能退化分析技术,可解决数据堆积问题。通过对存储设备的输入输出数据包包头(读写类型,数据长度,ID等)信息进行分析,不仅可以删除不必要的数据部分,而且仅通过提取分析所需的一系列运行特征便可实现性能退化分析(图2)。利用该技术,可以减少分析存储性能时所需的累积数据,而不会损害虚拟桌面系统的性能。该技术利用了已开发的服务器之间的虚拟网络分析技术。

    例如,在300台虚拟设备运行的系统中,基于本技术可将存储性能分析所需的数周累积数据减少到大约五分之一。

    frdc-20180125-img-02

    图2 存储性能退化分析技术

  2. 性能退化分析技术

    此次,基于获取并分析2个网络(服务器和虚拟设备之间的网络,存储网络)的数据包,通过累积数周数据并对相关性进行全面分析,富士通研究所开发出了一种自动分析整个系统瓶颈部分的技术。基于时间序列记录的存储性能和服务器、虚拟设备之间网络的分析结果,对存储状态和运行中的应用程序类型进行关联、分析,可以全面分析系统性能退化的原因,而不会给系统造成负担。

效果

目前已经在300台虚拟设备运行的环境中验证了基于该技术的原型系统。结果显示,以前服务器、网络、存储专家为了确定性能瓶颈的原因,包括对原因的判断、影响调查、再现、分析等一系列工作,大约需要2天时间。而现在仅需两个小时即可完成,时间缩短到以前的大约十分之一。过去大部分识别工作不可能在单个分析周期内实现,需要通过2、3次反复作业才能完成,而该技术可进行全面分析,因此一次就可以诊断出原因。

利用该技术可大大降低虚拟桌面系统运行管理员的工作负荷,实现比以前更稳定的系统运行,同时对于考虑导入虚拟桌面系统的客户来说,还可以解消他们的顾虑。

今后

面向未来的商业化,富士通研究所将通过数千台虚拟设备运行的大型虚拟桌面系统进行验证,计划在2018年将其作为富士通株式会社的服务提供给客户。

注释

 注1 株式会社富士通研究所:
社长 佐佐木 繁
总公司所在地 日本神奈川县川崎市
 注2虚拟网络分析技术:
基于软件快速检索并累积数据的技术。
可参考2014年7月23日研究所技术介绍“采集40Gbps数据的同时进行高速检索的技术”和2016年4月5日研究所技术介绍“以世界最快速200Gbps同时进行通信监视和质量分析的软件 ”