PerfMa

IT系统稳定性保障专家

请至少选择一个您感兴趣的方案
发送验证码

感谢您的提交!

我们会在2工作日内与您联系

产品

全天候为您的IT系统稳定运行提供有力保障
即刻开启您的IT系统稳定性保障之旅

XSea 全链路压测平台

多地域高仿真流量模拟、端到端流量染色与数据隔离、全链路压测风险熔断

XWind 性能风险巡检与诊断平台

无人值守智能分析、风险处理能力闭环、可拓展性能风险知识库、丰富图表及报告、开放API助力DevOps

TestMa 质量效能平台

全流程的质量闭环,可度量的质量数据,无门槛的接口编排,高效率的精准测试

XChaos 混沌工程平台

应用架构智能感知、故障演练场景丰富、高级多流程编排、多维度演练观测、过程安全控制、第三方集成扩展

XSpider 监控平台

无侵入实时性能分析、低性能开销、动态采样、根因定位

解决方案

沉淀PerfMa多年的业务经验,提供金融、
证券、快消、交运等多个领域的解决方案

金融

依托全链路压测平台的能力,建立一套完整的性能保障体系

电商

基于平台的建设及专家咨询服务,进行统一平台管理,实现工具、框架的统一

连锁快消

实现多维自动化能力,协助构建标准化的性能测试及回归体系,提升测试效率

交通运输

以数据驱动,形成标准化测试能力,保障系统的正确性、性能容量及可靠性

公司动态

全方位汇集PerfMa大小资讯
寻找对您有帮助的事件

PerfMa新闻

PerfMa公司最新动态或消息,为您提供关于PerfMa公司的第一手资讯

PerfMa活动

为您提供PerfMa线上线下精彩活动回顾及预告

关于

和优秀的小伙伴一起共事
不负初心,用技术的力量创造梦想

关于PerfMa

强大的专业团队、企业资深专家,致力于为企业提供性能领域的全方位解决方案

加入我们

浓厚的工程师文化、靠谱的发展平台、舒适的办公环境,拥抱变化中快速成长

社区&开源

汇聚IT系统稳定性领域问题诊断调优精英
共建IT系统稳定性领域问题诊断调优标准和能力

专注性能领域垂直社区,几十万开发者在这里交流性能问题,分享技术干货,是开发者们学习和成长的乐园。


访问HeapDump社区 >

为终结性能问题而生的开源插件容器,将定位/解决各种性能问题的工具适配成插件,通过相互联动组合,一键解决您的性能问题。


访问XPocket官网 >
从证券公司交易系统故障,来认识混沌工程
2022-04-02

近期,多家券商交易系统接连出现不同程度的系统故障,不能显示实时行情,投资者陷入“买不了”、“卖不出”、“撤不了”的困局中,回顾事情发展:3月15日有投资者表示,有两家证券公司交易软件行情一度无法刷新显示,上述问题在当日上午持续十分钟左右,后来得到解决。

 

3月14日,有网友称“某证券系统买卖不了“,“一个小时都没有能解决故障”。还有网友称:“问了客服,说是深圳总部系统故障”。”

 

 

随着金融行业的高速发展,业务需求不断激增、产品迭代速度越来越快,从而导致金融行业内的系统规模变得越来越大,传统的单体架构模式已无法满足金融行业当前业务的发展需求,分布式微服务架构正在越来越多地被应用到金融行业之中。同时,因为金融行业需要涉及到大量的资金交易,系统会涵盖到多数据中心、多活、灾备、容器、虚拟机等众多复杂的基础设施,系统间的交互会尤为的复杂,分布式架构技术的应用,增加了基础设施复杂交互的难度,使系统的运行增加了更多不确定性。

 

而传统的高可用测试方式,是通过经验来对系统的已知可能情况,注入特定故障来判断对系统的影响,这种测试方法属于给定条件下的变量输入验证,测试范围有限,对于复杂的分布式系统,很难测试真实生产中遇到的各种情况,因此传统高可用测试的方式越来越不适用于分布式系统的测试。

 

金融业务的特点对系统的稳定性、可用性、可靠性都有着极高的要求,那么如何保障金融行业内分布式系统的稳定性和可靠性?混沌工程可在一定程度上给出一定的解法。

 

混沌工程是什么?

 

混沌工程最早是由 Netflix 提出的新思维方式,是指通过受控的实验去观察分布式系统运行的过程。混沌工程是在分布式系统上进行实验的学科 , 旨在提升系统容错性,建立系统抵御生产环境中发生不可预知问题的信心。

 

混沌工程的实施原则

 

混沌工程并不意味着”混乱”,它的实施过程涉及到系统、设施、场景、人员等各方面资源,必须是有原则,有序的,只有这样才能组织和协调各方资源来实现最终的目的。

1、建立一个围绕稳定状态行为的假说:关注系统的可测量输出,而不是系统的属性,吞吐量、容错率、延迟百分点都可能是表示稳态行为的指标,验证系统是否正常工作, 而不是试图验证如何工作

2、多样化真实世界的事件:混沌变量反映现实事件,通过潜在影响或估计频率来排定这些事件的优先级,考虑与硬件故障类似的事件, 任何能破坏稳态的事件都是混沌实验的一个潜在变量

3、持续自动化运行实验:手动运行实验是劳动密集型的, 最终是不可持续的,所以要实现实验自动化并持续运行,在系统中构建自动化的编排和分析

4、最小化爆炸半径:生产试验过程中,必不可少的会对线上系统造成影响,造成用户投诉,最小爆炸半径就是结合方案和目标,减少对用户的影响。爆炸半径越小,越容易得到控制,但是暴露问题会较少;爆炸半径越大,影响就越大,暴露的问题会更多,爆炸半径的选择与各阶段的目标以及实施能力是相匹配的。

 

混沌工程的收益
 
验证系统弹性:架构容灾应急、分布式系统弹性
验证系统依赖度:业务依赖梳理、强弱依赖分析
验证业务连续性:监控有效性、故障响应能力、稳定性保护措施
验证故障修复:故障回归测试

 

结语
 

混沌工程作为发现系统潜在风险、提升应用系统弹性的重要手段,针对以分布式微服务架构为核心的金融行业交易系统,可以通过故障注入、可靠性演练等方式,让潜在的问题浮出水面,从而提升整个分布式系统的高可用能力,为提升金融行业IT系统的稳定性做更好的服务。

 

关于PerfMa混沌工程平台:

 

由分布式系统稳定性建设信通院标准主要贡献者主导,PerfMa混沌工程平台可为企业软件项目提供平台化易用、安全、丰富场景的故障演练能力,帮助企业发现分布式应用架构、庞大资源和业务子系统等导致的复杂故障问题,提升IT系统稳定性。

 

 

平台功能主要包括演练计划、流程编排、安全执行、演练观测、演练报表、演练报告、专家场景、架构视图等功能;支持主机、Docker、Kubernetes等多种部署类型的故障演练。

 

场景丰富:
  • 基于最佳实践,支持基础资源、JVM、容器化、中间件、K8S等多种演练场景

  • 内置专家经验库,简化演练流程

 

可观测性:
  • 演练过程中的系统指标直观展示

  • 演练效果直接平台可见

 

安全防护:

  • 内置保护策略,自动触发并终止演练,避免系统因演练而引发的预期外故障

 

演练编排:

  • 提供级联演练编排能力

  • 可进行串行或者并行演练

请至少选择一个您感兴趣的方案
发送验证码

感谢您的提交!

我们会在2工作日内与您联系

业务咨询电话:4008-717-107

公司联系电话:0571-8500-1801