大话灾备 | 安信梁德汉:拥抱智能运维新变化

时间:2020-11-12 栏目:技术前沿

作者 | 黄亮

编辑 | 郭颖

一座城市有一座城市的品格。创新是深圳的品格,敢闯敢试,敢为人先,是每一位深圳科技人身上的烙印。

在金融科技创新领域,深圳福田,是中国最为活跃的地区之一。作为深交所的所在地,福田培育了众多的优秀券商机构,安信证券便是其中之一。

作为全牌照综合类券商,安信证券在业务连续性、智能运维等数字化领域的创新已抢占先机。如在与英方软件合作的多对多池化集群方面,已实现特定场景下备端资源的池化管理,极大地提高了系统故障自动化迭代接管的能力。

未来,安信证券如何通过标准化的基础架构和高保障的信息系统运维能力,助力集团向中国最具市场价值和核心竞争力的金融服务企业的目标迈进,是《大话灾备》恰逢深圳改革开放 40 周年之际,采访安信证券运维总监梁德汉探讨的话题。

△ 安信证券运维总监 梁德汉

大话灾备:在证券行业从事 IT 这么多年,你如何看待数字化转型?

梁德汉:我们从证券信息系统运维保障去分析这个问题。证券、银行、保险均属于金融行业,对安全的要求都非常严苛。但三者的区别是,在安全基础上,证券投资对实时性要求是最高的。特别是在开市期间,交易系统对业务连续性的保障、系统快速恢复能力要求是分秒必争。

另外,从业务发展角度分析,随着互联网金融的发展,证券信息部门需要在安全稳定的基础上,快速满足前端业务的快速交付。所以我们将系统划分为两类:一类是稳态系统,一类是敏态系统,证券行业的数字化转型,这是两个非常关键的领域。数字化转型的核心是客户体验,客户体验的提升靠有效运营。

如何做好数字化转型的系统运营,我认为有两个维度:

一是信息化基础设施建设要有一个好的底座,万丈高楼平地起,一个稳健、灵活、弹性的基础设施架构,是上层应用创新、数字化建设的基础。

二是系统的运维保障平台的支持,就像物业管理,如何打理好大楼的一切,做好楼内安全、清洁、水电功能服务等,让它正常提供服务,需要打造灵活且功能强大的运维支持平台辅助运维部门不断创新以适应新的需求。

大话灾备:有没有比较满意的数字化转型项目?

梁德汉:我们还是从上述两个维度讲,在基础设施架构方面,我们搭建了面向未来业务发展的两地三中心的项目,确保系统高效稳定安全地运行,达到业务连续性的高保障要求。

同时,我们正在全面建设智能运维平台,在告警、自动化、可视化展示方面,通过大数据运维分析平台,形成监、管、控、营一体化的运维管理,从原来小作坊式的运维模式向工业化、智能化的模式转型,以平台化的方式大幅提高资源的利用效益。

这个新的智能运维平台,引入了多个行业优秀技术供应商。比如,安信证券与英方软件共同打造的行业首创的“多对多池化”高可用集群技术方案,也是这个平台的一部分。它将帮助我们解决运维成本高和故障自动化切换的问题,实现备端资源的池化利用,提高运维效率。

大话灾备:建设智能运维平台,最大的收益是什么?

梁德汉:创新的导向,是为了更好地服务安信证券的用户。目前我们在一些领域取得了领先优势,但在成为中国最具市场价值和核心竞争力的一流金融服务企业的发展进程中,安信证券将会有更多的业务拓展,系统也会随之不断增加。智能运维大平台的建设,可以更好地去做新旧系统之间的更新、迭代,为业务的快速发展解决系统扩展、运维管理的烦忧。

大话灾备:券商在数字化转型方面有哪些需要克服的困难?

梁德汉:从大的组织架构讲,从信息技术中心到其他的相关部门及领导,能否在数字化转型方向达成一致,数字化转型是否可以为组织带来显著的效益,转型模式是否让人明白和支持,都存在一个解疑答惑的过程。

这个过程会有很多挑战,如何解决?我们可以采取分步走的方法,让一些部门先走,探索和总结出经验,然后让后续的部门跟进,这样可以提高效率,优化过程,避免大的系统故障。

从专业的技术范畴讲,证券行业还有一个特点,大家前些年自研的系统占比很少,主要依赖技术供应商。近三五年大家都在加强自研的力度,建立自主可控的技术研发团队。

所以在数字化转型中,对存量系统的改造和管理是一个非常大的挑战。它涉及到一系列问题,比如平台的对接、技术标准规定、新旧系统的迭代等,如何将这些有机地串联起来,快速演进的同时又能保证核心系统不出问题。我觉得必须一步一个脚印,把基础打扎实,行稳致远,才能在智能运维上做更多的探索,拥抱智能运维的变化。

大话灾备:如何通过灾备保护越来越复杂的应用系统,让数据赋能业务增长?

梁德汉:这是安全运维的保障范畴。因为行业对业务连续性要求特别高,所以每年关于灾备的研究、议题、标准讨论也很多,包括每年的年度全行业灾备应急演练,都会有主管领导亲自主导和参与。

因此,在灾备和业务连续性管理方面,券商的投入并不少。

在《2021 中国灾备行业白皮书》里,也提到了关于行业备份能力建设要求,包括要不要建两地三中心、要不要建两地两中心,然后在各种灾难场景之下的RTO和RPO 的要求是多少,系统灾难恢复 1-6 个等级各自的要求是什么,白皮书都有非常明确的叙述。我们也依据这个在改进和巩固,例如刚提到的两地三中心的建设,就可以满足行业监管和业务保障要求。

在此基础之上,我们会做很多的尝试和创新,比如与英方软件合作的多对多池化、高可用等。

上面是从外部环境分析。从内部环境看,首先在基础架构设计方面,刚开始就要有做好系统冗余、高可用和数据灾备的规划,比如分布式系统、虚拟化平台上的各种操作系统的备份、云容器平台建设等,这些要能够支撑未来业务的发展规模。

未来的环境是怎样的——应用系统会不断增加,并且增长的速度会比消亡的速度快得多,要怎么解决这个问题?

我认为基础架构标准化是一个必然的方向。它能确保后续哪怕应用系统发展到五六百甚至上千个,只要遵循基础架构的标准,就可以满足我们监控的要求、数据备份的要求。

这是我们目前需要创新和攻克的方向,这个底座打好了,架构上的标准对上游业务的开放将是一个强有力的保障。

当然,我们想要在底层把问题解决掉,需要核心业务系统的技术供应商,保持一定程度的开放,让各个系统的数据可以进行交换和对接。数据流动起来,我们就可以通过各类数据的综合分析,为业务发展提供参考方向,让数据赋能业务增长

大话灾备:针对容灾领域有没有一些新的思路和计划?

梁德汉:容灾涉及到成本问题,特别是异地容灾,成本非常高。近期我们也在和上海交易所讨论一些成功案例,特别是“小火种”计划,通过云计算厂商和上证通共同搭建行业云,保障券商异地灾备系统建设的资源供给和降低成本。

在两地三中心的模式下,需要启动异地容灾系统接管的概率是非常低的。在没有发生重大灾难时,比如虚拟机的备份系统,有部分是可以在交易正常的时候关闭的,备份系统只占用存储资源,不占用内存和计算资源,大幅减少异地灾备的运营成本。这方面,行业都已经有了成功的探讨和实践。

大话灾备:券商掌握核心技术有必要吗?

梁德汉:从券商机构的背景和定位讲,我们不是做基础技术的研究,而是做应用技术层面的研究和落地实践。在应用层面,我们还会继续联合各类优秀的技术厂商,共同打造高性能、高保障、低时延的系统平台。

与供应商合作的过程中,必须确保关键领域的决定权在我们自己手里。同时,我们也在加快专利申请的工作,加强研发部门的技术实力和成果输出。

大话灾备:如何看待国产软件在灾备领域的发展壮大?

梁德汉:举例来说,英方软件在证券行业的影响力非常大,我们还是拿它来讲。它之所以获得大家的认可,一方面是有独立自主的数据复制技术,另一方面是能够契合到券商的痛点需求,这个是最重要的。

从证券机构角度看,我们还是看重应用领域的领先发展,所以像英方在容灾、行情分发方面的优势,是它在证券金融领域发展壮大的前提条件。

后记

近期,互联网金融领域史上最大IPO事件,将中国金融改革创新的争议推向了风口浪尖。如果业务层面的金融风险底线不可动摇,那么技术层面的安全保障更应该坚若磐石。但与此同时,业务的快速发展又时刻在催促像梁德汉一样的券商信息化决策者们,他们需要在保障安全稳定的基础上,不断进行技术上的创新,以适应前端业务的快速发展。

这可能是券商在数字化转型中不断创新所面临的最大挑战。

因为他们要承担的,是通过提高信息化运维保障和数据管理能力,携手合作伙伴打造一个安全可靠、互联互通、即时可用的实时数据环境,实现数据赋能业务的增长。

及时响应,快速服务,为您保驾续航

立即注册

请先完成图形验证

验  证  码:

请先完成图形验证

验  证  码:

隐私声明
当您在本网站进行合作伙伴注册登记,本网站将收集您的相关信息,并保存记录。本网站收集的个人信息包括但不限于:姓名、地址、公司、所在地区、电话号码以及电子邮件地址等。您主动提供的信息越多及越准确,我们就能够更好地为您提供有关服务。
咨询·购买