證券創新之翼——阿里金融云

作者: 孟永輝&方維義  來源: 程序員  發布時間: 2014-12-29 19:24  閱讀: 2181 次  推薦: 5   原文鏈接   [收藏]  

  云計算被視為繼大型計算機、個人計算機、互聯網之后的第4次IT產業革命,順應了當前各行業整合計算資源和服務能力的要求,成為引領當今世界信息技術變革的主力軍。越來越多的金融企業認識到只有與云計算結合,才能更好地支持業務發展和創新。本文將結合阿里金融云的特性,講述券商IT系統上云的最佳實戰經驗。

  阿里金融云于2013年底正式上線,主要面向銀行、證券、基金、保險和信托等金融企業。不到一年時間,已經有200多家金融機構的IT系統全部或部分運行于金融云上。簡單來說,金融云有以下特點。

  • 安全合規。通過了國際、國內多項權威機構的專業認證,符合人民銀行和銀監會的IT建設標準,例如物理隔離、生物識別、電力、制冷、監控、安保等。
  • 高可用和安全性。提供更高的SLA和安全防護能力,例如支持兩地三中心架構、ECS單臺可用率99.95%、RDS實例可用率99.97%、更強的安全和防護更高的防攻擊能力等。
  • 提供專線/VPN免費接入、堡壘機服務、特殊設備托管等增值服務,并計劃推出金融中間件服務和更多數據服務等。  

  券商IT系統上云分析

  證券行業IT系統分為三大類:客戶端(炒股軟件、網站等)、券商系統和交易所系統。投資者通常使用客戶端委托下單,把指令下發券商系統(主要是經紀業務),最后提交到交易所完成撮合成交。首先,我們簡單介紹一下券商IT系統。

  券商IT系統

  傳統的券商IT系統分為經紀業務、風控管理、營銷服務和資產管理等四大類,其中每一類又由若干個業務系統組成。以經紀業務為例,它主要由經紀業務運營支撐軟件系統及相關衍生軟件產品組成,包括客戶交易、賬戶存管、清算結算等業務軟件系統。如圖1所示,經紀業務結構規劃中,整體上分為前臺系統、中臺系統和后臺系統。

圖1  經紀業務系統整體架構

  前臺是面向使用者的渠道服務,使投資者與操作人員能通過各種不同的方式接入系統。與此相對應的,依據不同的渠道方式,提供不同的產品供投資者與操作人員使用。如專用客戶端平臺、網上交易平臺、CALL CENTER平臺、移動終端平臺以及各門戶網站的Web應用等。

  在中臺業務中,針對實時交易業務提供集中交易系統,實現投資者的交易服務功能;面向客戶在線支持提供客戶服務系統;面向財經資訊提供資訊管理服務;面向投資管理提供投資管理系統;面向清算結算業務提供統一的清算結算服務等。

  對于后臺經營分析,主要基于統一數據源的客戶關系管理、客戶風險管理、系統的運維監控以及決策分析、OA應用等各類管理性的業務應用,實現針對非實時管理業務應用的分離處理。多數業務系統,從前到后通常分為客戶端、負載均衡、Web服務器和中間件、數據庫等幾個層次。券商系統也是如此,除了要滿足高并發、穩定性等設計標準外,還對高可用、網絡時延、數據安全有更高要求。另外,由于創新業務越來越多,競爭加劇,券商行業對成本也變得比較敏感。下面從以下幾個方面做簡要分析。

  高可用

  如果券商關鍵系統停機10分鐘,則屬于特別嚴重的事故,會造成非常巨大直接和間接的經濟損失,甚至會受到證監會的處罰,所以高業務連續性是基本要求。業務連續性是個非常大的話題,涉及到管理制度、技術方案和物理設施等多個層次,并且要確保這些關鍵職能在任何環境下都能持續發揮作用。

  混業經營的大環境下,各種創新業務是券商的競爭力所在。在業務、上線時間和成本等多重壓力下,系統有時沒有容災備份機制,甚至存在很多單點問題。

  以賬戶管理系統為例,傳統方案是在自建機房搭建三/多層架構,如果要考慮容災,甚至異地容災,整個系統會變得非常復雜。

  為此,阿里金融云提供了非常簡潔的高可用解決方案,產品全部是同城容災的,例如SLB(Server Load Balancer,負載均衡)服務采用同城雙活機制,在發生機房級別的故障后,服務秒級切換,且對外服務的IP地址不會發生變化,確保最終用戶基本無感知;RDS(Relational Database Service,關系型數據庫服務)能夠做到同城容災,數據會同時寫到兩個機房的服務器上,當發生機房級別的故障后,秒級切換到備庫,數據無丟失,只要上層業務系統能夠做到出錯重試,服務很快就能自動恢復,所以通常監控不到業務系統的對外服務異常。

  如果選購ECS(Elastic Compute Service,云服務器)時,將它們均分到不同的可用區(機房),那么在某臺ECS或某個可用區的ECS故障后,SLB會監控到異常,將流量切換到健康的ECS上;如果ECS出現故障恢復,則SLB會把部分流量切換回來。如此,就可以在金融云上搭建一個同城災備的高可用系統。

  由上可知,這個系統需要IT人員做的只是購買ECS時將其均分到不同的可用區,再部署相應的業務系統即可(還需要配置云盾和云監控)。另外,可選兩地三中心架構,從而做到數據級或應用級的容災。賬戶管理系統在云上的架構如圖2所示。

圖2   賬戶管理系統在云上的架構

  • 圖2分為兩部分:左邊是杭州地域,右邊是青島地域。其中杭州地域分為兩個機房DC1和DC2。
  • 金融云中的SLB、OSS和RDS是同城災備架構,也就是發生機房級別的故障,對用戶來說透明無感知;其中RDS是同城雙寫,每個機房兩份數據,能夠保證無數據丟失,即同城RPO為0。
  • 購買ECS時,均分到兩個可用區(機房)。
  • 配置合適的云盾和云監控策略,實時監控各種事件的發生,例如服務可用狀態或服務器性能壓力等。
  • 異地災備系統的架構與之類似,開通災備服務后,金融云會自動進行數據同步。如果需要業務級災備,則需要搭建與主站類似的系統架構。如果發生地域級的災難,可通過DNS切換到異地備份系統。

  因為運維ECS必須通過VPN撥入,所以一般情況下,購買ECS時除了指定可用區外,還要把公網帶寬設置為0(純內網環境),如圖3所示。通過以上可知,金融云能夠滿足5級災備標準,整個系統的年度可用率在99.96%以上,且同城RPO是0,異地RPO為數分鐘,滿足券商系統的對業務連續性要求,甚至超出了現有系統的建設標準。

圖3  將公網帶寬設置為0

  網絡時延

  前臺渠道服務,有行情、網上交易、門戶網站、網上開戶等系統,訪問終端有PC、手機等各種智能移動設備。證券期貨類系統要求網絡時延越低越好,處理時延也是衡量業務系統的重要指標,是券商的競爭力的重要方面。

  針對行情系統來說,目前券商的做法是在全國不同地域的IDC機房里面搭建行情服務器,由客戶端(炒股軟件)手動或自動選擇最快的站點。因為是十幾個或幾十個站點同時提供行情服務,且IDC機房通常只有一個或兩個運營商線路接入。這種做法的用戶體驗不佳。

  金融云很好地解決了這些問題,目前已有十余家券商將行情系統遷移到金融云。行情系統相對比較簡單,傳統架構可直接搬到云上:負載均衡(SLB)+若干臺服務器(ECS);把行情通過專線拉到金融云,提供快速穩定的行情源服務,同時把券商以互聯網鏈路做行情源作備份。行情系統的云上架構如圖4所示。 

圖4  行情系統的云上架構

  經過實踐,我們發現只在云上部署一個(杭州)或兩個站點(杭州和青島),反而能得到比在當地站點更短的行情延遲,這主要得益于金融云直接使用阿里巴巴的優質基礎網絡,提供了多運營商BGP接入,包含電信、聯通、移動、教育網、鐵通等8個運營商。

  針對以上方案,券商在多域多運營商線路的測試結果顯示。

  • 隨著地域距離增大,網絡時延會變長,但對總的行情時延的影響不明顯;
  • 不同運營商的環境下,行情延遲明顯優于原券商系統;
  • 如果使用專線行情源,行情時延明顯優于原有方式;
  • 如果使用備份行情源,行情時延與原有方式相當或稍快。

  券商選擇把前臺渠道各服務系統(含行情系統)架設到金融云上,它為各種終端和運營商線路及各地投資者提供一致的快速訪問體驗。如果是網上開戶等應用,需要和券商自己機房的CA系統、賬戶系統、CRM等系統進行交互,則需要與金融云建立專線鏈路。

  數據安全

  云計算的核心是安全,券商對數據安全尤為重視。阿里金融云從機房、基礎硬件/軟件、云計算分布式操作系統(飛天)、云產品等各個層面內置了非常多的防護和監控措施,并免費提供云盾和云監控給業務系統使用。以下從數據安全角度做一下簡要描述。

  • 金融云與通用云計算服務物理隔離,物理磁盤只有消磁后才能出機房。
  • 互聯網入口只能通過SLB的特定端口,券商IT運維只能先撥入VPN后,才能進行部署和升級等操作。
  • 券商之間邏輯隔離,同時提供安全組(防火墻),可制定全面的訪問規則。網絡工程師可以劃分出DMZ區、業務區、核心區等安全域。
  • 云盾提供WAF、暴力破解、SQL注入等安全服務,同時提供全面的審計功能。
  • 數據多副本備份和異地容災等。

  券商的安全體系是與金融云共同建立的,阿里云提供安全云平臺和云盾等安全功能。券商更聚焦于業務系統的自身安全,像存儲和網絡鏈路的加密也是必須要做的。

  成本投入

  針對已經上云的券商來說,云計算提供了安全專業的服務,同時也帶來了明顯的成本優勢。因為在云上不需要考慮機房選址,也不需要采購服務器、網絡、安全設備等,節省了大量人力和直接成本。簡要分析如下。

  • 采購設備的直接成本投入折算成年度費用,在云上為原來的30%,或者更少;而且傳統方案需要更大的初期投入。
  • 證券期貨行業的特點是有比較明顯的峰谷現象。行情火爆時,交易量巨大,對IT系統的需求也更大;相反行情平淡時,IT系統又會有較大的浪費。同時,交易時間和非交易時間段對IT系統的壓力也有明顯波動。傳統方案需要按照業務峰值進行系統建設,利用金融云的按需擴展和快速部署特性可以明顯降低系統規模。
  • 證券期貨類系統網絡流量的特點是交易時間又或者運營活動(例如網上開戶或熱銷產品)期間流量巨大,而大部分時間網絡又比較空閑。SLB可選按流量計費模式,能保證良好網絡速度,同時成本是原來的20%甚至更少。
  • 基礎運維和部分安全運維由金融云提供,且不需維護十幾個甚至幾十個站點,明顯降低了運維工作量,極大降低了工作強度。IT人員能將主要精力轉移到體現券商核心競爭力的創新業務上。
  • 降低創新項目風險。每個券商都有很多創新產品,而又不能準確預估這些產品對IT系統的需求量,甚至上線不久也有被取消的可能。在云上可以根據這些產品的市場表現動態伸縮資源,且不需巨額的初期投入。

  推動創新

  證券公司IT系統需要站在一個較高的角度進行科學有效的規劃和整合。IT規劃可以充分利用云計算的優勢,提高IT能力和效率,優化系統和網絡架構,以達到提高用戶體驗,同時減少設備、降低維護成本的基本要求,從而更進一步地支撐和推動互聯網金融背景下的各種金融創新。

  這是一個最壞的時代,市場競爭空前激烈,事關生死;同時這也是一個最好的時代,我們有了互聯網,我們有了云計算,我們有了大數據,讓原來不可能成為可能。

5
0
 
 
 

文章列表

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 大師兄 的頭像
    大師兄

    IT工程師數位筆記本

    大師兄 發表在 痞客邦 留言(0) 人氣()