<p id="khwwt"></p>

  • <p id="khwwt"><label id="khwwt"><menu id="khwwt"></menu></label></p>
    <p id="khwwt"></p>

    <td id="khwwt"></td>

  • <p id="khwwt"></p>
  • <table id="khwwt"><noscript id="khwwt"><legend id="khwwt"></legend></noscript></table>

    1. 您現在的位置是:首頁 > 云計算 >

      QingCloud EHPC讓超級計算輕松具備“云屬性”

      2021-11-23 18:38:00作者:路沙來源:中國信息化周報

      摘要青云QingCloud 云平臺服務部高級總監陳海泉表示,高性能計算指的是通過大量服務器并行運算,用來解決工程和科學上的問題。它的用途很多,宏觀上可以將衛星圖像、遙感數據、氣象數據等,利用高性能計算模擬出地球、海洋和氣侯環境;微觀上,能夠模擬分子和原子原理,使藥物研發更快速、更精確。...

        風馳電掣的F1賽車,可以說是速度與激情的完美結合。

        不過,為了具備更強的競賽能力,在每一場F1比賽開始之前,你知道車隊都會為賽車做哪些檢測工作嗎?你可能知道的是:車隊每換到一條新賽道或者是每次遇到天氣變化時,都必須對F1賽車進行仔細的調校。這種調校需要結合賽道特性和車手的駕駛風格,并且涉及方向盤、輪胎、引擎、尾翼等各個車身部件。

        然而你可能不知道的又是什么呢?在每一場比賽之前,車隊都會根據下一場比賽賽道的特定環境進行模擬實驗,包括使用虛擬風洞來優化空氣動力學;模擬電源散熱系統,讓賽車能夠發揮最大功率;模擬碰撞優化車身結構,讓賽車可以符合比賽的安全法規。利用超算平臺的算力,這些針對性的模擬和優化工作能夠在 7 天內完成,從而保證F1車手的每一場比賽都能擁有最大的優勢。

        從中可以看出,F1賽車“背后”的這些事兒都離不開一項關鍵技術——超算平臺,而超算平臺背后依托的又是高性能計算。青云QingCloud 云平臺服務部高級總監陳海泉表示,高性能計算指的是通過大量服務器并行運算,用來解決工程和科學上的問題。它的用途很多,宏觀上可以將衛星圖像、遙感數據、氣象數據等,利用高性能計算模擬出地球、海洋和氣侯環境;微觀上,能夠模擬分子和原子原理,使藥物研發更快速、更精確。

      新場景下機遇與挑戰的角力

        如今,隨著技術的迭代和應用需求的增加,高性能計算的應用觸角正快速延伸。陳海泉提到,除了已有的應用場景,青云QingCloud看到高性能計算這一領域又涌現出了新的場景:大數據和人工智能與超算融合。

        在陳海泉看來,呈現大數據和人工智能與超算融合的新場景,一方面是因為數據量的增加和數據類型的多樣化驅使數據中心與算力中心互相融合,另一方面是因為人工智能進入深度學習階段需要進行大量的浮點運算,為了達到足夠的算力,就需要更多的 GPU 節點。

        以具體的應用場景為例,在醫藥領域,新冠肺炎疫情加速了大數據在醫藥和生命科學領域的應用,促進了核酸疫苗和核酸藥物的研發。例如BioNTech公司基于病毒基因序列,通過超算平臺,只用了4個小時就設計出 mRNA 新冠肺炎疫苗。在金融領域,大數據和人工智能與超算相結合,對各種層面和維度的數據進行分析,通過深度學習技術訓練出模型,并且應用在風控上,可以讓壞賬率降低35%。

        如此看來,新場景所帶來的機遇已毋庸置疑,不過此時往往挑戰也是如影隨形。在各種業務場景下,因數據處理量、計算任務關聯關系等不同,對計算能力、存儲效率、網絡帶寬及時延要求有各自側重。正如陳海泉所說,較早的超算中心都是圍繞計算資源而建,存儲上基本只有 Lustre 并行文件存儲,并且容量有限,難以支撐大數據的場景。而新一代的超算中心雖然配備了足夠大的容量,可以承接仿真建模類等大數據業務,但由于超算中心本身提供的服務比較單一,也無法承載 MapReduce 這種純粹的大數據業務。另外,人工智能應用的爆發,則要求超算中心有充足的GPU資源,并且還要提供對應的軟件框架。這些業務往往還希望用云原生的方式來部署和運行。

        需求的多樣化自然帶來的是挑戰性的急劇增加。“用戶都希望有無限的存儲容量、最高的性能,還要很便宜。‘既要、又要、還要’肯定是無法同時滿足的。所以超算中心需要對不同的業務提供合適的存儲類型。此時,融合的超算平臺就成了一個絕佳的選擇。”陳海泉如此說道。

      QingCloud EHPC超算平臺就這樣應運而生

        記者認為,云端高性能計算應該是未來的主要發展趨勢,因為企業級高性能計算經常會遇到不可預測的算力波峰,云端恰好可以在短時間內獲取海量計算資源,而且即開即用、用完就關,可以實現現有計算資源的優化配置。

        青云QingCloud EHPC 產品經理苗慧表示,QingCloud EHPC產品是基于青云公有云IaaS平臺、PaaS平臺的云基礎設施,主要為青云用戶提供公有云服務,為部分客戶提供專屬云和混合云等多種形態的產品。

        從技術架構上來講,QingCloud EHPC主要分為三層:資源層、管理層和用戶端。

        資源層主要包含青云的計算、存儲和網絡資源,以及相應的后臺調度器、調度管理平臺以及可視化服務平臺。

        管理層主要提供SaaS化的服務,從開始作業到作業運行結束,系統將自動進行折扣信息計算、計量計費和作業監控服務,能夠保證用戶進來之后,對團隊項目、團隊項目權限等相應的管理。

        用戶端是用戶控制臺,用戶可以進行創建集群、管理集群、彈性伸縮、作業提交、作業編排、作業性能分析。通過用戶控制臺,用戶可以很方便地操作作業。

        在陳海泉看來,QingCloud EHPC可以全面地支持各種新的業務場景。對于超算最常見的仿真和建模業務,青云提供了低延時、高帶寬的InfiniBand網絡,高速并行文件存儲以及CPU/GPU的算力組合,不僅能支持大規模求解運算,還能提供 GPU 桌面進行圖形前后處理,完成一個閉環的業務場景。

        對于大數據業務,QingCloud云平臺提供的對象存儲容量達 245PB,跟計算節點結合,可以用于大規模的數據處理和分析。計算節點到對象存儲的網絡帶寬有1.6T,能夠保證大數據計算的超高性能。

        對于人工智能訓練業務,青云提供算力達850PFlops的A100 GPU資源池和全閃并行文件存儲,并且能夠結合容器平臺,提供性能極致優化、輕量便捷、開源開放的人工智能平臺。

        “有了云平臺的多種存儲服務,用戶可以按照自己的業務來選擇合適的存儲類型,包括冷熱類型的對象存儲、全閃并行文件存儲或者塊存儲等。有了虛擬化技術的加持,青云可以快速為不同業務構建其所需的運行環境,隨時可以切換 MPI、TensorFlow 或者 MapReduce 軟件平臺,充分利用超算中心的硬件資源滿足各種業務場景的需求。”陳海泉進一步解釋道。

      搭建算力交互的連接平臺

        苗慧提到,QingCloud EHPC會向用戶提供兩種服務集群:第一種形式是青云作為平臺方,提供 400 多個節點的共享隊列,采用傳統超算的形式,用戶進來提交作業,按照核心數和作業運行時間進行計費。第二種形式是用戶自己構建EHPC集群,通過購買節點進行定制化安裝,支持root權限,可以對集群進行最高權限的配置。這種形式構造了用戶自己專屬的計算節點,通過計算節點的配置和計算節點的使用時長進行計費。

        靈活多樣、低成本的高性能計算服務模式讓用戶的選擇更自由。這樣看來,青云科技作為一家企業級云服務商,提供一個基于云模式的綜合企業服務平臺,始終致力于探索為行業應用提供豐富多樣、靈活便捷、低成本的算力服務模式。

        不僅如此,在日趨商業化、生態化的高性能計算領域,面對日益復雜的應用需求,青云也在探索一條能夠實現算力最優配置的新路徑,致力于搭建起算力交互的連接平臺。“青云QingCloud的愿景就是,希望與超算中心合作共建算力共享的算力網格。一方面作為算力中心的供應方,幫助用戶建設、運營算力中心。另一方面對于算力需求方,例如分子動力學、新能源/新材料、醫藥和工業仿真等不同行業的用戶,青云可以協調空置算力,幫助其完成任務。”陳海泉這樣說道。


      (本文不涉密)
      責任編輯:路沙

      站點信息

      • 運營主體:中國信息化周報
      • 商務合作:趙瑞華 010-88559646
      • 微信公眾號:掃描二維碼,關注我們
      黄色A片在线观看

      <p id="khwwt"></p>

    2. <p id="khwwt"><label id="khwwt"><menu id="khwwt"></menu></label></p>
      <p id="khwwt"></p>

      <td id="khwwt"></td>

    3. <p id="khwwt"></p>
    4. <table id="khwwt"><noscript id="khwwt"><legend id="khwwt"></legend></noscript></table>