高性能計算CPU/GPU并行編程研討會第四期

2019年7月18日 9:00 ~ 2019年7月21日 17:00
限額44人
中科圖云

展開

付費活動,請選擇票種

第三方登錄:

展開活動詳情

活動內容收起

隨著人工智能AI、大數據Big Data、云計算Cloud Computing等計算機科學技術的發展和應用的普及,深度學習DL和人工智能AI成為當下最炙手可熱的技術趨勢,將成為技術行業基礎設施的核心組成部分。GPU的價值不止體現在深度學習,在高性能計算、物聯網、人工智能、生物信息、分子模擬、計算化學、材料力學、系統仿真、流體力學、機械設計、生物制藥、航空動力、地質勘探、氣候模擬等領域,算法越來越復雜,需要處理的海量數據越來越巨大,高性能計算能力就顯得尤為重要。如今,乎所有的深度學習(機器學習)研究者都在使用GPU進行相關的研究,NVIDIA針對深度學習的計算,有一套完整的解決方案,cuDNN已經成為主流深度學習框架調用的深度學習GPU函數庫,包含完整的矩陣乘法和卷積計算的實現。因此我單位舉辦“高性能計算CPU/GPU并行編程研討會第四期”。

一、培訓目的:

現有硬件資源最大化利用,提供多種并行優化方案組合策略,提高并行程序設計與開發水平,熟悉常見的并行計算模式,了解深度學習的主流GPU加速解決方案;實際體驗高性能計算環境,能夠應對主流的超算環境;提供符合自身特點的工程計算解決方案,了解高性能計算和深度學習應用場景

二、主講專家:

幾位主講老師來自中科院系統,研究領域:高性能計算,并行編程,生物醫學圖像處理。多年MPI/OpenMP/CUDA/OpenCL/OpenACC優化加速經驗,多年大型項目移植優化經驗。

三、培訓內容:

OpenMP編程

1、OpenMP基礎:概念介紹、環境搭建、基本用法、編程模型、性能分析

2、OpenMP線程操作:線程同步、數據同步、多線程并發、并行循環計算詳解

3、OpenMP任務和數據處理:數據共享模式、作用范圍制導語句、task指令的使用

4、深入了解OpenMP的內存模型和硬件基礎

OpenMP上機實踐:

1、Hello_world、基本指令的使用、積分法計算PI

2、各種OpenMP指令實現并優化計算圓周率

3、section、task的使用、曼德博集合面積的計算、斐波那契數列

4、挑戰題:利用蒙特卡洛算法計算PI、鄰接列表的并行處理

并行計算與編程基礎

1、并行機體系機構與編程模型概述

① 共享存儲結構

② 共享地址空間

③ 消息傳遞

④ 數據并行

⑤ SMP與GPU集群

2、 并行計算的模型與分析

① 并行執行時間評估模型

② 并行算法的效率特性

③ 并行計算拓展性分析

3、 MPI并行編程

① MPI概念與定義 

② MPI運行環境

③ MPI基礎MPI程序初始化與終止、進程設置獲取、消息發送與接

④ 進程間的通訊:通訊模式、阻塞與非阻塞通訊

⑤ 上機實踐

4、 MPI并行編程二

① 集合通信:數據廣播、歸約、分發、搜集、all to all 通訊、歸約操作

② MPI派生數據類型

③ 上機實踐

5、  MPI并行編程

① 進程組與通信子

② 虛擬拓撲:笛卡爾拓撲,圖拓撲

③ 上機實踐

6、混合并行編程:MPI+OpenMP

① 多線程編程與openMP概述

② openMP指令介紹

② 上機實踐

GPU高性能計算——OpenACC編程基礎與優化進階

1、 OpenACC基礎:概念,與CUDA區別,編譯器,生態;

2、 OpenACC開發環境搭建配置;

3、 OpenACC四步開發流程:判斷并行性,并行化表達,顯式數據傳遞,優化

    3.1判斷并行性:Profile工具pgprof;

3.2并行化表達:引導關鍵字Kernerls和Parallel Loop;

3.3顯式管理數據的拷貝:引導關鍵字Data;

3.4優化:統一內存管理,線程并行層級,collapse,tile

OpenACC上機實操:

1.   Hellow world

2.矢量點乘;

GPU高性能計算——CUDA編程基礎與優化進階

1、 CUDA基礎:API、數據并行、線程模型、存儲模型、控制、同步、并發和通信、加速比;

2、 CUDA開發環境搭建和工具配置;

3、 CUDA優化進階:線程組織調度,分支語句,訪存優化,數據傳輸,原子操作;

4、 GPU并行計算模式及案例分析:

    分析調試:parallel nsight,visual profiler,cuda-gdb;

5、 CUDA生態系統和相關專業領域軟件介紹;

CUDA上機實操:

1、 Helloworld,向量加,cuda庫的使用(cuBLAS、cuFFT );

2、 矩陣乘,直方圖,卷積,規約

大規模并行開發:多GPU開發

1、 GPU異步編程,多GPU編程(混合OpenMP和MPI)及調試調優工具;

2、 OpenACC互操作性:OpenMP,MPI,CUDA;

OpenACC上機實操:

1、 Jacobi迭代

GPU高性能計算——深度學習


1、 深度學習GPU解決方案:

1.1基于GPU的交互式深度學習訓練平臺:DIGITS;

1.2深度學習框架的GPU加速:TensorFlow,Caffe等;

1.3 NVIDIA深度學習SDK:cuDNN,TensorRT,NCCL;

     1.4深度學習顯卡選擇;

深度學習上機實操:

 1、使用DIGITS進行圖像分類;

2、  Caffe,TensorFlow,Theano等通用深度學習框架的GPU加速庫cuDNN的使用;

3、 深度學習前端推理引擎TensorRT的使用;

4、單機多卡的深度學習解決方案NCCL實驗;

GPU技術前沿

1、 CUDA 10新特性

2、 Pascal,Volta,Turing顯卡新架構

 

 

四、時間地點:可咨詢:18310280875   [email protected]

    云南省昆明市 具體地點開班前一周通知

    2019年7月18日--21日

    報到日期:    2019年7月17日全天或7月18日早晨

        

    

五、培訓對象:

    從事高性能計算、GPU加速、并行計算、CUDA編程、openCV、石油、氣象、化工、人工智能、深度學習、計算機視覺、人臉識別、 圖像處理、行人檢測、自然語言處理等領域相關的企事業單位技術骨干、科研院所研究人員和大專院校相關專業教學人員及在校研究生等相關技術人員;                                                                                                   
六、報名費用:

    

   4000/人(含報名費、培訓費、教材費、資料費)食宿統一安排費用自理。



舉報活動

活動標簽

最近參與

您還可能感興趣

您有任何問題,在這里提問!

全部討論

還木有人評論,趕快搶個沙發!

活動地點(查看大圖)

活動主辦方更多

中科圖云

中科圖云

北京中科圖云科技有限公司是一家由中國科學院計算技術研究所/西部高等技術研究院孵化的高技術創新企業。公司專注于人工智能/云計算/大數據/高性能方向的技術培訓。致力于通過對行業前沿技術的持續創新解讀,為相關方向的研究機構和行業用戶,提供從訓練到推理的一站式人工智能云計算應用服務解決方案/教學實訓平臺

微信掃一掃

分享此活動到朋友圈

江西体彩11选五走势图手机版