CUDA 编程相关;tensorflow GPU 编程;关键知识…

2019-11-11 09:00:35来源:博客园 阅读 ()

新老客户大回馈,云服务器低至5折

CUDA 编程相关;tensorflow GPU 编程;关键知识点记录;CUDA 编译过程;NVCC

本文章主要是记录,cuda 编程过程中遇到的相关概念,名字解释和问题;主要是是用来备忘:

  • cuda PTX :并行线程执行(Parallel Thread eXecution,PTX)代码是编译后的GPU代码的一种中间形式,它可以再次编译为原生的GPU微码。
  • 下面几条链接,是对nvcc 编译过程中,编译参数的解释:-gencode arch=compute_60,code=sm_60 -gencode arch=compute_61,code=sm_61;本编译参数适用于 1080ti显卡;此种模式为cuda fatbinary模式,用于优化cudabin的执行;
  • https://docs.nvidia.com/cuda/cuda-compiler-driver-nvcc/index.html#virtual-architecture-feature-list 
  • https://docs.nvidia.com/cuda/cuda-compiler-driver-nvcc/index.html#gpu-feature-list 
  • nvcc 编译过程理解:https://docs.nvidia.com/cuda/cuda-compiler-driver-nvcc/index.html#gpu-compilation  
  • 上图是:Two-Staged Compilation with Virtual and Real Architectures,详细情况,请看上面链接;

  • 上图是:Just-in-Time Compilation of Device Code  

  • https://docs.nvidia.com/cuda/cuda-compiler-driver-nvcc/index.html#fatbinaries (CUDA fatbinaries 模式)
  • https://www.cnblogs.com/zjutzz/p/10272424.html (nvcc 与 C++ 混合编译Demo, 较为优秀

保持更新,更多内容,请关注 cnblogs.com/xuyaowen;

 

原文链接:https://www.cnblogs.com/xuyaowen/p/about-cuda.html
如有疑问请与原作者联系

标签:

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有

上一篇:POJ1852

下一篇:Run-Time Check Failure #0 - The value of ESP was not properl