关于pytorch多GPU训练实例与性能对比分析 - python基础

python进阶pdf电子书下载

ÒÔÏÂÊµÑéÊÇÎÒÔÚ°Ù¶È¹«Ë¾ÊµÏ°µÄÊ±ºò×öµÄ£¬¼ÇÂ¼ÏÂÀ´Áô¸öÐ¡¾Ñé¡£

¶àGPUÑµÁ·

cifar10_97.23 Ê¹ÓÃ run.sh ÎÄ¼þ¿ªÊ¼ÑµÁ·

cifar10_97.50 Ê¹ÓÃ run.4GPU.sh ¿ªÊ¼ÑµÁ·

ÔÚ¼¯ÈºÖÐ¸Ä±äGPUµ÷ÓÃ¸öÊýÐÞ¸Ä run.sh ÎÄ¼þ

nohup srun --job-name=cf23 $pt --gres=gpu:2 -n1 bash cluster_run.sh $cmd 2>&1 1>>log.cf50_2GPU &

ÐÞ¸Ä ¨Cgres=gpu:2 ¼´¿É

Python ÎÄ¼þ´úÂëÐÞ¸Ä

parser.add_argument('--batch_size', type=int, default=96*2, help='batch size')

ÐÞ¸Ä¶ÔÓ¦ batch size ´óÐ¡£¬±£Ö¤Ã¿¿éGPU»ñµÃµÈÁ¿µÄÑµÁ·Êý¾Ý£¬ÒòÎªbatch_sizeµÄ¸Ä±ä»áÓ°ÏìÑµÁ·¾«¶È

×îÈÝÒ×ÊµÏÖµÄµ¥GPUÑµÁ·¸ÄÎª¶àGPUÑµÁ·´úÂë

µ¥GPU£ºlogits, logits_aux = model(input)

¶àGPU£º

if torch.cuda.device_count()>1:#ÅÐ¶ÏÊÇ·ñÄÜ¹»ÓÐ´óÓÚÒ»µÄGPU×ÊÔ´¿ÉÒÔµ÷ÓÃ

   logits, logits_aux =nn.parallel.data_parallel(model,input)

  else:

   logits, logits_aux = model(input)

È±µã£º²»ÊÇÐÔÄÜ×îºÃµÄÊµÏÖ·½Ê½

ÓÅµã£º´úÂëÇ¶ÈëÊÊÓ¦ÐÔÇ¿£¬²»ÈÝÒ×±¨´í

ÐÔÄÜ·ÖÎö

¸ÃÍ¼Îª1µ½8GPUÑµÁ·cifar10¡ª¡ª97.23ÍøÂçµÄÊµÑé¶Ô±È

¿ÉÒÔ¿´µ½µ¥ºËÑµÁ·600ÂÖÐèÒª53Ð¡Ê±¡¢Ë«ºËÑµÁ·600ÂÖÐèÒª26Ð¡Ê±¡¢ËÄºË16¡¢ÁùºË14¡¢°ËºË13¡£

ÔÚ¿ÉÔËÐÐ7Ð¡Ê±µÄGPUÉÏµÄ¶Ô±ÈÊµÑé£ºµ¥ºËÅÜÍê83ÂÖ¡¢Ë«ºËÅÜÍê163ÂÖ¡¢ËÄºËÅÜÍê266ÂÖ

½áÂÛ£ºÐÔ¼Û±È½Ï¸ßµÄÊÇÊ¹ÓÃ4¡«6ºËGPU½øÐÐÑµÁ·£¬µ«ÊÇ¶àGPUÑµÁ·¶ÔÓÚµ¥GPUÑµÁ·ÓÐËù²îÒì£¬ÑµÁ·µÄ×¼È·ÂÊÌáÉý»áÓÐËù²¨¶¯£¬Ä¿Ç°·¢ÏÖµÄÊÇ¸ºÃæµÄÓ°Ïì¡£

ÒÔÉÏÕâÆª¹ØÓÚpytorch¶àGPUÑµÁ·ÊµÀýÓëÐÔÄÜ¶Ô±È·ÖÎö¾ÍÊÇÐ¡±à·ÖÏí¸ø´ó¼ÒµÄÈ«²¿ÄÚÈÝÁË£¬Ï£ÍûÄÜ¸ø´ó¼ÒÒ»¸ö²Î¿¼£¬Ò²Ï£Íû´ó¼Ò¶à¶àÖ§³Ö½Å±¾Ö®¼Ò¡£

转载请注明：谷谷点程序 » 关于pytorch多GPU训练实例与性能对比分析