如何解决关于使用分布式张量流的grpc + gdr和grpc +动词的一些问题
当我使用分布式张量流时,grpc + gdr比grpc + verbs差,但是加载了nv_peer_mem,我不知道grpc + verbs和grpc + gdr的区别?有人可以帮助我吗? 和一些输出如下: root @ s36-2288H-V5:〜#/etc/init.d/nv_peer_mem状态
nv_peer_mem模块已加载。
我的起始代码如下:
python /root/benchmarks/scripts/tf_cnn_benchmarks/tf_cnn_benchmarks.py
--server_protocol=grpc+verbs
--model=vgg16 --variable_update=parameter_server
--batch_size=64 --num_batches=50 --num_warmup_batches=10
--local_parameter_device=gpu --num_gpus=1
--job_name=ps --task_index=0
--ps_hosts=172.168.30.25:10011
--worker_hosts=172.168.30.26:50012 &
当我设置--server_protocol = grpc + gdr时,性能会变差。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。