Centos7 Gpu driver

在vsphere创建的虚拟机上安装nvidia-gpu驱动时和cuda,输入nvidia-smi时出现错误 Unable to determine the device handle for GPU 0000:0B:00.0: Unknown Error 查询后发现是需要设置一个虚拟机的参数然后重启虚拟机 hypervisor.cpuid.v0 = FALSE 在vsphere上找到虚拟机先关机,关机完成后点击编辑设置-虚拟机选项-高级–配置参数-编辑配置 配置参数hypervisor.cpuid.v0 = FALSE,然后启动虚拟机. 输入nvidia-smi,万事大吉啦. »

K8s Ha Deploy

集群方案: - 发行版:CentOS 7.6 - 容器运行时: 19.03.2 - 内核:3.10.0-957.27.2.el7.x86_64 - 版本:Kubernetes: 1.15.3 - 网络方案: Calico - kube-proxy mode: IPVS - master高可用方案:HAProxy keepalived LVS - DNS插件: CoreDNS - metrics插件:metrics-server Kubernetes集群搭建 Host Name Role IP ha-master0 ha-master0 192.168.1.166 ha-master1 ha-master1 192.168.1.167 ha-master2 ha-master2 192.168.1.168 ha-node0 ha-node0 192.168.1.169 Ha-node1 Ha-node1 192.168.1.170 1、下载安装包(基于能够访问外网的服务器下载相应安装包) # 设置yum缓存路径,cachedir 缓存路径 keepcache=1保持安装包在软件安装之后不删除 cat /etc/yum. »

Tf Gpu Usage Toolow

在构造tf.Session()时候通过传递tf.GPUOptions作为可选配置参数的一部分来显式地指定需要分配的显存比例,如下所示: 在tensorflow训练文件里写入 # 假如有12GB的显存并使用其中的4GB: gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=0.333) sess = tf.Session(config=tf.ConfigProto(gpu_options=gpu_options)) # 一开始就给全部的gpu资源 config.gpu_options.allow_growth = False # 如果如下设置,开始不会给tensorflow全部gpu资源 而是按需增加 config.gpu_options.allow_growth = True https://blog.csdn.net/sunwuhuang1/article/details/53946462/ https://github.com/tensorflow/tensorflow/blob/master/tensorflow/core/protobuf/config.proto »