TensorFlow 2.16.2 C++ library build for GPU.
TensorFlow 2.16.2 C++ library build の GPU対応版です。
1. 開発環境
PC: Ubuntu Mate 22.04
Virtual_env
python 3.10.12
bazel 6.4.0
clang-14(llvm-14) <--- NG
clang-17(llvm-17) <--- needed
GPU: GeForce GTX1070 Compute Capability 6.1
GPU 本体のドライバー
mvidia-driver-525
GPUプログラム開発用のライブラリー群
CUDA Toolkit 12.3
cuDNN v8.9.6
Nvidia 提供のライブラリー
TensorRT 8.6.1.6
1.1 ドライバーのインストールから、簡単におさらいする。
i) GPU 本体のドライバーをインストールする。
$ sudo apt install mvidia-driver-525
ii) GPUソフトウエア 開発用に、CUDA 12.3 を使うので、
CUDA Toolkit 12.3 を、Nvidia のサイトからダウンロード&インストールする。
google で、 CUDA Toolkit 12.3 を検索すると出てくると思う。
cuda-12-3-0-download-archive
Linux -> x86_64 -> Ubuntu -> 22.04 -> (deb)local
> Base Installer の欄を実行する。
/usr/local/cuda-12.3/ へ、インストールされる。
include/cuda.h
bin/nvcc <-- nvcc もある。
iii) cuDNN v8.9.6 for CUDA 12.x をダウンロード&インストールする。
やり方は、上記と同じ。
cudnn-archive
-> Local Installer for Ubuntu22.04 x86_64 (Deb)
libcudnn8, libcudnn8-dev
インストール先は、/usr になる。
$ sudo dpkg -L libcudnn8-dev
/usr/include/cudnn.h
/usr/include/cudnn_version.h
iv) TensorRT 8.6.1.6 のインストール。
本当は、使いたくないが、configure で、指定しないと、うまくいかないので、使う。
TensorRT-8.6.1.6.Linux.x86_64-gnu.cuda-12.0.tar.gz を、google で探して、
~/usr/local/share/ 下で展開しました。
/home/nishi/usr/local/share/TensorRT-8.6.1.6
v) clang-17(llvm17) のインストール。(必須)
下記を参考にインストールする。
How to install Clang 17 or 16 in Ubuntu 22.04 | 20.04
$ wget https://apt.llvm.org/llvm.sh
$ chmod u+x llvm.sh
$ sudo ./llvm.sh 17
$ sudo apt list --installed >/dev/null | grep clang
$ dpkg -L clang-17
remove
$ sudo apt remove --purge clang-17
$ sudo apt autoremove --purge
もしかしたら、下記も必要かも?
$ sudo dpkg-reconfigure clang-14
下記は、参考にしたページの記載です。
$ sudo rm /etc/apt/sources.list.d/archive_uri-http_apt_llvm_org_*.list
sudo rm /etc/apt/trusted.gpg.d/apt.llvm.org.asc