ANH Phát - 209/1 quốc lộ 13, P.26, Q. Bình Thạnh, Hồ Chí Minh, Việt Nam
ANH Phát - 423/7/3 Đường 21 Tháng 8, Phường Phước Mỹ, Thành phố Phan Rang - Tháp Chàm, Ninh Thuận, Việt Namm
Điện thoại: 0902928069
Hãy Like fanpage để trở thành Fan của Anh Phát Computer ngay trong hôm nay!
ANH Phát - 209/1 quốc lộ 13, P.26, Q. Bình Thạnh, Hồ Chí Minh, Việt Nam
ANH Phát - 423/7/3 Đường 21 Tháng 8, Phường Phước Mỹ, Thành phố Phan Rang - Tháp Chàm, Ninh Thuận, Việt Namm
Điện thoại: 090.29.28.069
Chào mừng bạn đến với thế giới Trí tuệ Nhân tạo! Khi bắt đầu với AI/Deep Learning, việc cài đặt môi trường thường là rào cản đầu tiên khiến nhiều người nản lòng bởi các lỗi phức tạp như CUDA not available
hay xung đột phiên bản. Một môi trường được cấu hình chuẩn xác không chỉ giúp bạn tiết kiệm hàng giờ gỡ lỗi mà còn là nền tảng vững chắc để khai thác tối đa sức mạnh phần cứng, đặc biệt là trên các bộ máy tính cho AI chuyên dụng.
Bài viết này của Tin Học Anh Phát là một lộ trình A-Z, "cầm tay chỉ việc" được đúc kết từ kinh nghiệm thực chiến, giúp bất kỳ ai cũng có thể cài đặt môi trường deep learning trên PC một cách thành công. Chúng ta sẽ cùng nhau đi qua từng bước, từ nền tảng đến các framework phổ biến nhất.
Nội dung chính
Trước khi lao vào các dòng lệnh, việc hiểu "Tại sao" chúng ta cần từng công cụ sẽ giúp quá trình cài đặt trở nên ý nghĩa và dễ dàng chẩn đoán lỗi hơn.
Hãy tưởng tượng bạn có một công việc khổng lồ cần xử lý. CPU giống như một chuyên gia siêu giỏi, có thể giải quyết tuần tự từng nhiệm vụ phức tạp. Trong khi đó, GPU giống như một đội quân hàng ngàn công nhân, mỗi người có thể không giỏi bằng chuyên gia nhưng họ có thể thực hiện hàng ngàn phép toán đơn giản (như cộng, nhân ma trận) cùng một lúc. Huấn luyện mô hình AI chính là công việc đòi hỏi hàng tỷ phép toán ma trận như vậy. Do đó, GPU giúp tăng tốc quá trình này lên hàng chục, thậm chí hàng trăm lần so với chỉ dùng CPU. Tuy nhiên, điều này không có nghĩa là CPU không quan trọng, việc tìm hiểu vai trò của CPU trong máy tính AI sẽ giúp bạn xây dựng một hệ thống cân bằng và hiệu quả.
Nếu GPU là động cơ F1 mạnh mẽ, thì CUDA Toolkit và cuDNN chính là hệ thống điều khiển và bộ lốp chuyên dụng.
Lưu ý quan trọng: Cài sai cặp phiên bản CUDA - cuDNN là nguyên nhân số một gây ra các lỗi liên quan đến GPU.
Cả hai đều là những framework mã nguồn mở hàng đầu cho deep learning. Việc lựa chọn phụ thuộc vào mục tiêu và sở thích của bạn.
Tiêu Chí | PyTorch | TensorFlow |
---|---|---|
Triết lý | Linh hoạt, trực quan (Pythonic), "Define-by-Run". | Toàn diện, hệ sinh thái mạnh, "Define-and-Run" và eager execution (mặc định từ 2.x). |
Đường cong học tập | Thường dễ tiếp cận hơn cho người mới bắt đầu và các nhà nghiên cứu. | Có thể phức tạp hơn lúc đầu nhưng rất mạnh mẽ với hệ sinh thái Keras và TFX. |
Ứng dụng chính | Phổ biến trong cộng đồng nghiên cứu, thử nghiệm mô hình mới. | Cực kỳ mạnh mẽ cho việc triển khai mô hình ra sản phẩm (production). |
Gỡ lỗi | Dễ dàng hơn nhờ cơ chế thực thi động, có thể dùng các công cụ debug của Python. | Việc gỡ lỗi có thể phức tạp hơn, đặc biệt với đồ thị tính toán tĩnh (phiên bản cũ). |
Bài hướng dẫn này sẽ giúp bạn cài đặt cả hai, cho phép bạn tự do khám phá và lựa chọn framework phù hợp nhất.
Đây là phần cốt lõi của bài viết. Hãy thực hiện cẩn thận từng bước để đảm bảo thành công 100%.
Bạn có thể dùng một trong hai cách:
Ctrl + Shift + Esc
, chuyển qua tab Performance. Nếu bạn thấy một mục GPU có tên NVIDIA (ví dụ: NVIDIA GeForce RTX 4070), bạn đã có GPU phù hợp. Nếu chưa, bạn có thể tham khảo các dòng card màn hình NVIDIA mới nhất tại Tin Học Anh Phát.Đây là bước quan trọng nhất và thường bị bỏ qua. Driver cũ là nguyên nhân hàng đầu gây ra lỗi không tương thích.
Không nên tải phiên bản CUDA mới nhất một cách mù quáng. Hãy kiểm tra yêu cầu từ trang chủ của PyTorch hoặc TensorFlow. Ví dụ, tại thời điểm viết bài, phiên bản ổn định của PyTorch hỗ trợ tốt nhất là CUDA 11.8 và 12.1.
Đây là bước dễ sai nhất. Hãy làm theo thật cẩn thận.
bin
, include
, và lib
.C:Program FilesNVIDIA GPU Computing ToolkitCUDA11.8
(thay v11.8
bằng phiên bản của bạn).bin
của cuDNN vào thư mục bin
của CUDA Toolkit.include
của cuDNN vào thư mục include
của CUDA Toolkit.lib
của cuDNN vào thư mục lib
của CUDA Toolkit.Khi được hỏi, hãy chọn "Replace the files in the destination".
Môi trường ảo (virtual environment) giống như một "hộp cát" riêng biệt. Nó giúp bạn cài đặt các phiên bản thư viện cụ thể cho một dự án mà không ảnh hưởng đến các dự án khác hay hệ thống chung. Đây là "vị cứu tinh" giúp bạn tránh khỏi các cuộc chiến xung đột phiên bản.
ai_env
và dùng Python 3.10. Gõ lệnh sau và nhấn y
khi được hỏi:
conda create --name ai_env python=3.10
conda activate ai_env
Bạn sẽ thấy (ai_env)
xuất hiện ở đầu dòng lệnh.
Đây là cách làm chống sai sót tốt nhất.
ai_env
). Ví dụ:
conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia
Mở Python trong Anaconda Prompt bằng cách gõ python
. Sau đó nhập các lệnh sau:
import torch
print(f"PyTorch version: {torch.__version__}")
print(f"CUDA available: {torch.cuda.is_available()}")
if torch.cuda.is_available():
print(f"GPU: {torch.cuda.get_device_name(0)}")
Nếu kết quả trả về là CUDA available: True
, xin chúc mừng! Bạn đã cài đặt PyTorch GPU thành công.
Đảm bảo bạn vẫn đang ở trong môi trường ai_env
đã được kích hoạt.
TensorFlow từ phiên bản 2.10 trở đi đã tích hợp sẵn hỗ trợ GPU trong gói pip mặc định.
pip install tensorflow
Vẫn trong Python, nhập các lệnh sau:
import tensorflow as tf
print(f"TensorFlow version: {tf.__version__}")
gpu_devices = tf.config.list_physical_devices('GPU')
print(f"GPU devices found: {len(gpu_devices)}")
if gpu_devices:
print(f"GPU details: {gpu_devices}")
Nếu kết quả trả về danh sách chứa thông tin card đồ họa của bạn, ví dụ [PhysicalDevice(name='/physical_device:GPU:0', device_type='GPU')]
, thì bạn đã cài TensorFlow GPU trên Windows thành công.
Nếu bạn chạy code kiểm tra ở trên và nhận về False
hoặc lỗi, đừng lo lắng. Đây là phần dành cho bạn.
Hãy đi qua checklist gỡ lỗi sau theo thứ tự:
(ai_env)
ở đầu dòng lệnh. Nếu không, hãy chạy conda activate ai_env
..dll
cần thiết của CUDA. Lý do là đường dẫn đến thư mục bin
của CUDA chưa được thêm vào biến môi trường PATH của hệ thống.Path
và nhấp "Edit...".v11.8
bằng phiên bản của bạn):
C:Program FilesNVIDIA GPU Computing ToolkitCUDA11.8in
C:Program FilesNVIDIA GPU Computing ToolkitCUDA11.8libnvvp
Không bắt buộc, bạn có thể dùng venv
của Python. Tuy nhiên, Anaconda/Miniconda được cực kỳ khuyến khích cho người mới bắt đầu vì nó quản lý các gói nhị phân phức tạp (như CUDA, cuDNN) dễ dàng hơn nhiều, giúp giảm thiểu rủi ro xung đột.
Thứ tự không quan trọng, miễn là chúng được cài vào cùng một môi trường ảo đã được kích hoạt (ai_env
trong trường hợp này).
Compute Capability (CC) là một con số (ví dụ: 7.5, 8.6, 9.0) thể hiện thế hệ kiến trúc và khả năng tính toán của GPU. Các phiên bản CUDA và framework mới hơn có thể yêu cầu một mức CC tối thiểu để hoạt động. Bạn có thể tìm CC của GPU của mình trên trang Wikipedia "CUDA" hoặc trang của NVIDIA.
Chúc mừng! Bạn đã đi từ một chiếc PC thông thường đến một cỗ máy sẵn sàng cho Deep Learning, từ việc hiểu rõ vai trò của GPU, CUDA đến việc cài đặt thành công PyTorch và TensorFlow. Đây là một nền tảng cực kỳ vững chắc cho hành trình khám phá AI của bạn.
Hành trình của bạn với AI chỉ mới bắt đầu. Để đi xa hơn, việc sở hữu một cấu hình mạnh mẽ như các dàn PC đồ họa Core i9 sẽ là một lợi thế cực lớn, giúp bạn xử lý những mô hình phức tạp và bộ dữ liệu khổng lồ một cách mượt mà.
Gợi ý các dự án khởi đầu:
Bạn đã cài đặt thành công chưa? Nếu gặp bất kỳ khó khăn nào ở bước nào, hãy để lại bình luận bên dưới. Cộng đồng và đội ngũ Tin Học Anh Phát luôn sẵn sàng hỗ trợ bạn!
WEBSITE ĐƯỢC SỞ HỮU VÀ QUẢN LÝ BỞI NGUYỄN VÕ DUY ANH
Giấy phép đăng ký kinh doanh số 0315129021 do sở Kế Hoạch và Đầu Tư Thành phố Hồ Chí Minh cấp ngày 25/6/2018