Phi-3 硬體支援

Microsoft Phi-3 已針對 ONNX Runtime 進行優化，並支援 Windows DirectML。它在各種硬體類型上運行良好，包括 GPU、CPU，甚至是行動裝置。

具體來說，支援的硬體包括：

CUDA: NVIDIA GPU with Compute Capability >= 7.02

目前可用的 Phi-3 ONNX 模型僅適用於 1 個 GPU。Phi-3 模型有可能支援多 GPU，但使用 2 個 GPU 的 ORT 並不保證會比 2 個 ORT 實例提供更高的吞吐量。

在 Build 2024 the GenAI ONNX Team 宣布他們已經為 Phi 模型啟用了多實例而不是多 GPU。

目前這允許你使用 CUDA_VISIBLE_DEVICES 環境變數來執行一個 onnnxruntime 或 onnxruntime-genai 實例，如下所示。

CUDA_VISIBLE_DEVICES=0 python infer.py
CUDA_VISIBLE_DEVICES=1 python infer.py

隨時在 Azure AI Studio 進一步探索 Phi-3。

Provide feedback