Phi-3-mini WebGPU RAG 聊天機器人
使用 Phi-3 Onnx Hosted 模型的 RAG 模式利用了檢索增強生成的方法,結合了 Phi-3 模型的力量和 ONNX 託管的高效 AI 部署。這種模式在調整模型以應對特定領域任務方面非常重要,提供了質量、成本效益和長上下文理解的混合。這是 Azure AI 套件的一部分,提供了易於查找、試用和使用的多種模型,滿足各行業的定制需求。Phi-3 模型,包括 Phi-3-mini、Phi-3-small 和 Phi-3-medium,都可以在 Azure AI 模型目錄中找到,可以自行管理進行微調和部署,也可以通過像 HuggingFace 和 ONNX 這樣的平台展示微軟對可訪問和高效 AI 解決方案的承諾。
WebGPU 是一個現代的網頁圖形 API,旨在提供直接從網頁瀏覽器訪問設備的圖形處理單元 (GPU) 的高效途徑。它是 WebGL 的繼任者,提供了幾個主要改進:
- 兼容現代 GPU:WebGPU 專為現代 GPU 架構設計,利用 Vulkan、Metal 和 Direct3D 12 等系統 API。
- 增強性能:它支持通用 GPU 計算和更快的操作,適合圖形渲染和機器學習任務。
- 高級功能:WebGPU 提供了更多高級 GPU 功能的訪問,支持更複雜和動態的圖形和計算工作負載。
- 減少 JavaScript 工作量:通過將更多任務卸載到 GPU,WebGPU 大大減少了 JavaScript 的工作量,提升了性能和流暢度。
目前,WebGPU 已在 Google Chrome 瀏覽器中支持,並正在擴展到其他平台。
所需環境:
支持的瀏覽器:
- Google Chrome 113+
- Microsoft Edge 113+
- Safari 18 (macOS 15)
- Firefox Nightly.
- 在 Chrome/Microsoft Edge 中
啟用 chrome://flags/#enable-unsafe-webgpu
標誌。
啟動 Google Chrome 或 Microsoft Edge。
在地址欄中輸入 chrome://flags
並按下 Enter。
在頁面頂部的搜索框中輸入 'enable-unsafe-webgpu'。
在結果列表中找到 #enable-unsafe-webgpu 標誌。
點擊旁邊的下拉菜單並選擇 Enabled。
啟用標誌後,需要重啟瀏覽器以使更改生效。點擊頁面底部出現的 Relaunch 按鈕。
- 對於 Linux,用
--enable-features=Vulkan
啟動瀏覽器。 - Safari 18 (macOS 15) 默認啟用 WebGPU。
- 在 Firefox Nightly 中,輸入 about:config 在地址欄並
set dom.webgpu.enabled to true
。
以下是設置高性能 GPU 以便在 Windows 上使用 Microsoft Edge 的步驟:
- 打開設置: 點擊開始菜單並選擇設置。
- 系統設置: 進入系統然後顯示。
- 圖形設置: 向下滾動並點擊圖形設置。
- 選擇應用: 在 “選擇一個應用來設置偏好” 下,選擇桌面應用然後瀏覽。
- 選擇 Edge: 導航到 Edge 安裝文件夾(通常是
C:\Program Files (x86)\Microsoft\Edge\Application
)並選擇msedge.exe
。 - 設置偏好: 點擊選項,選擇高性能,然後點擊保存。 這將確保 Microsoft Edge 使用高性能 GPU 以獲得更好的性能。
- 重啟 計算機以使這些設置生效。
導航到你的 GitHub 存儲庫。 點擊代碼按鈕並選擇打開 Codespaces。
如果你還沒有 Codespace,可以點擊新建 codespace 創建一個。
注意 在你的 codespace 中安裝 Node 環境 從 GitHub Codespace 運行 npm demo 是測試和開發項目的好方法。以下是幫助你開始的步驟指南:
一旦打開 Codespace,確保你已經安裝了 Node.js 和 npm。你可以通過運行以下命令來檢查:
node -v
npm -v
如果沒有安裝,可以通過以下命令安裝:
sudo apt-get update
sudo apt-get install nodejs npm
使用終端導航到 npm 項目所在的目錄:
cd path/to/your/project
運行以下命令來安裝 package.json 文件中列出的所有必要依賴:
npm install
一旦安裝了依賴項,可以運行 demo 腳本。這通常在 package.json 的 scripts 部分中指定。例如,如果你的 demo 腳本名為 start,可以運行:
npm run build
npm run dev
如果你的 demo 涉及到 web 服務器,Codespaces 會提供一個 URL 來訪問它。查找通知或檢查 Ports 標籤來找到 URL。
注意: 模型需要在瀏覽器中緩存,因此可能需要一些時間來加載。
上傳 markdown 文件 intro_rag.md
來完成 RAG 解決方案。如果使用 codespaces,可以下載位於 01.InferencePhi3/docs/
的文件。
點擊“選擇文件”按鈕來選擇你要上傳的文檔。
選擇文件後,點擊“上傳”按鈕來加載你的文檔以進行 RAG(檢索增強生成)。
一旦文檔上傳完畢,可以根據文檔內容使用 RAG 開始聊天會話。
免責聲明:此翻譯由AI模型從原文翻譯而來,可能不完美。請審核輸出並進行任何必要的修正。