跳转至

首頁儀表板

首頁儀表板是您的起點——即時顯示 GPU 可用性、資源使用量、運行中的任務及近期平台活動。

適用對象: 所有已登入的使用者。


儀表板布局

graph TD
    subgraph 頂部區域["頂部區域"]
        A["GPU 可用性卡片\n(叢集級 GPU 單位)"]
        B["專案摘要\n(活躍專案數)"]
    end
    subgraph 中間區域["中間區域"]
        C["資源使用圖表\n(配額使用 vs. 已分配)"]
        D["活動紀錄\n(近期平台事件)"]
    end
    subgraph 底部區域["底部區域"]
        E["我的 GPU 任務\n(運行中的工作區和任務)"]
    end
    頂部區域 --> 中間區域 --> 底部區域

元件說明

元件 顯示內容 更新時機
GPU 可用性卡片 叢集所有節點中可用與已分配的 GPU 單位 頁面載入時,之後每 10 秒更新
各節點 GPU 配置狀態 每個 GPU 節點的實體 GPU、SM 剩餘比例與忙碌狀態 頁面載入時,之後每 10 秒更新
專案摘要 您所屬的專案總數 頁面載入時,之後每 10 秒更新
資源使用圖表 各專案 GPU/CPU/記憶體配額消耗、總分配量與計畫時段狀態 頁面載入時,之後每 10 秒更新;倒數每秒更新
活動紀錄 近期平台事件的時序日誌(工作區啟動、專案變更、儲存操作) 頁面載入時,之後每 10 秒更新
我的 GPU 任務 您目前運行中的工作區和批次任務,含 GPU、SM 比例與狀態 頁面載入時,之後每 15 秒更新

閱讀 GPU 可用性

GPU 可用性卡片 顯示叢集 GPU 資源池的即時狀態。

首頁儀表板 GPU 可用性卡片 圖 1:首頁儀表板,顯示 GPU 可用性、資源使用量和運行中的任務。請以實際截圖取代此預留圖片。

閱讀 GPU 卡片的步驟:

  1. 查看 已分配 / 總數 比例(如:6 / 8 GPUs)。
  2. 可用 GPU = 總數 − 已分配。若可用為 0,您的工作區啟動將排入佇列等待。
  3. 卡片同時會顯示 可被搶佔的佇列 數量——當 GPU 已用完但仍有可被搶佔的佇列時,較高優先序的工作仍可透過驅逐低優先序 Pod 取得資源。
  4. 點擊卡片可導覽至管理監控頁面(僅限管理員)查看各節點細節。

DRA 有效 GPU 單位

卡片會依 DRA 標籤與 live ResourceClaim binding 顯示有效 GPU 單位。例如 1 張 GPU 搭配 50% SM,只有在 DRA 綁定到 live Pod 時才會在配額與可用性檢視中計為 0.5 GPU。


各節點 GPU 配置狀態

GPU 可用性卡片下方的 各節點 GPU 配置狀態 網格,會把每個 GPU 節點以小卡片呈現:

  • 節點名稱與 GPU 型號
  • 各裝置的 SM 剩餘比例({{pct}}% 剩餘)長條
  • Available / Busy 標籤,方便挑選目前較空閒的型號
  • 該節點的 GPU 總數

送出工作前先看這個網格,可以快速判斷哪些型號還有空、或確認某節點是否還有容量接受 fractional claim。


資源使用圖表

圖表顯示您所屬所有專案的使用量。

  • 每個長條代表一個專案。
  • 長條的填充量顯示已消耗的配額(GPU 時數、CPU 時數或記憶體)。
  • 每個專案列會顯示綁定資源計畫目前是全天候啟用、即將關閉、即將開啟或已過期。
  • 計畫時段倒數每秒更新,不需要重新整理頁面。

活動紀錄

活動紀錄顯示最近 20 筆與您相關的事件:

  • 工作區啟動 / 停止 / 刪除
  • 專案新增成員
  • 儲存權限變更
  • 申請狀態更新

點擊任何活動項目可直接導覽至相關資源。


我的 GPU 任務

我的 GPU 任務 表格列出您的活躍工作區和批次任務:

欄位 說明
名稱 任務 / 工作區名稱
專案 所屬專案
GPU 消耗的 GPU 數量
狀態 運行中、等待中、已停止、錯誤
開始時間 啟動時間戳記
操作 停止 / 開啟連結

點擊運行中工作區旁的 開啟 按鈕,即可在新分頁中開啟 IDE。

從任務導覽至專案

在任務表格中點擊專案名稱,可跳轉至專案詳情頁面查看配額和設定檔。


常見問題

為什麼 GPU 可用性卡片顯示為 0?

卡片顯示的是 DRA 有效 GPU 可用量。若相容 GPU 或 SM 比例都已分配,會顯示 0。查看活動紀錄——最近完成的工作區可能在一分鐘內釋放容量。

活動紀錄是空的——是否有問題?

不是。新帳號若沒有任何專案活動,紀錄會是空的。建立專案或啟動工作區後就會出現事件。

我運行中的工作區沒有出現在任務表格中。

表格每 15 秒更新一次。若下一次輪詢後仍未出現,請重新整理頁面(F5 或瀏覽器重新整理按鈕)。