香蕉福利视频导航_日韩特一级黄色毛片_精品视频亚洲_精品午夜福利在线观看高清_精品国产AV色一区二区深夜久久_2020最新国产永久在线视频_亚洲成+人综合欧美_歐美午夜視頻一區二區三區

中文
  • 中國大陸 / 中文
  • Global / English

AI 數(shù)據(jù)湖解決方案

破解 AI 海量數(shù)據(jù) “存不起、管不好、用不活” 難題,實現(xiàn)多模態(tài)數(shù)據(jù)全生命周期經(jīng)濟存儲與高效適配
Banner

AI 數(shù)據(jù)湖解決方案

破解 AI 海量數(shù)據(jù) “存不起、管不好、用不活” 難題,實現(xiàn)多模態(tài)數(shù)據(jù)全生命周期經(jīng)濟存儲與高效適配
Banner
企業(yè) AI 數(shù)據(jù)湖落地都面臨哪些核心挑戰(zhàn)?
容量與成本的平衡之困
海量訓(xùn)練數(shù)據(jù)導(dǎo)致存儲容量需求激增,全閃存方案成本高昂。而AI數(shù)據(jù)生命周期中超過90%為溫冷數(shù)據(jù),與熱數(shù)據(jù)無差別存儲,造成巨大的資源浪費和成本壓力。
容量與成本的平衡之困
效率與協(xié)同的流程之痛
數(shù)據(jù)、算力、應(yīng)用孤島林立,跨團(tuán)隊協(xié)作效率低下。數(shù)據(jù)在不同存儲系統(tǒng)間遷移拷貝費時費力,管理復(fù)雜,嚴(yán)重拖慢模型迭代速度,AI數(shù)據(jù)資產(chǎn)難以統(tǒng)一管理和復(fù)用。
效率與協(xié)同的流程之痛
性能與可靠性的規(guī)模之殤
數(shù)據(jù)、算力、應(yīng)用孤島林立,跨團(tuán)隊協(xié)作效率低下。數(shù)據(jù)在不同存儲系統(tǒng)間遷移拷貝費時費力,管理復(fù)雜,嚴(yán)重拖慢模型迭代速度,AI數(shù)據(jù)資產(chǎn)難以統(tǒng)一管理和復(fù)用。
性能與可靠性的規(guī)模之殤
構(gòu)建以對象存儲為基座的 AI 數(shù)據(jù)湖
為應(yīng)對上述挑戰(zhàn),我們提出以“對象存儲”為底座,構(gòu)建“AI 統(tǒng)一數(shù)據(jù)湖”的創(chuàng)新解決方案,其核心架構(gòu)包含兩大層次:

XEOS AI 數(shù)據(jù)湖

以 XSKY 企業(yè)級對象存儲 XEOS 為核心,構(gòu)建 AI 全流程統(tǒng)一的數(shù)據(jù)湖。它作為整個方案的“數(shù)據(jù)真理之源”,為上層提供海量、經(jīng)濟、高可靠的數(shù)據(jù)基石。

高性能緩存層

這是一個部署在近 GPU 計算側(cè)的分布式、高性能緩存加速層。它與底層對象存儲協(xié)同工作,是其面向高性能應(yīng)用的核心加速引擎。詳情請參閱 AI 訓(xùn)練推理解決方案 和 RAG 解決方案
XEOS AI 數(shù)據(jù)湖
高性能緩存層

XEOS AI 數(shù)據(jù)湖

以 XSKY 企業(yè)級對象存儲 XEOS 為核心,構(gòu)建 AI 全流程統(tǒng)一的數(shù)據(jù)湖。它作為整個方案的“數(shù)據(jù)真理之源”,為上層提供海量、經(jīng)濟、高可靠的數(shù)據(jù)基石。
XEOS AI 數(shù)據(jù)湖

高性能緩存層

這是一個部署在近 GPU 計算側(cè)的分布式、高性能緩存加速層。它與底層對象存儲協(xié)同工作,是其面向高性能應(yīng)用的核心加速引擎。詳情請參閱 AI 訓(xùn)練推理解決方案 和 RAG 解決方案
高性能緩存層
主要特點
智能分層的統(tǒng)一底座
統(tǒng)一數(shù)據(jù)底座
統(tǒng)一數(shù)據(jù)底座
將 AI 全流程的原始數(shù)據(jù)、數(shù)據(jù)集和模型等核心資產(chǎn),統(tǒng)一納管于一個標(biāo)準(zhǔn) S3 協(xié)議的資源池中,徹底消除數(shù)據(jù)孤島。
統(tǒng)一數(shù)據(jù)底座
統(tǒng)一數(shù)據(jù)底座
將 AI 全流程的原始數(shù)據(jù)、數(shù)據(jù)集和模型等核心資產(chǎn),統(tǒng)一納管于一個標(biāo)準(zhǔn) S3 協(xié)議的資源池中,徹底消除數(shù)據(jù)孤島。
統(tǒng)一數(shù)據(jù)底座
統(tǒng)一數(shù)據(jù)底座
將 AI 全流程的原始數(shù)據(jù)、數(shù)據(jù)集和模型等核心資產(chǎn),統(tǒng)一納管于一個標(biāo)準(zhǔn) S3 協(xié)議的資源池中,徹底消除數(shù)據(jù)孤島。
海量彈性擴展
海量彈性擴展
架構(gòu)支持從 TB 級平滑擴展至 EB 級,可通過整池擴容等技術(shù)實現(xiàn)業(yè)務(wù)無感知的在線擴展。
海量彈性擴展
海量彈性擴展
架構(gòu)支持從 TB 級平滑擴展至 EB 級,可通過整池擴容等技術(shù)實現(xiàn)業(yè)務(wù)無感知的在線擴展。
海量彈性擴展
海量彈性擴展
架構(gòu)支持從 TB 級平滑擴展至 EB 級,可通過整池擴容等技術(shù)實現(xiàn)業(yè)務(wù)無感知的在線擴展。
金融級可靠性
金融級可靠性
采用 EC 糾刪碼及亞健康智能防護(hù)等技術(shù),在保障數(shù)據(jù)持久性的同時,為寶貴的AI資產(chǎn)提供金融級的服務(wù)高可用與安全保護(hù)。
金融級可靠性
金融級可靠性
采用 EC 糾刪碼及亞健康智能防護(hù)等技術(shù),在保障數(shù)據(jù)持久性的同時,為寶貴的AI資產(chǎn)提供金融級的服務(wù)高可用與安全保護(hù)。
金融級可靠性
金融級可靠性
采用 EC 糾刪碼及亞健康智能防護(hù)等技術(shù),在保障數(shù)據(jù)持久性的同時,為寶貴的AI資產(chǎn)提供金融級的服務(wù)高可用與安全保護(hù)。
成本效益優(yōu)化
成本效益優(yōu)化
通過強大的智能分級存儲策略,自動優(yōu)化數(shù)據(jù)的存放成本。
成本效益優(yōu)化
成本效益優(yōu)化
通過強大的智能分級存儲策略,自動優(yōu)化數(shù)據(jù)的存放成本。
成本效益優(yōu)化
成本效益優(yōu)化
通過強大的智能分級存儲策略,自動優(yōu)化數(shù)據(jù)的存放成本。
創(chuàng)新性的分層能力
創(chuàng)新性的分層能力
基于"最后訪問時間(atime)"的生命周期策略,只有真正"無人問津"的冷數(shù)據(jù)才會被流動到低成本存儲池。
創(chuàng)新性的分層能力
創(chuàng)新性的分層能力
基于"最后訪問時間(atime)"的生命周期策略,只有真正"無人問津"的冷數(shù)據(jù)才會被流動到低成本存儲池。
創(chuàng)新性的分層能力
創(chuàng)新性的分層能力
基于"最后訪問時間(atime)"的生命周期策略,只有真正"無人問津"的冷數(shù)據(jù)才會被流動到低成本存儲池。
多源數(shù)據(jù)接入網(wǎng)關(guān)
多源一鍵接入
多源一鍵接入
內(nèi)置豐富連接器,可直接對接 NFS 服務(wù)器、本地硬盤、飛書 / 釘釘協(xié)同平臺、工業(yè)傳感器等 10 + 類數(shù)據(jù)源,無需額外開發(fā)即可實現(xiàn)數(shù)據(jù) "一鍵入湖"。
多源一鍵接入
多源一鍵接入
內(nèi)置豐富連接器,可直接對接 NFS 服務(wù)器、本地硬盤、飛書 / 釘釘協(xié)同平臺、工業(yè)傳感器等 10 + 類數(shù)據(jù)源,無需額外開發(fā)即可實現(xiàn)數(shù)據(jù) "一鍵入湖"。
多源一鍵接入
多源一鍵接入
內(nèi)置豐富連接器,可直接對接 NFS 服務(wù)器、本地硬盤、飛書 / 釘釘協(xié)同平臺、工業(yè)傳感器等 10 + 類數(shù)據(jù)源,無需額外開發(fā)即可實現(xiàn)數(shù)據(jù) "一鍵入湖"。
靈活的同步模式
靈活的同步模式
支持?jǐn)?shù)據(jù)增量同步與全量同步兩種模式:增量同步僅傳輸新增 / 修改數(shù)據(jù),減少帶寬占用;全量同步適用于初次數(shù)據(jù)遷移場景,確保數(shù)據(jù)完整性。
靈活的同步模式
靈活的同步模式
支持?jǐn)?shù)據(jù)增量同步與全量同步兩種模式:增量同步僅傳輸新增 / 修改數(shù)據(jù),減少帶寬占用;全量同步適用于初次數(shù)據(jù)遷移場景,確保數(shù)據(jù)完整性。
靈活的同步模式
靈活的同步模式
支持?jǐn)?shù)據(jù)增量同步與全量同步兩種模式:增量同步僅傳輸新增 / 修改數(shù)據(jù),減少帶寬占用;全量同步適用于初次數(shù)據(jù)遷移場景,確保數(shù)據(jù)完整性。
數(shù)據(jù)一致性校驗
數(shù)據(jù)一致性校驗
內(nèi)置數(shù)據(jù)校驗機制,同步后自動比對源數(shù)據(jù)與湖內(nèi)數(shù)據(jù)一致性,避免 "數(shù)據(jù)丟失或損壞"。
數(shù)據(jù)一致性校驗
數(shù)據(jù)一致性校驗
內(nèi)置數(shù)據(jù)校驗機制,同步后自動比對源數(shù)據(jù)與湖內(nèi)數(shù)據(jù)一致性,避免 "數(shù)據(jù)丟失或損壞"。
數(shù)據(jù)一致性校驗
數(shù)據(jù)一致性校驗
內(nèi)置數(shù)據(jù)校驗機制,同步后自動比對源數(shù)據(jù)與湖內(nèi)數(shù)據(jù)一致性,避免 "數(shù)據(jù)丟失或損壞"。
多模態(tài)數(shù)據(jù)管理模塊
多模態(tài)數(shù)據(jù)原生解析
多模態(tài)數(shù)據(jù)原生解析
支持對視頻(MP4 / AVI)、音頻(MP3 / WAV)、文本(TXT / PDF)、圖像(JPG / PNG)、工業(yè)傳感器數(shù)據(jù)(JSON / CSV)等多模態(tài)數(shù)據(jù)的原生解析與元數(shù)據(jù)提取。
多模態(tài)數(shù)據(jù)原生解析
多模態(tài)數(shù)據(jù)原生解析
支持對視頻(MP4 / AVI)、音頻(MP3 / WAV)、文本(TXT / PDF)、圖像(JPG / PNG)、工業(yè)傳感器數(shù)據(jù)(JSON / CSV)等多模態(tài)數(shù)據(jù)的原生解析與元數(shù)據(jù)提取。
多模態(tài)數(shù)據(jù)原生解析
多模態(tài)數(shù)據(jù)原生解析
支持對視頻(MP4 / AVI)、音頻(MP3 / WAV)、文本(TXT / PDF)、圖像(JPG / PNG)、工業(yè)傳感器數(shù)據(jù)(JSON / CSV)等多模態(tài)數(shù)據(jù)的原生解析與元數(shù)據(jù)提取。
元數(shù)據(jù)快速檢索
元數(shù)據(jù)快速檢索
提供基于元數(shù)據(jù)的快速檢索功能,可按 "數(shù)據(jù)類型、創(chuàng)建時間、業(yè)務(wù)標(biāo)簽" 等維度篩選數(shù)據(jù),解決 AI 場景下 "海量數(shù)據(jù)找得慢" 問題。
元數(shù)據(jù)快速檢索
元數(shù)據(jù)快速檢索
提供基于元數(shù)據(jù)的快速檢索功能,可按 "數(shù)據(jù)類型、創(chuàng)建時間、業(yè)務(wù)標(biāo)簽" 等維度篩選數(shù)據(jù),解決 AI 場景下 "海量數(shù)據(jù)找得慢" 問題。
元數(shù)據(jù)快速檢索
元數(shù)據(jù)快速檢索
提供基于元數(shù)據(jù)的快速檢索功能,可按 "數(shù)據(jù)類型、創(chuàng)建時間、業(yè)務(wù)標(biāo)簽" 等維度篩選數(shù)據(jù),解決 AI 場景下 "海量數(shù)據(jù)找得慢" 問題。
精細(xì)化權(quán)限管控
精細(xì)化權(quán)限管控
可按 "用戶 / 租戶 / 業(yè)務(wù)線" 設(shè)置數(shù)據(jù)訪問權(quán)限,滿足多團(tuán)隊協(xié)作或多租戶場景下的數(shù)據(jù)安全需求。
精細(xì)化權(quán)限管控
精細(xì)化權(quán)限管控
可按 "用戶 / 租戶 / 業(yè)務(wù)線" 設(shè)置數(shù)據(jù)訪問權(quán)限,滿足多團(tuán)隊協(xié)作或多租戶場景下的數(shù)據(jù)安全需求。
精細(xì)化權(quán)限管控
精細(xì)化權(quán)限管控
可按 "用戶 / 租戶 / 業(yè)務(wù)線" 設(shè)置數(shù)據(jù)訪問權(quán)限,滿足多團(tuán)隊協(xié)作或多租戶場景下的數(shù)據(jù)安全需求。
方案優(yōu)勢
TB/s 級對象讀寫帶寬
得益于 XEOS 強大的性能和擴展性,當(dāng)萬卡集群并發(fā)工作時,整個存儲系統(tǒng)可以提供 TB/s 級別的聚合讀寫帶寬。這意味著,即便是面對數(shù)萬億 Token 的超大規(guī)模數(shù)據(jù)集,或是數(shù) TB 的模型 Checkpoint 文件,也能瞬時完成讀寫,將 GPU 的等待時間降至最低。
TB/s 級對象讀寫帶寬TB/s 級對象讀寫帶寬
統(tǒng)一數(shù)據(jù)湖
通過為對象存儲賦予標(biāo)準(zhǔn)的 POSIX 和 S3 跨協(xié)議訪問能力,實現(xiàn)了"一套數(shù)據(jù),多種應(yīng)用"。數(shù)據(jù)采集和清洗團(tuán)隊可以通過 S3 接口進(jìn)行數(shù)據(jù)探索,AI 工程師可以通過 POSIX 接口進(jìn)行模型訓(xùn)練,無需在不同存儲系統(tǒng)間進(jìn)行耗時且易錯的數(shù)據(jù)拷貝,極大提升了跨團(tuán)隊協(xié)作效率和數(shù)據(jù)流轉(zhuǎn)速度。
統(tǒng)一數(shù)據(jù)湖統(tǒng)一數(shù)據(jù)湖
性能與成本兼顧
無需將所有數(shù)據(jù)都存放在昂貴的高性能存儲上,僅需為熱數(shù)據(jù)集(通常占總數(shù)據(jù)量的 1%-10%)配置全閃存資源,而 90%以上的海量數(shù)據(jù)則可存于極具成本效益的混閃存儲中。據(jù)測算,可將整體存儲 TCO 降低 70% 以上,同時獲得不輸于全閃存陣列的性能體驗。
性能與成本兼顧性能與成本兼顧
海量大規(guī)模能力
久經(jīng) 3000 多家金融等行業(yè)客戶的嚴(yán)苛生產(chǎn)驗證,XEOS 的穩(wěn)定性堅如磐石。其亞健康智能防護(hù)體系,能主動隔離慢盤、故障網(wǎng)絡(luò)等隱患,杜絕因局部問題引發(fā)的全局風(fēng)險,確保大規(guī)模集群 7x24 小時持續(xù)高性能運行。
海量大規(guī)模能力海量大規(guī)模能力
對接多種高性能緩存的靈活性
支持對接并行文件系統(tǒng)、JuiceFS、Alluxio 等多種高性能緩存。
對接多種高性能緩存的靈活性對接多種高性能緩存的靈活性
客戶實踐

XEOS 數(shù)據(jù)湖支撐 5Tbps 訓(xùn)練業(yè)務(wù),讓數(shù)據(jù) " 按需 " 流動,為性能 " 自動 " 加速

挑戰(zhàn)

挑戰(zhàn)

在進(jìn)行萬億參數(shù)模型訓(xùn)練時,頻繁的 Checkpoint 寫入耗時過長(超過 30 分鐘),導(dǎo)致訓(xùn)練中斷恢復(fù)成本高昂,且海量訓(xùn)練語料(數(shù)億小文件)的讀取效率低下,GPU 平均利用率不足 50%。

收益

收益

采用本方案后,Checkpoint 寫入時間縮短至 3 分鐘內(nèi),GPU 平均利用率提升至 90%以上,整體模型訓(xùn)練周期縮短了 40%。

了解更多了解更多

以對象存儲構(gòu)建統(tǒng)一數(shù)據(jù)湖,讓數(shù)百GPU算力從等待中釋放

挑戰(zhàn)

挑戰(zhàn)

國家級大模型實驗室,多個實驗組數(shù)據(jù)散落于不同 NFS,管理混亂。當(dāng)集群擴展至數(shù)百 GPU 時,傳統(tǒng) NFS 在處理海量小文件和 TB 級模型斷點時性能嚴(yán)重不足,導(dǎo)致 GPU 算力閑置。

收益

收益

采用本方案后,所有科研數(shù)據(jù)統(tǒng)一到對象存儲數(shù)據(jù)湖。高性能 POSIX 接口將數(shù)據(jù)集加載速度提升 10 倍,TB 級斷點保存從"小時級"縮至"分鐘級",極大加速了大模型的研發(fā)迭代進(jìn)程。

XEOS 數(shù)據(jù)湖以彈性分層架構(gòu),應(yīng)對 4 個月 20PB 數(shù)據(jù)增長,訓(xùn)練效率提升 300%

挑戰(zhàn)

挑戰(zhàn)

作為公共算力服務(wù)平臺,需要同時為眾多不同類型的租戶提供服務(wù),租戶應(yīng)用和數(shù)據(jù)類型多樣,對存儲的性能、成本和安全性要求各不相同。

收益

收益

部署本方案后,以統(tǒng)一的對象存儲作為后端,通過邏輯隔離和緩存策略,為不同租戶提供了兼具高性能和經(jīng)濟性的"按需分配"的數(shù)據(jù)存儲服務(wù)。簡化了運維管理,提升了平臺的整體服務(wù)能力和商業(yè)競爭力。

了解更多了解更多
數(shù)據(jù)常青,智領(lǐng)未來
即刻申請,獲 30 天免費使用
在線咨詢
快速響應(yīng)您的問題
工作日: 9:00 ~ 18:00
官方微信