Cloudera亞太地區高級副總裁 林萬發
機器學習(ML)和生成式AI在提升生產力和推動創新等方面的潛力已毋庸置疑。然而,一些還未解決的基礎數據問題正阻礙企業把握這一機遇。Gartner預測,由于數據質量低下等因素,至少30%的生成式AI項目將被放棄。
隨著數據量激增,新的數據源不斷涌現,企業越來越難以從分散在云端、邊緣計算、數據中心、大型主機和終端設備的關鍵信息中挖掘價值。
IT領導者對此深有同感。Cloudera《2024年企業AI和現代數據架構現狀》調查顯示,73%的受訪者承認其企業內部存在數據孤島,甚至有超過半數的受訪者十分抗拒訪問公司的所有數據。缺乏可信的數據,企業就無法及時獲得準確的洞察。
事實上,受訪的其他部門領導者也證實了這一觀點。許多人表示,由于數據基礎薄弱,他們難以證明AI或生成式AI的投資回報率。根據埃森哲《2025中國企業數字化轉型指數》調查顯示,盡管很多中國企業已開始全面擁抱AI,但只有21%的企業能夠以較快速度實現大規模AI落地,僅9%的企業通過生成式AI實現顯著價值轉化。與此相呼應,Cloudera發布的《企業AI智能體的未來》報告顯示,不清晰的投資回報率(ROI)是阻礙AI智能體落地的主要障礙,其中67%的中國受訪者表示,業務價值和ROI不明確是其所在組織尚未采用AI智能體的首要原因。
為充分釋放AI的價值,企業首先需要夯實數據基礎,確保數據的質量、可訪問性和可靠性,從而使AI投資轉化為可衡量的業務價值。
數據平臺應以業務而非IT為中心
未被使用的數據通常質量低下,且往往來自于舊系統和過時流程。大多數企業仍在使用傳統IT平臺和數據管理框架,它們的設計初衷是為了適應模擬技術時代或云時代前的業務環境。這些陳舊系統既無法跟上當前數據產生的驚人速度,也難以應對日益復雜的數據集,更不具備實時分析和彈性擴展的能力,最終可能導致關鍵決策的速度和靈活性大打折扣。
確保數據可靠性和AI就緒性的唯一途徑是采用現代化的混合數據架構。這種架構能夠幫助企業簡化數據訪問、實現數據結構化,并提煉出可操作的業務洞察。
在部署強大的數據平臺時,應以業務為中心,而非IT,因為平臺需要滿足數據訪問、安全性、成本效率等多項戰略企業需求。
滿足關鍵業務需求
大多數企業所處的多云、混合環境進一步加劇了識別數據集的復雜性。數據和工作負載在本地與公有云中的分布動態變化,也使得實時訪問和識別數據的難度增加。僅過去一年,我們就觀察到許多企業出于安全或成本考慮,將工作負載回遷至私有云。混合數據平臺簡化了這一過程,使企業能夠輕松地將數據集跨環境遷移,同時不再需要重新編寫數據管理和分析應用,大幅降低了運營復雜度。
現代數據架構的另一個關鍵特征是具備可解析非結構化數據的分析工具。根據《Gartner 2022年存儲戰略路線圖》的預測,新形式的非結構化數據每年將增長30%至60%,這些數據可轉化為實際業務價值。例如,零售商在社交媒體渠道、電商網站及合作伙伴渠道的海量用戶評價和反饋,經過深度分析可以轉化為提升流量、提高評分和優化客戶體驗的寶貴洞察。
在成本效率方面,混合數據平臺賦予企業彈性擴展的能力,既能支持業務擴張和新市場開拓,又能確保在滿足增長需求的同時,避免性能損耗和成本浪費。
此外,由于數據安全與合規性已成為影響業務成敗的關鍵因素,內置安全治理機制的混合數據管理平臺已成為剛需。通過加密、訪問控制和審計等功能,企業能夠有效保護敏感數據,降低泄露風險,這對金融服務等強監管行業尤為重要。
穩固企業數據基礎
以印度尼西亞OCBC NISP銀行為例,這家上市公司面臨著數字化挑戰,需要在激烈的競爭環境中確立數字化優勢。為充分挖掘生成式AI解決方案的巨大潛力,該行設計并落實了一項完美契合其數據湖的混合數據策略,使數據科學家和企業用戶能夠高效使用各種集成應用。
印度尼西亞OCBC NISP銀行以該混合數據平臺為核心基礎,構建了一個帶有生成式AI項目工具和框架的可擴展基礎設施,能夠為客戶提供基于Transformer架構的實時智能個性化推薦AI模型。憑借這一強大而靈活的基礎設施,該行實現了AI與企業的大規模整合,更好地推動了客戶創新并提高了監管報告效率。
分析、機器學習、AI和生成式AI為企業提高創新力、生產力、成本效率且保持市場競爭力提供了更多可能。但要實現這些目標,企業需要建立堅實的數據基礎,填補當前數據管理方面的缺口。強大的數據治理不再只是IT部門的責任,而是需要管理層直接關注的戰略要務。