近期,以“數(shù)聚產(chǎn)業(yè)動能智啟發(fā)展新篇”為主題的中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會在貴陽圓滿落幕。大會公布了多個高質(zhì)量數(shù)據(jù)集建設(shè)相關(guān)的重要成員單位名單,中國移動成功入選第一批國家標準/技術(shù)文件驗證試點單位,并入選中國信息協(xié)會數(shù)據(jù)標注專業(yè)委員會副主任單位、高質(zhì)量數(shù)據(jù)集領(lǐng)航計劃代表單位。同時,大會發(fā)布了高質(zhì)量數(shù)據(jù)集的一系列關(guān)鍵建設(shè)成果并啟動高質(zhì)量數(shù)據(jù)集建設(shè)先行先試工作,中國移動成功上榜6個高質(zhì)量數(shù)據(jù)集典型案例、獲批2個高質(zhì)量數(shù)據(jù)集建設(shè)先行先試項目,充分彰顯了中國移動在高質(zhì)量數(shù)據(jù)集建設(shè)領(lǐng)域的領(lǐng)軍地位。

在此次國家數(shù)據(jù)局公布的首批104個具備高水平推廣示范價值的數(shù)據(jù)集典型案例中,中國移動入選了6個案例,覆蓋商務(wù)、公共服務(wù)與城市治理、低空經(jīng)濟、智能駕駛、文化旅游、研發(fā)創(chuàng)新等多個重要領(lǐng)域。這些案例不僅體現(xiàn)了技術(shù)的前瞻性,更具備極高的產(chǎn)業(yè)推廣價值和實踐示范意義:
在商務(wù)領(lǐng)域,中國移動構(gòu)建了涵蓋治理架構(gòu)、標注產(chǎn)能、平臺集群全方位能力的“數(shù)據(jù)飛輪”體系,形成涵蓋226 個通用數(shù)據(jù)集與 151 個行業(yè)數(shù)據(jù)集的“數(shù)據(jù)飛輪體系打造行業(yè)高質(zhì)量數(shù)據(jù)集”,有力支撐了中國移動九天系列通專大模型研發(fā)。當前,“數(shù)據(jù)飛輪”體系產(chǎn)生的數(shù)據(jù)集已賦能客服、政務(wù)、工業(yè)安監(jiān)、辦公、營銷、出行、審計等各類場景應(yīng)用充分激活數(shù)據(jù)資產(chǎn)價值,在經(jīng)濟效益和社會效益方面成效顯著。
在公共服務(wù)領(lǐng)域,針對原始信令數(shù)據(jù)質(zhì)量低、語義缺失、開發(fā)利用不足等痛點,中國移動打造“人時空三元組高質(zhì)量數(shù)據(jù)集”,將其應(yīng)用于出行大模型,以及交通、應(yīng)急、文旅等行業(yè)相關(guān)下游任務(wù)推理。該數(shù)據(jù)集將數(shù)據(jù)完整度提升至100%,線路擬合精度提升至90%,標注自動化程度提升至70%以上。當前,相關(guān)出行分析能力已在北京、上海、東莞等城市用于對城市出行人群、外賣員、快遞員、網(wǎng)約車司機等人群進行精準識別,為交通規(guī)劃、出行管理決策、就業(yè)分析等需求提供精準支撐。
在低空經(jīng)濟領(lǐng)域,為切實解決港口監(jiān)管、漁業(yè)執(zhí)法及生態(tài)自然保護領(lǐng)域?qū)χ悄芑O(jiān)管的迫切需求,中國移動通過整合多源低空數(shù)據(jù),研發(fā)智能標注技術(shù),構(gòu)建“采集-標注-管理”全鏈條閉環(huán)體系,打造“低空經(jīng)濟領(lǐng)域高質(zhì)量數(shù)據(jù)集”,構(gòu)建20,000+ 高質(zhì)量低空圖像樣本,覆蓋50余種多維目標類別,相較傳統(tǒng)人工標注效率提高超過300%,模型開發(fā)周期從數(shù)月縮短至2周內(nèi),助力低空算法研發(fā)成本大幅度降低。同時,依托該方案實現(xiàn)對海上違規(guī)捕撈、河道污染、基礎(chǔ)設(shè)施等目標的識別與預(yù)警,為多個國家級和省級自然保護地的監(jiān)測、土地資源管理、生態(tài)保護、災(zāi)害評估和應(yīng)急救援提供數(shù)據(jù)支撐和決策支持。
在智能駕駛領(lǐng)域,中國移動緊密圍繞城市治理與智能駕駛的核心需求,成功構(gòu)建了“通導融合的高質(zhì)量人車物時空行為與狀態(tài)數(shù)據(jù)集”。該數(shù)據(jù)集依托中國移動自研的高精度時空信息云服務(wù)系統(tǒng),融合厘米級定位技術(shù)與脫敏處理后的人、車、物軌跡及圖像視頻數(shù)據(jù),構(gòu)建出標準化、易復(fù)用的高質(zhì)量時空行為與狀態(tài)數(shù)據(jù)集,有效攻克了車路協(xié)同應(yīng)用中的關(guān)鍵數(shù)據(jù)瓶頸。目前,該數(shù)據(jù)集已廣泛應(yīng)用于城市治理、交通優(yōu)化、智能駕駛、低空經(jīng)濟及智慧農(nóng)業(yè)等多個跨行業(yè)應(yīng)用,為相關(guān)領(lǐng)域的數(shù)字化升級提供堅實數(shù)據(jù)支撐。
在文化旅游領(lǐng)域,中國移動依托自研多模態(tài)數(shù)據(jù)處理工具鏈,并引入行業(yè)專家協(xié)同完成數(shù)據(jù)標注,成功構(gòu)建“文體文旅高質(zhì)量數(shù)據(jù)集”。以此為基礎(chǔ),訓練出專用于文體文旅行業(yè)的大模型,賦能多項創(chuàng)新應(yīng)用。基于該大模型研發(fā)的AI智能解說系統(tǒng),在咪咕視頻應(yīng)用中累計為1432場直播賽事提供精準、智能的實時解說服務(wù);同時,依托大模型強大的內(nèi)容生成能力,開發(fā)出AI文旅定制游助手,當前已成功部署于國資委“和美鄉(xiāng)途”項目及全運會虛擬空間智能助手應(yīng)用,有效提升了用戶體驗和服務(wù)智能化水平。
在研發(fā)創(chuàng)新領(lǐng)域,為進一步提升研發(fā)大模型在研發(fā)測試場景的性能,滿足生產(chǎn)實際需求,中國移動構(gòu)建“數(shù)據(jù)采集-數(shù)據(jù)處理-數(shù)據(jù)質(zhì)量評估”高質(zhì)量數(shù)據(jù)處理引擎,形成研發(fā)大模型數(shù)據(jù)集,并據(jù)此訓練出具備代碼補全、單元測試等能力的研發(fā)大模型,支撐研發(fā)全流程賦能需求。
此外,在國家數(shù)據(jù)局啟動的高質(zhì)量數(shù)據(jù)集建設(shè)先行先試工作中,中國移動兩個項目入選首批名單。其中,“中國移動以‘四試’驅(qū)動體系化、工程化、場景化行業(yè)高質(zhì)量數(shù)據(jù)集建設(shè)先行路徑”項目,致力于通過技術(shù)融合提升數(shù)據(jù)生產(chǎn)效率,以場景支持賦能行業(yè)應(yīng)用,以標準驗證推動規(guī)范制定,以機制建設(shè)構(gòu)建開放共享的治理框架,全面支撐行業(yè)數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)與服務(wù)創(chuàng)新。“喀斯特地貌下智能煤礦行業(yè)高質(zhì)量數(shù)據(jù)集”項目,圍繞“1張專網(wǎng)+1個平臺+N應(yīng)用+AI”整體架構(gòu),針對煤礦智能化中數(shù)據(jù)、模型與決策割裂的核心痛點,聚焦數(shù)據(jù)資產(chǎn)化、生產(chǎn)智能與決策精準化,形成可復(fù)制的智能礦山解決方案及高質(zhì)量多模態(tài)數(shù)據(jù)集,助力能源行業(yè)數(shù)智化升級和產(chǎn)業(yè)鏈融合發(fā)展。
未來,中國移動將持續(xù)為國家高質(zhì)量數(shù)據(jù)集的發(fā)展貢獻力量,與各方攜手共同推動高質(zhì)量數(shù)據(jù)集建設(shè),為人工智能產(chǎn)業(yè)發(fā)展注入更多動能。