AI訓練數(shù)據(jù)服務(wù)商海天瑞聲(688787)日前舉辦2025年半年度業(yè)績說明會,公司高管回應(yīng)了上半年毛利率下降的原因,同時公司積極布局海外數(shù)據(jù)標注市場,以及具身智能模型訓練數(shù)據(jù)需求。
定制化服務(wù)收入拖累毛利率
受益于計算機視覺、自然語言和智能語音三大業(yè)務(wù)板塊全面增長,今年上半年海天瑞聲實現(xiàn)營業(yè)收入1.57億元,同比增長近七成,歸母凈利潤380萬元,同比增長約8倍。但報告期內(nèi)公司銷售毛利率為50.17%,環(huán)比進一步下降。
對于毛利率下滑的原因,海天瑞聲高管表示,主要系受業(yè)務(wù)類型階段性變化影響,定制化服務(wù)收入占比提升所致。公司新拓展的境外內(nèi)容審核業(yè)務(wù)目前全部采用定制化服務(wù)模式,另外,央企客戶正積極踐行“AI+”戰(zhàn)略,其行業(yè)數(shù)據(jù)需求具有高度差異化特征,因此相關(guān)業(yè)務(wù)也以定制類服務(wù)為主。
據(jù)介紹,在國家“AI+數(shù)據(jù)要素”戰(zhàn)略的指引下,重點央企自2024年起加速布局通用+垂向大模型研發(fā),帶動了高質(zhì)量圖像、視頻等訓練數(shù)據(jù)的規(guī)模化采購需求。公司已成為中國移動重要的數(shù)據(jù)服務(wù)供應(yīng)商。
展望未來,公司將在持續(xù)深耕頭部客戶需求的基礎(chǔ)上,加快推進標注流程的智能化升級與標準化數(shù)據(jù)產(chǎn)品體系建設(shè),不斷提升項目運營效率,逐步優(yōu)化毛利結(jié)構(gòu)。
拓展海外市場
“海外市場空間廣闊,規(guī)模為國內(nèi)多倍,且隨著Meta收購Scale AI,Google、微軟等多家大廠開始切斷與Scale AI的合作,海外AI數(shù)據(jù)服務(wù)市場格局正在重塑,這為專業(yè)數(shù)據(jù)服務(wù)商帶來了新的市場機遇。” 海天瑞聲董事長賀琳表示。
目前公司全面推進全球化戰(zhàn)略布局,一方面通過并購菲律賓交付基地構(gòu)建海外標注產(chǎn)能,重點拓展更具市場潛力的定制化服務(wù);另一方面加快全球化服務(wù)網(wǎng)絡(luò)建設(shè),已在中國香港、新加坡和美國設(shè)立區(qū)域子公司,并積極推進日本、韓國及歐盟子公司落地,提升客戶觸達效率和需求響應(yīng)速度。
從收入結(jié)構(gòu)來看,海天瑞聲計算機視覺和自然語言業(yè)務(wù)占比提升,分別為40%、14%,主要得益于相關(guān)領(lǐng)域的技術(shù)突破和市場需求增長。其中,在計算機視覺領(lǐng)域,受益于視覺大模型技術(shù)的快速迭代和應(yīng)用場景的持續(xù)拓展,特別是圖像與視頻文本對等數(shù)據(jù)需求的爆發(fā)式增長,該業(yè)務(wù)板塊實現(xiàn)強勁增長。同時,公司在東南亞的數(shù)據(jù)交付體系已穩(wěn)定運營,進一步帶動了視覺業(yè)務(wù)收入的提升。
在自然語言處理方面,大模型技術(shù)在政務(wù)、法律合規(guī)等專業(yè)領(lǐng)域的深度應(yīng)用成效顯著,疊加全球化擴張帶來的多語言語料需求激增,共同推動了該業(yè)務(wù)的快速發(fā)展。相較而言,智能語音業(yè)務(wù)雖保持穩(wěn)定增長,但增速相對平緩。因此,計算機視覺和自然語言處理這兩大高增長業(yè)務(wù)在整體收入結(jié)構(gòu)中的占比提升。
布局具身智能
海天瑞聲也在布局具身智能市場,旨在提供核心數(shù)據(jù)支撐。
賀琳表示,2025年具身智能進入加速發(fā)展期,產(chǎn)業(yè)正從技術(shù)驗證邁向場景應(yīng)用,這對訓練數(shù)據(jù)的質(zhì)量、規(guī)模和場景化提出了更高要求。
據(jù)介紹,目前具身智能行業(yè)數(shù)據(jù)來源包括互聯(lián)網(wǎng)開源數(shù)據(jù)集(整合現(xiàn)有的公開機器人數(shù)據(jù))、虛擬合成(利用仿真環(huán)境生成訓練數(shù)據(jù))、動作捕捉(記錄人類在特定環(huán)境中的行為模式),以及機器人遙操(通過人工遠程操控獲取真實場景下的操作數(shù)據(jù))等。其中,虛擬合成技術(shù)雖解決了初期數(shù)據(jù)短缺問題,但由于“仿真差距”的存在,其數(shù)據(jù)質(zhì)量往往難以滿足高精度訓練需求。而開源數(shù)據(jù)集則面臨著數(shù)據(jù)規(guī)模有限(通常僅百萬級)、采集條件單一等挑戰(zhàn),無法支撐復雜場景下的模型訓練需求。
具身智能行業(yè)正積極探索虛實結(jié)合的數(shù)據(jù)閉環(huán)模式,通過真實遙操數(shù)據(jù)修正仿真偏差,同時結(jié)合多模態(tài)標注,持續(xù)提升數(shù)據(jù)的多樣性與有效性。在此背景下,海天瑞聲能夠為具身智能模型訓練提供支持,公司還攜手石景山人形機器人數(shù)據(jù)訓練中心共建“具身智能數(shù)據(jù)訓練場”,致力于打造“數(shù)據(jù)采集—模型訓練—場景驗證”的全流程閉環(huán),以解決行業(yè)數(shù)據(jù)瓶頸問題。此外,公司還發(fā)布了全國首個具身智能數(shù)據(jù)工程化服務(wù)平臺,通過系統(tǒng)化、自動化的數(shù)據(jù)管理賦能開發(fā)者,提升研發(fā)效率。
另外,圍繞數(shù)據(jù)要素業(yè)務(wù),海天瑞聲發(fā)揮生態(tài)優(yōu)勢,助力地方及產(chǎn)業(yè)園區(qū)打造數(shù)據(jù)標注基地和構(gòu)建數(shù)據(jù)標注產(chǎn)業(yè)新生態(tài)。目前公司已與3個承擔數(shù)據(jù)標注基地建設(shè)任務(wù)的城市——成都、長沙、保定等地方政府成立合資公司,并與內(nèi)蒙古呼和浩特簽署戰(zhàn)略合作協(xié)議,聚焦當?shù)厝闃I(yè)、草種、文旅等特色產(chǎn)業(yè),共建高質(zhì)量數(shù)據(jù)集,有效驅(qū)動當?shù)禺a(chǎn)業(yè)的數(shù)字化轉(zhuǎn)型。此外,公司正拓展與上海、廣州、宜賓等十余地的戰(zhàn)略合作,進一步完善標注基地的全國性業(yè)務(wù)布局。