近日,AI基礎架構與數據智能平臺服務商曼孚科技宣布,已于2023年9月完成數千萬元B輪融資,本輪投資方為安樸資本。所融資金將主要用于AI基礎設施搭建、大模型標注平臺閉環更迭以及數據標注市場拓展等。
曼孚科技商業化始于2019年,是一家數據驅動的AI基礎設施平臺企業,致力于從數據中獲取洞見與價值,并以更精簡方式構建人工智能應用,實現AI的輕量化與普惠化。
旗下主要產品服務包括:面向數據生命周期管理的數據智能平臺、AI數據中臺、AutoLabeling平臺、AutoML平臺以及基礎數據服務(數據標注、數據采集、數據清洗)等。
憑借從戰略到技術落地的一站式數據解決方案,目前已與數百家企業達成深度合作,業務場景涵蓋自動駕駛數據標注、AI數據生命周期管理等。用戶包括主機廠、造車新勢力、一線科技公司、主流算法公司以及世界頂級Tier1廠商等,2023年營收額預估將實現3倍以上持續性增長。
數據定義模型
AI產業歷經多年發展,已逐漸步入技術與商業的交叉點。
算法模型從關注增量的建模改進,轉變為強調性能的迭代與優化,以契合商業應用場景對模型質量更為苛刻的要求。
結構化數據已成為AI算法模型開發與迭代的基礎。AI強大“理解力”的造就,離不開結構化數據源源不斷的輸入,和對數據更為精細化的運用。
AI行業正圍繞以數據為中心進行整合,誰擁有數據,誰就擁有模型的定義權。
在細分場景,自動駕駛城市NOA熱潮興起。技術范式全面革新下,自動駕駛感知算法向BEV+Transformer架構升級,端到端算法解決方案成為主流,推動自動駕駛感知算法從輕量的CNN二維感知,到基于Transformer四維感知的升維,也催生了數據需求的指數型增加。
自動駕駛在AI大模型的助力下迎來臨界點。但量變到質變的前置條件是大規模數據的支持——Transformer大模型質變需要數億公里標注數據的投喂,并覆蓋不斷出現的Corner Case,這對數據量產規模以及自動化水平提出了更高的要求。
自動駕駛的終極目標是完成對駕駛員的取代,但在此之前,數據標注員需要率先被神經網絡所取代。
AI驅動的數據智能平臺
隨著BEV+Transformer技術路線成為新一代自動駕駛感知能力的核心架構,數據閉環能力取代算法范式,成為決定商業量產從1到N的勝負關鍵。
而數據閉環的每一步推進都是成本與效率的博弈,低成本AI數據量產能力又成為助推數據飛輪的關鍵。
作為行業領先的AI基礎架構與數據智能平臺服務商,曼孚科技以產品技術為核心驅動力,通過構建AI+RPA驅動的數據平臺沉淀數據Know-How能力,在業內率先實現AI數據低成本、無上限、規?;慨a。
曼孚科技數據平臺核心產品體系由MindFlow SEED數據服務平臺與MindFlow AutoLabeling自動標注平臺構成,歷經多代版本更迭,現已在3D、4D點云數據處理領域,建立起6-12個月的技術壁壘。
具體應用場景上,平臺支持自動駕駛等場景下2D、3D、4D全類別標注,如2/3D融合、點云分割、點云時序疊幀、BEV標注等。
針對4D點云標注場景下大規模點云適配渲染問題,曼孚科技自研地圖分片與LOD大規模點云渲染技術,4D點云車道線與4D點云分割場景均可實現低配置單幀數億級點云平穩運行。
4D點云分割標注場景
作為自動化AI數據平臺,RPA與AI能力的建設是曼孚科技構建技術壁壘的核心。
RPA能力主要體現在流程自動化以及調度分發自動化等多個方面。而AI能力則已深入數據流轉各環節,具體體現在:
1)覆蓋數據預處理、算法推斷至結果精修完整算法鏈路,已商用靜態道路自適應分割、動態障礙物AI預處理、AI交互式標注等數十種AI算法標注模型;
2)采用Backbone+多Head算法架構,快速適配不同場景,大幅降低多任務模型研發成本;
3)基于AutoML以及自有數據集構建AI標注模型,自我驅動完成算法迭代;
4)運用遷移學習、知識蒸餾等方式,基于小批量數據+底層通用大模型快速產出算法模型。
RPA與AI能力的強耦合,賦予曼孚科技以更低人力支出與邊際成本,提供更具標準化數據解決方案的能力。綜合人效平均提升80%,數據生產成本平均降低50%,并實現AI數據低成本、無上限、規模化量產。
基于大模型的AI自動標注體系
作為引領人工智能新一輪躍遷式發展的全新底座,大模型正走深向實,賦能千行百業。
海量參數帶來的容量優勢,賦予大模型更強的性能與泛化能力,為數據預處理、數據標注等傳統依賴人力的環節,提供了全新的技術解決范式。
目前,曼孚科技已完成自動駕駛數據標注視覺大模型研發。通過引入駕駛數據建立RLHF,并基于深度學習與計算機視覺構建大模型,可實現復雜駕駛場景下,數據的高效處理與全自動化標注。
曼孚科技數據標注大模型的主要技術特點如下:
1)基于弱監督與半監督學習,通過少量人工標注數據與大量無標注數據,實現對場景物體的高效檢測、分割與識別;
2)基于BEV多視角融合與三維重建,借助多攝像頭、激光雷達等來源數據,自動生成場景物體三維信息;
3)運用遷移學習方式,對不同場景與不同模態下的數據,進行統一表示與學習,提升模型泛化能力與適應性;
4)運用主動學習與交互式學習方式,通過與人工標注過程進行反饋,不斷優化迭代模型性能。
上述大模型技術加持下,典型自動駕駛數據標注場景平均效率可提升4-5倍以上,引領曼孚科技率先步入自動化數據標注時代。
數據驅動的AI基礎設施
算法更新迭代的全生命周期內,從設計、訓練、評測到仿真等環節均需要海量數據不斷輸入作為支撐,其中數據標簽是整個流程的基礎與起點。
如果說互聯網時代是對信息流量的搬運,那么人工智能尤其是大模型時代,則是對海量數據的搬運與精細化運用。
在信息流量的基礎上,誕生了諸多影響深遠的商業模式。AI時代,任何人也均可使用數據作為“鏟子”去探索商業“金礦”。是否擁有質量更高、數量更多的“鏟子”,是決定“淘金人”能否真正掌握主動權,淘到金子的關鍵。
AI大淘金時代,曼孚科技希望扮演起為“淘金人”服務的角色,以數據為驅動力向AI上下游延伸,打造起通用AI基礎設施。用戶可以以更精簡方式構建AI應用并管理全生命周期,同時也可以更加靈活調整模型構建流程中的每個組件,以得到更契合的需求與分析結果。
在上述愿景指引下,曼孚科技目前已在自動駕駛場景構建起AI數據閉環平臺,涵蓋DaaS數據標注平臺、數據管理平臺、AutoLabeling平臺以及AutoML平臺等,提供從數據準備到模型應用的端到端解決方案,并延伸至其他AI應用場景。
其中,數據管理平臺集數據存儲、處理、導入導出于一體,通過SDK打通數據采集平臺、數據標注平臺、模型訓練平臺與生產運營系統等外部平臺,借助AI與大數據技術加強智能標簽、分析報表、場景挖掘與自然語言搜索等功能體驗,提高數據使用與管理效率。
而AutoML平臺則是面向自動駕駛等通用視覺場景的自動訓練平臺,提供算法模型自動訓練與快速迭代功能??勺詣觾灮P徒Y構、參數與超參數,提升性能與泛化能力,實現零代碼一鍵訓練,無人值守。
曼孚科技AI基礎設施架構
曼孚科技AI基礎設施解決方案全面覆蓋數據層至算法層,既可提供DaaS服務,也可提供MaaS服務。無論用戶規模大小、是否具備AI研發能力,只要存在AI需求,即可使用曼孚科技提供的基礎設施,輕松創建專屬AI產品,實現從數據到商業價值的轉變。
AI For Everyone
獨立自研的數據閉環平臺、AI數據量產能力以及對客戶業務需求的敏銳洞察,讓曼孚科技在不斷變化的市場中實現業務超預期增長,數據驅動的AI基礎設施在自動駕駛等行業驗證了應用價值與商業潛力。
下階段,曼孚科技將繼續深耕數據行業,不斷完善AI基礎設施建設。正如AWS之于云計算,Snowflake之于數據分析一樣,曼孚科技希望在AI行業能以數據構建起通用基礎設施,幫助用戶以更精簡方式訓練與部署人工智能應用。無論是初創企業、成熟公司亦或是個人,均可通過簡單點擊或幾行代碼享受AI帶來的便利,實現真正的AI民主化與普惠化。
互聯網時代,谷歌憑借搜索引擎掌控了互聯網流量入口,微軟憑借操作系統掌控了PC生態鏈的上游,目前尚未出現挑戰谷歌、微軟等萬億體量的科技新貴,但AI正讓一切變得可能。
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。
標簽: