近日,中國移動舉辦了“2021年科技工作者日暨科技周——九天人工智能新技術論壇”,邀請來自中國移動、優秀人工智能企業、頂尖高校、國際標準化組織的業界專家分享AI基礎技術及網絡智能化領域的最新技術成果與行業動態,探討未來AI技術發展趨勢,促進產業數智化轉型。九章云極DataCanvas資深架構師楊健受邀參加論壇,并發表了“新一代AutoML助力企業規模化建模”的精彩演講。
九章云極DataCanvas資深架構師 楊健
近年來機器學習技術的應用價值顯著,隨之而來的數據瓶頸、算力瓶頸以及人才瓶頸日益凸顯出來。隨著人工智能的發展,數據和算力需求得以滿足,數據科學人才培養卻遠遠滯后于需求,最終爆發出人才培養周期長、速度慢等問題。資深架構師楊健在演講中提到,AutoML技術正在迎來爆發性的增長,Gartner在2020年十大科技趨勢中,將以AutoML為代表的AI普及化作為數據與分析領域的重要戰略技術之一。
面對企業業務的新需求,九章云極DataCanvas提供AutoML自動化建模平臺,構建神經網絡架構搜索空間,運用超大規模空間搜索算法,結合高性能評估策略,達到全流程端到端的自動機器學習建模,提升建模效率與體驗,讓業務能快速構建和使用AI能力。
AutoML面臨的挑戰
楊健提到,AutoML雖然在不斷發展,但也面臨不均衡數據、概念漂移、模型泛化能力、大規模數據自動建模等諸多挑戰。針對這些問題,在建模流程中DataCanvas自動機器學習平臺運用AutoML自動化核心技術,使業務人員無需查看數據樣本分布,全自動化的完成數據清洗、特征加工、模型篩選和超參數優化工作,自動處理不均衡問題。同時,引入半監督學習進一步提升模型的泛化能力,消除數據訓練與預測的不確定性。平臺支持分布式架構,提供高效的評估策略,降低建模的時間成本,從而使大規模數據實現AutoML。
九章云極DataCanvas以自主研發的“硬科技”立身,開源出國際領先的AutoML自動化模型算法和架構,擁有實現多樣性機器學習任務和場景自動化開發的Hypernets、在全球頂級Kaggle競賽中獲得第一名的DeepTables等眾多AutoML開源工具。并且根據UCI、Kaggle公開的數據集,其產品DataCanvas AutoML Toolkit(DAT)的模型準確度高于當前最先進的AutoML開源工具。
DataCanvas AutoML Toolkit(DAT)
隨著不斷變化的業務與市場需求,九章云極DataCanvas多年來在金融、通信、政府等眾多行業實現場景應用,持續創新,堅持自主研發新技術、新產品,用標準化的AI平臺產品覆蓋更多的客戶,助力各個行業的企業規模化建模,實現數智化升級。
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。