繼3月24日在深圳舉辦TF14探討聯邦學習以來,9月北京ADL103期、10月CNCC2019技術論壇,至10月26日TF23期,這已是CCF發起的第四次聯邦學習主題研討,這次聚焦聯邦學習的最新應用落地,近150位來自頭部ICT和互聯網企業和在京重點高校學生一起分享探討了這一話題。
從基礎理論到應用實戰,CCF TF第23期研討會展示新一代聯邦學習應用范例。此次CCF TF第23期“AI聯邦學習的最新應用落地”研討會由微眾銀行人工智能首席科學家范力欣擔任主席,微眾銀行首席人工智能官楊強、微眾銀行人工智能部高級研究員范濤、騰訊云大數據及AI中心高級研發工程師秦姝琦、華為消費者BG軟件部CTO辦公室算法專家朱越、VMware中國研發中心技術總監張海寧、京東智能城市事業部AI平臺負責人張鈞波、創新工場南京國際人工智能研究院執行院長馮霽、平安科技聯邦學習技術部總經理王健宗、中科院計算所泛在計算系統研究中心主任陳益強、北京大學光華管理學院應用經濟系教授翁翕作為研討會的特邀嘉賓,現場講演分享了最新的行業經驗,與參會者熱烈交流。
人工智能技術成功突破算法與算力的限制的同時,“數據孤島”與數據隱私安全問題對人工智能的應用落地提出了新挑戰。在這種環境下,“聯邦學習”(Federated Learning)成為應對該挑戰的關鍵思路。此前,CCF TF第14期研討會已經在深圳探討了在保護數據隱私的前提下如何利用聯邦學習開展AI大數據研究。而本期研討會則著重展示聯邦學習技術落地各行業的最新成果,并就聯邦學習的激勵機制、安全場景等前沿課題做了深入探討。
“現在聯邦學習已經進入一個新的時期,就是落地時期。”在研討會開場致辭中,微眾銀行首席人工智能官楊強教授提出,聯邦學習的發展需要經歷三個階段,即“點到點的聯邦學習發展階段”,“應用落地、積累案例階段”與“聯邦學習價值聯盟網絡建立階段”。在經歷以隱私保護為重點的第一階段之后,目前的聯邦學習正在邁向積累經驗的落地階段。哪些領域適合聯邦學習?如何體現聯邦學習的商業價值?可能面臨哪些技術與商業挑戰?如何建立不同企業之間的聯盟?楊強教授認為,這需要積累大量的案例,而本次研討會就是一個起點。
在楊強教授展望了聯邦學習未來發展階段之后,本次研討會主席、微眾銀行人工智能首席科學家范力欣在《從數據孤島到隱私保護:聯邦學習對各行業AI落地之影響》報告中回顧了聯邦學習被提出的歷史背景,進一步闡述聯邦學習落地的必要性。范力欣博士表示:如今我們正在經歷互聯網的第四次信息革命,坐擁海量的信息與數據。“這些數據如果能夠用AI的方式進行解讀,對我們的生活會產生一個大的提升。”為了挖掘海量信息背后的價值,讓所有的數據用大家都能接受的方式進行共享,聯邦學習應運而生。聯邦學習這一新興的AI技術已經相繼落地于各行各業,在智慧城市、智慧終端、智慧醫療等領域都取得了突出的成果。
會議上,演講嘉賓們來自不同行業不同領域,分別從各自的行業實踐出發,分享了聯邦學習在各領域的最新應用成果。微眾銀行人工智能部高級研究員范濤在《FATE:新一代聯邦學習技術及應用實戰》主題報告中詳細介紹了微眾銀行研發的四大決策型AI產品及聯邦學習開源項目FATE在保險科技、信貸風控、行業流程自動化等領域的應用,包括智能定價引擎、智能評分引擎、運營商智能化產品和營銷智能化產品,提到:“我們希望通過FATE聯合決策能力到決策性AI產品,加速聯邦學習在商業場景的落地。”
在保險領域,微眾銀行AI團隊通過對用戶的年齡、職業、年租車次數等標簽屬性進行聯邦學習建模,預測出險概率,實現千人千面的定價。在信貸方面,微眾銀行AI團隊研發的智能評分引擎,能夠利用開票金額與央行的征信數據等標簽屬性進行聯合建模,將小微企業風控模型區分度——AUC of ROC(衡量模型區分好壞樣本的評估標準之一)提升至12%。
在醫療領域,聯邦學習技術同樣是實現醫療大數據研究的重要方式。中科院計算所泛在計算系統研究中心主任陳益強研究員認為,健康監護需要在普適環境下實現開放域用戶行為的智能感知和理解,而面向疾病診斷的智能算法研究存在著限制移動、時空受限等缺陷。針對以上難題,陳益強博士及其團隊利用聯邦學習技術,將范式驅動的限定場景下面向疾病的診斷模型向普適場景下的健康狀態監測進行聯邦遷移,從而解決醫養結合的應用痛點。
在智能城市建設方面,京東智能城市事業部AI平臺部負責人、京東智能城市研究院資深研究員張鈞波表示:通過不斷獲取、整合和挖掘城市中不同領域的大數據來解決城市痛點,是當今城市通向智能城市的途徑。張鈞波博士在報告中分享了基于大數據和聯邦學習的信用城市體系建設,以及京東城市基于城市計算和聯邦學習技術打造的產品——數字網關。為了解決城市中數據孤島、數據共享難的問題,在各級政府機構、大型企事業單位、互聯網公司等不同機構間創建安全、共享、智能、高效的連接,數字網關以聯邦學習技術為本,以其安全可信、精度無損、場景多樣、方便易用、輕量部署、可信分潤等優勢幫助機構間在合法合規的前提下實現跨域建模和使用
從智慧終端領域面臨的挑戰入手,華為消費者BG軟件部CTO辦公室算法專家朱越分享了智慧終端分布式AI場景下關于聯邦學習應用的思考。朱越認為,分布式AI的核心價值在于精準感知與精確預測,并面臨系統動態、設備異構、多端多用戶協同、適應硬件特性的挑戰。其中,突破系統動態、設備異構的壁壘,構建統一的特征空間,并基于統一的特征空間進行多用戶多設備的協同訓練,給用戶帶來統一的、連續性的、個性化的服務體驗是聯邦學習的潛在機會點。
在上述應用領域之外,會議上多位專家針對聯邦學習在云服務、安全場景等前沿課題上的實戰做了分享。VMware中國研發中心技術總監張海寧將聯邦學習與云計算結合,詳細介紹了聯邦學習開源項目FATE在Kubernetes上應用的方案。在他看來,云服務是聯邦學習一個比較理想的落地途徑,聯邦學習其自身具備的特點,適合在云上和多個用戶進行部署和使用,例如可以把在公有云里面聯邦學習的機構組織加進來,形成一個異構系統或者生態系統,為不同的組織之間的數據對接提供平臺。
騰訊云大數據及AI中心高級研發工程師秦姝琦則針對隱私計算技術的落地展開探討,從多方隱私計算的應用場景出發,詳細介紹了騰訊云神盾沙箱在數據隱私保護AI計算和安全敏感數據資產合作場景的解決方案,并講解了神盾沙箱的底層架構和上層應用平臺。
創新工場南京國際人工智能研究院執行院長馮霽在報告中圍繞聯邦學習技術框架,詳細介紹了聯邦學習框架內不同模塊可能遇到的潛在攻擊方式,如數據下毒、信道監聽以及對抗樣本等攻擊方法,并對此提出相應的解決方案。馮霽認為,工業實踐者在具體部署聯邦學習技術以滿足業務合規化的同時,還需要為現有的聯邦學習配置“保護鎖”與“疫苗”,以達到更好地保護自身的商業機密。
平安科技聯邦學習技術部總經理王健宗在《聯邦智能加速AI落地》的報告中,解讀聯邦智能生態的應用組成與發展前景。王健宗博士認為,聯邦智能能夠兼顧解決隱私保護與數據共享兩大難題,為建立起一個跨企業、跨數據、跨領域的大數據 AI生態提供了良好的技術支持。
除了聯邦學習的應用范例,本次研討會還討論了聯邦學習的激勵機制。北京大學光華管理學院應用經濟系教授翁翕說這是他第一次參加計算領域的學術研討,他雖然忐忑但是覺得非常有意義,他認為:在現實的設計中,數據聯邦還需要提供足夠的經濟激勵,以保證聯邦學習的參與者一直保持參與。在報告中,翁翕教授分享了數據聯邦應該采取的最優組織和獎勵結構,以幫助聯邦學習的從業者在不深入了解博弈論的情形下,就能按照他們的最優化目標以及現實場景,選擇不同種類的獎勵機制。“聯邦學習最后的目標函數就是要最大化集體的效應,同時最小化遺憾,用一種公平的機制來實現長期的穩定性。”
最后的圓桌討論環節,多位嘉賓就“企業人工智能部門的重要性”、“聯邦學習學界與工業界面臨的挑戰”、“中國企業落地聯邦學習應用的優勢與劣勢”等話題進行深入交流與討論。
如今,聯邦學習技術在助力人工智能落地多個領域的過程中已頗有建樹,如何推動這一新興人工智能技術廣泛應用于各行各業,并建立起完善的激勵機制,仍是學界與業界需要共同探討的問題。(張銘陽)