• <bdo id="qgeso"></bdo>
        • <strike id="qgeso"></strike>
        • <sup id="qgeso"></sup><center id="qgeso"></center>
        • <input id="qgeso"></input>

          超大規模新型預訓練模型“悟道·文匯”發布 “文匯”模型應用即將上線

          首頁 > 科技 > > 正文

          日期:2021-01-14 15:55:03    來源:人民網-科技頻道    

          2021年1月11日,北京智源人工智能研究院發布面向認知的超大規模新型預訓練模型“文匯”,旨在探索解決當前大規模自監督預訓練模型不具有認知能力的問題,這一項目由智源研究院發起的“悟道”攻關團隊完成。

          “文匯”模型不僅使用數據驅動的方法來建構預訓練模型,還將用戶行為、常識知識以及認知聯系起來,主動“學習”與創造。本次發布的“文匯”模型與1月初OpenAI剛剛發布的DALL·E和CLIP這兩個連接文本與圖像的大規模預訓練模型類似,“文匯”模型能夠學習不同模態(文本和視覺領域為主)之間的概念,可以實現“用圖生文”等任務,具有一定的認知能力。“文匯”模型參數規模達113億,僅次于DALL·E模型的120億參數量,是目前我國規模最大的預訓練模型,并已實現與國際領先預訓練技術的并跑。

          智源研究院學術副院長、清華大學計算機系唐杰教授認為,GPT-3等超大型預訓練模型在處理復雜的認知推理任務上,例如開放對話、基于知識的問答、可控文本生成等,結果仍然與人類智能有較大差距。智源研究院院長、北京大學信息技術學院黃鐵軍教授指出,“文匯”模型針對性地設計了多任務預訓練的方法,可以同時學習文→文、圖→文以及圖文→文等多項任務,實現對多個不同模態的概念理解。經過預訓練的“文匯”模型不需要進行微調就可以完成“用圖生文”等任務,對模型進行微調則可以靈活地接入如視覺問答、視覺推理等任務。

          “文匯”模型應用即將上線

          目前,“文匯”已支持基于認知推理的多種自然語言及跨模態應用任務,部分應用即將與搜狗、阿里巴巴、學堂在線、智譜.AI、循環智能等機構合作上線。目前已有四個樣例應用可用于展示模型效果。

          (一)基于上傳圖片的開放域問答

          本應用基于圖片文本的多模態認知預訓練百億模型,可以支持用戶上傳圖片后,針對圖片內容進行提問或生成圖片的一句話描述。如上傳圖片后詢問“圖片中的電腦在水杯的什么位置?”或“生成對應商品圖片的一句話描述”。將于未來大規模應用于阿里的電商場景。

          (二)Talk to Data,用語言操作數據可視化

          本應用基于數據可視化技術,通過將自然語言轉化為可視化查詢語句,從而達到“上傳圖表,輸入指令,輸出可視化圖像”的功能目標。只需要一句自然語言的話,就可以實現數據的可視化自動統計與查詢。

          (三)基于預訓練語言模型的詩詞創作應用

          本應用可以基于輸入的詩歌題目、朝代、作者,生成仿古詩詞。與傳統基于規則或監督學習的詩歌生成不同,這個應用創作的詩歌來自于自然語言的生成,且無標注數據進行fine-tune,并且可以模仿任意詩人創作任意新穎題目的詩歌。

          下面是基于模型自動作詩的結果:

          贈抗疫英雄

          君王歌里贈英雄,百萬雄師劈毒煙。

          況是人民勤努力,更加眾志與國捐。

          團結團結再團結,萬眾一心戰瘟神。

          沔水橋邊香霧起,暗送瘟神過漢陽。

          (四)可控人設的開放域問答

          本應用支持用戶上傳問題,并生成具有人物角色風格的定制化文本回答。與傳統的開放式問答不同,“文匯”模型生成的答案具有人設的語言特色,問答內容趣味橫生。目前該應用將計劃在搜狗的問答場景中使用。

          “悟道”項目下一步研發計劃

          目前,“悟道”項目研究團隊正在視覺等更廣泛的范圍內,對大規模自監督預訓練方法開展探索研究,已經啟動了四類大規模預訓練模型研制,包括“文源”(以中文為核心的超大規模預訓練語言模型)、“文匯”(面向認知的超大規模新型預訓練模型)、“文瀾”(超大規模多模態預訓練模型)和“文溯”(超大規模蛋白質序列預訓練模型)。2020年11月14日,智源研究院已發布了“文源”(以中文為核心的超大規模預訓練語言模型)第一階段26億參數規模的中文語言模型。下一步,智源研究院將聯合優勢單位加快四類大規模預訓練模型的研發進度。特別是“文匯”模型,未來將著力在多語言、多模態條件下,提升完成開放對話、基于知識的問答、可控文本生成等復雜認知推理任務的能力,使其更加接近人類水平。計劃在今年6月實現“中文自然語言應用系統”“基于圖文增強和知識融入的圖文應用系統”“基于認知的復雜認知系統”等一批各具特色的超大規模預訓練模型,以期達到對國際領先AI技術的趕超,盡快實現我國在國際AI前沿技術研究的領跑。

          關鍵詞: 超大規模新型預訓練模型

          下一篇:使用CRISPR技術將編碼二進制數據的特定DNA序列插入細菌細胞
          上一篇:竊蛋龍不是“賊”“偷蛋罪”不成立 科學研究還竊蛋龍“清白”

          科技

           
          国产三级日本三级日产三级66,五月天激情婷婷大综合,996久久国产精品线观看,久久精品人人做人人爽97
          • <bdo id="qgeso"></bdo>
              • <strike id="qgeso"></strike>
              • <sup id="qgeso"></sup><center id="qgeso"></center>
              • <input id="qgeso"></input>
                主站蜘蛛池模板: 日本黄色免费观看| 精品无码久久久久久国产| 五月婷在线视频| 亚洲成av人片在线观看| 中文字幕在线播放视频| xxxx日本视频| 波多野结衣伦理片| 成品网站nike源码1688免费| 国产精品国产三级国快看| 你是我的城池营垒免费观看完整版| 中国内地毛片免费高清| 韩国演艺圈悲参39全集都有谁| 欧美性狂猛xxxxxbbbbb| 夜夜爽免费888视频| 卡一卡二卡三免费专区2| 久久机热re这里只有精品15 | 国产又黄又爽视频| 亚洲国产精品尤物yw在线观看| 91在线精品亚洲一区二区| 色聚网久久综合| 无忧传媒在线观看| 国产女人和拘做受视频免费| 亚洲免费观看视频| 97无码免费人妻超级碰碰夜夜| 精品亚洲A∨无码一区二区三区| 日日碰狠狠添天天爽超碰97| 国产性夜夜夜春夜夜爽| 久久夜色精品国产亚洲| 国产一区二区三区乱码网站| 欧美国产日韩另类| 国产自产21区| 亚洲熟妇av一区二区三区下载| 91区国产福利在线观看午夜| 欧美成人精品第一区二区三区| 在总受文里抢主角攻np| 人人人妻人人澡人人爽欧美一区| √天堂资源地址在线官网| 泳衣男漫画臀篇佳门サエコcc| 天天躁日日躁狠狠躁中文字幕 | 成人试看120秒体验区| 免费看污成人午夜网站|