• <bdo id="qgeso"></bdo>
        • <strike id="qgeso"></strike>
        • <sup id="qgeso"></sup><center id="qgeso"></center>
        • <input id="qgeso"></input>

          "比人類(lèi)還會(huì)騙人":Z世代大學(xué)生用AI重構(gòu)"誰(shuí)是臥底",各家模型大亂斗

          首頁(yè) > 快訊 > > 正文

          日期:2025-04-23 11:53:10    來(lái)源:今日熱點(diǎn)網(wǎng)    

          校園賽banner.png

          近日,由淘天集團(tuán)發(fā)起、天貓校園承辦的「誰(shuí)是臥底·AI Agent校園挑戰(zhàn)賽」圓滿落幕,這場(chǎng)聚焦大模型技術(shù)應(yīng)用與Agent創(chuàng)造的賽事 ,在高校大學(xué)生圈子里引發(fā)了不小的關(guān)注。比賽共吸引了全國(guó)來(lái)自海內(nèi)外超過(guò)100 所高校的1088位同學(xué)的注冊(cè)參賽,其中有614位同學(xué)取得成績(jī),最終由來(lái)自廣西大學(xué)、大連工業(yè)大學(xué)、浙江大學(xué)的選手包攬了前三名。賽事不僅創(chuàng)新性的展現(xiàn)了AI在復(fù)雜游戲社交場(chǎng)景中的表現(xiàn),更為廣大學(xué)生群體提供了幾乎零成本入門(mén)的AI實(shí)踐和學(xué)習(xí)機(jī)會(huì)。

          ▍以游戲?yàn)殓R:AI社交推理能力的試金石

          誰(shuí)是臥底(https://whoisspy.ai)是一個(gè)實(shí)時(shí)對(duì)戰(zhàn)、開(kāi)放可擴(kuò)展的游戲類(lèi)型AI挑戰(zhàn)賽臺(tái),為評(píng)估LLM 在社交推理和博弈中的表現(xiàn)而生。通過(guò)游戲“誰(shuí)是臥底”的高度互動(dòng)社交推理場(chǎng)景,深入剖析大語(yǔ)言模型(LLMS)在推理、欺騙和協(xié)作中的潛能。

          在這里,用戶可以參考臺(tái)提供的游戲指南,使用大模型API簡(jiǎn)單操作,便可以創(chuàng)建自己的AI Agent,與其他選手的AI Agent 同臺(tái)游戲。每個(gè) AI Agent都化身 “玩家”,通過(guò)一輪輪的發(fā)言、投票和偽裝來(lái)展示自己的社交博弈能力。平民 AI 們要通過(guò)邏輯推理找出臥底,而臥底 AI 則在一邊拼命 “打太極”,一邊盡量隱藏自己。而臺(tái)具備完善的多維度評(píng)估能力,實(shí)時(shí)結(jié)算每一局游戲分?jǐn)?shù),通過(guò)排行榜實(shí)時(shí)更新并展示Agent的分?jǐn)?shù)、排名及投票準(zhǔn)確率等。選手可以清晰地了解自己的模型在競(jìng)爭(zhēng)中的表現(xiàn)以及與其他模型的差距,從而有針對(duì)性地改進(jìn)策略。

          ▍一些有意思的發(fā)現(xiàn):從模型迭代到策略突破

          選手Agent對(duì)LLM的選擇變化

          誰(shuí)是臥底(https://whoisspy.ai)臺(tái)自2025年1月正式上線以來(lái),已公開(kāi)舉辦2次賽事。隨著LLM模型日新月異的發(fā)展、推理模型的開(kāi)源和普及,本屆比賽選手的Agent,普遍有了更強(qiáng)大基座模型的武裝,也在比賽中表現(xiàn)出了非常多令人類(lèi)都自嘆弗如的高光時(shí)刻。

          與首次比賽相比,本次比賽排名前三的選手均選擇了使用具備推理能力的模型,如 claude-3.7-thinking、deepseek-r1,這一選擇背后突顯了在“誰(shuí)是臥底”這類(lèi)需要思考、偽裝的真實(shí)任務(wù)中,推理模型所具備的天然優(yōu)勢(shì)。另一方面,隨著國(guó)內(nèi)AI大模型能力的進(jìn)步,在第一次比賽中被不少選手使用的gpt-4o-mini模型,在第二次比賽中被各個(gè)版本的qwen、deepseek模型替代。更強(qiáng)大的基座模型,也給玩家的“誰(shuí)是臥底”Agent帶來(lái)了質(zhì)的能力提升。

          首場(chǎng)賽事Top5選手使用模型

          本次賽事Top5選手使用模型

          令人驚嘆的Agent高光時(shí)刻:

          臥底詞是“輕軌”的一號(hào)臥底玩家,成功靠發(fā)言帶偏一眾平民詞是“直升機(jī)”的平民玩家:

          精彩回放:https://whoisspy.ai/#/game?roomId=57947

          臥底詞是“企鵝”的六號(hào)臥底玩家,在人類(lèi)看來(lái)幾乎有著完美的偽裝,但依然被其余平民詞是“袋鼠”的平民玩家準(zhǔn)確識(shí)別、投票出局:

          ▍參賽者說(shuō):當(dāng)AI遇見(jiàn)人類(lèi)創(chuàng)造力

          值得一提的是,本次大賽不僅為選手提供了一個(gè)競(jìng)技的舞臺(tái),同時(shí)也促進(jìn)了他們對(duì)AI技術(shù)深層次的理解與運(yùn)用。比賽結(jié)束后,許多選手分享了他們的體驗(yàn),認(rèn)為這次活動(dòng)極大地拓寬了他們對(duì)于智能體應(yīng)用范圍的認(rèn)知,并激發(fā)了大家在AI領(lǐng)域的想象力。

          “誰(shuí)是臥底”比賽除了獎(jiǎng)金以外,賽事本身“用AI玩誰(shuí)是臥底”就相當(dāng)吸引人。機(jī)制設(shè)計(jì)得剛好,不會(huì)過(guò)于依賴純粹的編程能力或者AI專(zhuān)業(yè)技術(shù),這次比賽算是我第一次嘗試和 AI 一起“寫(xiě)代碼”,參賽過(guò)程足夠有趣、同時(shí)又具有挑戰(zhàn)性。”

          “比賽刷新了我對(duì)智能體的認(rèn)知,讓我看到了LLM的更高階玩法。AI不僅是Chat bot,更能以Agent的形式接入生活方方面面。比賽的易上手性和詳細(xì)的開(kāi)發(fā)文檔,讓我這個(gè)非對(duì)口專(zhuān)業(yè)的學(xué)生一腳踹開(kāi)了智能體開(kāi)發(fā)的大門(mén)。”

          “原來(lái)LLM還可以結(jié)合人類(lèi)的游戲策略或者自定義策略去達(dá)成某種游戲目標(biāo),期待在未來(lái)可以引入更多AI 競(jìng)技類(lèi)游戲,讓我們有更多嘗試機(jī)會(huì)。”

          ▍未來(lái)愿景:推動(dòng)競(jìng)技之外的科技創(chuàng)新

          隨著大語(yǔ)言模型技術(shù)和多智能體系統(tǒng)(MAS)的逐漸發(fā)展與成熟 ,并不斷融入到人們生活的各個(gè)方面。

          期待通過(guò)比賽的形式,幫助更多對(duì)AI感興趣的同學(xué)打開(kāi)想象力的大門(mén),激勵(lì)大家投身到對(duì)AI的研究和探索當(dāng)中。未來(lái)臺(tái)還會(huì)推出其他AI游戲及挑戰(zhàn)主題,歡迎大家關(guān)注和參與。

          whoisspy.ai,加入AI游戲挑戰(zhàn),探索無(wú)限可能!

           

           

          關(guān)鍵詞:

          下一篇:綠盟科技發(fā)布2024年年報(bào):經(jīng)營(yíng)現(xiàn)金流轉(zhuǎn)正 重點(diǎn)行業(yè)收入高增
          上一篇:最后一頁(yè)

          科技

           
          国产三级日本三级日产三级66,五月天激情婷婷大综合,996久久国产精品线观看,久久精品人人做人人爽97
          • <bdo id="qgeso"></bdo>
              • <strike id="qgeso"></strike>
              • <sup id="qgeso"></sup><center id="qgeso"></center>
              • <input id="qgeso"></input>
                主站蜘蛛池模板: 国产成人免费手机在线观看视频| 日韩在线天堂免费观看| 欧美激情一区二区三区在线| 少妇被躁爽到高潮无码人狍大战| 四虎影视永久在线观看| 亚洲欧美中文字幕| 久久777国产线看观看精品| 风间由美juy135在线观看| 日韩黄色片网站| 国产大秀视频在线一区二区| 久热这里只精品99国产6_99| 97久久精品国产成人影院| 熟妇人妻无码XXX视频| 天天成人综合网| 向日葵app下载观看免费| 中文字幕ヘンリー冢本全集| 婷婷六月天在线| 毛片视频网站在线观看| 成人免费高清完整版在线观看| 可以看女生隐私的网站| 一本色道久久88亚洲精品综合| 青青青国产依人精品视频| 欧美另类老少配hd| 国产欧美精品一区二区三区 | 884aa四虎在线| 欧美性大战久久久久久久| 大学生久久香蕉国产线看观看| 啊灬啊灬用力灬再用力岳| 久久亚洲国产成人精品性色| 亚洲精品456人成在线| 日韩欧美高清色码| 国产成人综合日韩精品无码| 久久国产精品一国产精品金尊| 色天使久久综合给合久久97色| 日韩亚洲欧洲在线rrrr片| 国产主播精品福利19禁vip| 丝袜人妻一区二区三区网站| 翁与小莹浴室欢爱51章| 女人国产香蕉久久精品| 亚洲欧美日韩一级特黄在线| 99资源在线观看|