光明日報客戶端9月3日報道我校舉行的“大語言模型離人類語言有多遠:新一輪科技創(chuàng)新與產(chǎn)業(yè)革命的風口”學術研討會,報道內(nèi)容如下:
“大語言模型離人類語言有多遠:新一輪科技創(chuàng)新與產(chǎn)業(yè)革命的風口”學術研討會舉行
8月24日,“大語言模型離人類語言有多遠:新一輪科技創(chuàng)新與產(chǎn)業(yè)革命的風口”學術研討會在江蘇師范大學舉行,來自全國各地的近百名專家學者、業(yè)界人士齊聚一堂,共探大語言模型與人類語言的關系及大語言模型的未來發(fā)展。
大語言模型是人類科技發(fā)展史上的重大突破
何為大語言模型?大語言模型是指擁有龐大語料庫訓練而成的,融合了各種語言知識和語言規(guī)律的人工智能模型,它具備對自然語言進行理解、生成和處理的能力。
“作為深度學習的典型代表,大語言模型能夠在短時間內(nèi)處理那些人類可能需要花費數(shù)倍甚至幾十倍時間才能完成的任務。”百度公司技術委員會主席吳華指出。
尤其是大語言模型具備一定規(guī)模后,“涌現(xiàn)出的類似于數(shù)學符號推導的推理能力為大語言模型賦予了處理和分析復雜信息的能力,使其能夠提供有一定創(chuàng)新性的解決方案,從而能夠幫助人類應對各種復雜問題和未知情境?!睔W洲科學院外籍院士、清華大學人工智能研究院常務副院長孫茂松說。
大語言模型與人類語言有著本質(zhì)不同
大語言模型的研發(fā)是從仿生人類神經(jīng)網(wǎng)絡出發(fā),目前市面上幾款常見的大語言模型,如不同代次ChatGPT、文心一言等,在語言理解上與人類語言有哪些差別?
浙江大學生物醫(yī)學工程與儀器科學學院研究員丁鼐通過實驗得出結論:大語言模型對形容詞的理解能力與人腦差異明顯。
“人類語言由意義空間與物理空間構筑,大語言模型的意義空間能級較低,僅停留在結構化、標準化的符號語言理解層面?!北本煼洞髮W“認知神經(jīng)科學與學習”國家重點實驗室教授丁國盛分析認為,未來隨著對語義編碼研究不斷深入,大語言模型將會提升意義能級模型,逐步深入理解語言。
大語言模型使用過程中,經(jīng)常會出現(xiàn)問同一個問題,有不同答案?!叭狈C器語言評估模型,是當前大語言模型亟待補齊的一大短板?!北本┐髮W計算語言學研究所副所長詹衛(wèi)東說。大語言模型通過調(diào)用已有數(shù)據(jù)信息生成結果,這并不等于擁有人類記憶能力。如果大語言模型能夠自身實現(xiàn)監(jiān)督精調(diào),確保內(nèi)部生成結果一致,人工智能發(fā)展將會實現(xiàn)新跨越。
“安全可控是認知大模型深度融入語言學習的前提。”科大訊飛副總裁汪張龍在研討會上表示。研發(fā)一類專屬場景大模型,需要在一個通用認知大模型基礎上加入專屬大模型,涉及專業(yè)領域的大模型往往包含行業(yè)機密,安全問題得不到保障,大語言模型將不可能深入百姓生活、工作諸多方面。
語言腦:大語言模型的發(fā)展與革新路徑
談及大語言模型的未來發(fā)展,中國科學院院士、清華大學人工智能研究院院長張鈸指出,大語言模型可以預見的未來之一是沿著當前路徑,擴展多模態(tài),擴大模型規(guī)模,但其生成式方法的局限性決定了大語言模型并不適用于確定性答案、邏輯推理等語言應用領域,其根本原因可能源于大語言模型與人腦在運作機制上的差異。
語言能力省部共建協(xié)同創(chuàng)新中心主任楊亦鳴教授表示,如能夠建構以“預裝”為基礎的“語言腦”,即貫穿從分子、細胞、行為、功能層面的語言腦機制研究,破譯人腦語言加工之謎,才有可能真正模仿類人智能,實現(xiàn)真正的通用人工智能。
經(jīng)過本次研討會的深入交流,與會專家們表示對大語言模型的發(fā)展前景充滿信心,希望未來能加強人工智能技術與腦科學、語言學多個領域累進合作,為更好地理解語義、理解目的及上下文、理解邏輯推理做出更為“人類”的回答。(光明日報全媒體記者蘇雁通訊員張子麟)
報道原文鏈接:https://app.gmdaily.cn/as/opened/n/b1b23ddab7bc46a7b1cc1e02a3710bf2