中英文口語、作文評分……網(wǎng)易有道、科大訊飛加入ChatGPT混戰(zhàn)
在科技圈掀起大浪潮的ChatGPT,最近也被教育公司盯上了。
日前,網(wǎng)易有道(NYSE:DAO)被傳其AI技術團隊已投入到ChatGPT同源技術AIGC(AI Generated Content人工智能自動生成內容)在教育場景的落地研發(fā)中。
2月9日,網(wǎng)易有道向界面教育證實了上述消息,并表示近年來一直在AIGC上有持續(xù)性投入。去年底嘗試AIGC在教育場景中的落地應用,包括但不限于AI口語老師、中文作文打分和評價等。
“產(chǎn)品的最終形態(tài)團隊還在討論中,需要匹配用戶需求來決定,智能硬件、在線課程都可能是考慮落地的場景?!本W(wǎng)易有道稱。
AIGC被視為繼專業(yè)生產(chǎn)內容(PGC)、用戶生產(chǎn)內容(UGC)之后的新型內容創(chuàng)作方式,目前AIGC已經(jīng)從早期的輔助人類實現(xiàn)內容創(chuàng)造,發(fā)展到如今的獨立完成內容創(chuàng)作的新階段。如前段時間AI繪畫就成為AIGC第一個破圈的落地應用。

網(wǎng)易有道還表示,其在學習和翻譯場景下積累了豐富的多模態(tài)數(shù)據(jù)和相關語料,一直通過有道智云平臺向外輸出。
同日,界面教育自作業(yè)幫媒體交流會上獲悉,關于ChatGPT在教育領域的應用,該公司已經(jīng)在做一些小樣測試,主要還是在原來作業(yè)幫的產(chǎn)品上,等產(chǎn)品成熟度較高后,會在聰明學系統(tǒng)里進行應用。
作業(yè)幫表示,多年來其在預訓練語言模型中有持續(xù)投入,在教育相關場景下的多個垂類應用都有落地,包括題意理解、知識點分類、作文批改、智能質檢等。
“比如,行業(yè)之前做考試批閱的普遍做法是圍繞圖像比對來進行,現(xiàn)在我們已經(jīng)能對一些數(shù)學題本身進行測算和深度理解、處理,這其實是相似的技術?!弊鳂I(yè)幫執(zhí)行總裁蘇靜表示。
中公教育(002607.SZ)也來蹭了一波熱度,2月9日其在投資者關系平臺上稱,將根據(jù)ChatGPT發(fā)展帶動的崗位需求來增設相關的培訓課程。
相比上述公司的發(fā)聲,科大訊飛(002230.SZ)則直接披露產(chǎn)品的官宣日期。
該公司表示,已于2022年12月進一步啟動生成式預訓練大模型任務攻關。2023年5月6日,將進行產(chǎn)品級發(fā)布,AI學習機將成為該項技術率先落地的產(chǎn)品。其技術突破將在中英文作文輔導、中英文口語學習等方面帶來顯著提升。
上述消息的釋出,讓這些公司的股價在二級市場上掀起了一波小高潮。科大訊飛股價一度上漲30%,網(wǎng)易有道一度漲超18%。截至美東時間2月9日收盤,網(wǎng)易有道股價回落。2月10日午盤,科大訊飛上漲4.66%。
從目前披露的信息看來,ChatGPT等相關技術在教育領域的應用,主要集中在中英語口語和作文輔導上。這與ChatGPT背后基于海量數(shù)據(jù)生成的AI大模型息息相關。
它把能獲取的人類書籍、學術論文、新聞、高質量的各種信息作為學習內容,并根據(jù)人類反饋強化學習。該技術的突破也使得ChatGPT的對話更貼近人類,語段間邏輯關聯(lián)度顯著提升。
以早年間的人工智能作為對比,就能看出明顯差異。
在2016年高考結束、滿分作文尚未出爐之際,人工智能小冰的兩篇命題作文被曝光。與之同臺比拼的還有80后作家安意如、專欄作家潘采夫、詩人廖偉棠等,按要求在規(guī)定時間內完成當年的高考作文。
最后的結果顯示,小冰的作文能力與不少網(wǎng)民想象中的人工智能存在不少差距,小冰的文字雖然不乏文藝氣息,但最為集中的槽點是:字數(shù)不夠,竟然沒到規(guī)定字數(shù)800字的一半,多少有點不合常理。
從底層邏輯來看,當時的小冰擁有一個基于神經(jīng)網(wǎng)絡的學習模型,這個模型以段為基本單位,逐句閱讀文章,學習基于上文生成下文的語義規(guī)律,從而在給出題目后并由人工寫出每一個段落的首句后,模型自動生成剩余的句子。
這意味小冰是個“半自動”的選手,一篇文章的好壞、文風,很大程度上還依賴寫首句的人。
“以前的機器學習更多屬于自動化的范疇,人工智能模型根據(jù)輸入的內容,可以去完成同樣的任務。而現(xiàn)在的大規(guī)模語言模型改變了這種模式。好比教一個孩子游泳,結果發(fā)現(xiàn)他會爬樹、踢足球,打乒乓……它有了自主學習的能力,或者說它從之前的語料學習過程中,獲得了承擔新任務的能力?!本W(wǎng)易有道首席科學家段亦濤在近日的直播中稱。
段亦濤認為,和之前能夠交互的模型非常不一樣,ChatGPT更像人了。這種技術突破是非常大的進展,“在這個技術成熟之前,我們都談不上人工智能,它出現(xiàn)之后,我們才摸到了人工智能的門檻?!?/p>
當人們驚嘆于ChatGPT“上知天文、下知地理”的聰明時,也難以忽略它的昂貴。
據(jù)21財經(jīng)援引業(yè)內人士消息,擁有1750億個參數(shù)的GPT-3因其巨大的每秒浮點計算量,單次訓練成本達到460萬美元。眼下最主流的英偉達A100芯片,單次訓練的使用量應達到數(shù)百片,成本在3000萬元左右。
這注定是一場只有巨頭才有入門券資格的游戲。那么問題來了,教育公司如果想要入局分一杯羹,是否有能力或者說有必要再造一個大模型?還是說通過購買調取現(xiàn)有大模型,進行更偏自身業(yè)務屬性的調適?
段亦濤曾在上述直播中稱,“這次技術更新是一次顛覆性的創(chuàng)新,但在細分場景的應用過程中實際上并不需要這樣一個大而全的模型,更需要一些縱深向的探索。比如,有道正在探索ChatGPT同源技術AIGC在學習場景中的落地,這個過程加深了我們對于ChatGPT的進一步理解?!?/p>
西部證券在日前研報中指出,中國AIGC產(chǎn)業(yè)仍處于發(fā)展初期,最先興起的是AI寫作和語音合成模塊,虛擬人概念剛興起,底層技術較國外仍有較大差距。眾多國內廠商從內容布局入手,目前商業(yè)模式不成熟,還停留在免費引流階段。
該機構認為,AIGC目前主要客戶集中在B端,廠商話語權較弱,未來會向2B+2C方向發(fā)展,B端降本增效是根本訴求,C端的付費邏輯在于高效獲取信息,替代表達以及擴大用戶創(chuàng)造力。
“2023年有望成為AIGC發(fā)展大年。類似ChatGPT的大模型作為AIGC的底層平臺,將成為核心資源?!蔽鞑孔C券稱。
科大訊飛在公開發(fā)言中,則透露了其有信心在預訓練認知智能大模型上代表中國實現(xiàn)突破。
在1月31日披露的投資者關系活動記錄表中,科大訊飛稱,自2018年起,預訓練模型范式就逐步開始在自然語言處理領域應用,包括谷歌、微軟、OpenAI、科大訊飛、智源、鵬城等單位陸續(xù)推出預訓練模型。
科大訊飛陸續(xù)開源了六大類、超40個通用領域的系列中文預訓練語言模型,開源三年模型庫月均調用量超千萬,并自稱是“業(yè)界最廣泛流行的中文預訓練模型之一”,在GitHub(面向開源及私有軟件項目的托管平臺)的中文預訓練模型的星標數(shù)達13346位列第一。
去年,該公司發(fā)布了面向多模態(tài)領域的兩個輕量級預訓練模型,并表示“在參數(shù)量遠小于業(yè)界公開模型20倍以上的情況下,識別效果提升20%-30%”。
據(jù)自媒體數(shù)智前線援引業(yè)內人士觀點稱,整個互聯(lián)網(wǎng)的中文數(shù)據(jù)質量,相比于英文還是有明顯差距,需要做中英文不同語言之間的數(shù)據(jù)互補。目前全球還沒有能跟ChatGPT抗衡的大模型,業(yè)界共識是差距在兩年以上。國內先不談彎道超車,趁早追趕反而是更重要的。
掃描二維碼推送至手機訪問。
版權聲明:本文由財神資訊-領先的體育資訊互動媒體轉載發(fā)布,如需刪除請聯(lián)系。