4月26日,訊飛星火大模型V3.5(以下簡稱“訊飛星火”)春季上新。面向用戶高效準(zhǔn)確知識獲取的痛點(diǎn),科大訊飛發(fā)布業(yè)界首個長文本、長圖文、長語音大模型,不僅能夠把各種信息來源的海量文本、圖文資料、會議錄音等進(jìn)行快速學(xué)習(xí),還能夠在各種行業(yè)場景給出專業(yè)、準(zhǔn)確回答。
科大訊飛進(jìn)一步升級星火語音大模型,首發(fā)多情感超擬人合成,具備情緒表達(dá)能力,并推出一句話聲音復(fù)刻功能,讓科技更有溫度。
同時,面向企業(yè)應(yīng)用場景,科大訊飛推出星火智能體平臺,幫助企業(yè)解決大模型落地的最后一公里難題。
持續(xù)用技術(shù)進(jìn)步解決真實(shí)剛需,訊飛星火也在獲得越來越多用戶的認(rèn)可。據(jù)七麥數(shù)據(jù)顯示,訊飛星火APP在安卓端的下載量已經(jīng)超過9600萬次,在國內(nèi)工具類通用大模型APP中排名第一。
首發(fā)長文本、長圖文、長語音大模型,助力知識高效獲取
為什么科大訊飛要做長文本、長圖文、長語音的大模型?
通過訊飛星火APP可以看到,用戶使用的最高峰不是周末,而是工作日的上午9:30和下午3:30。這意味著,大部分用戶用訊飛星火來解決和工作相關(guān)的剛需問題。而高效的知識獲取是用戶和開發(fā)者都高度關(guān)注的問題。
科大訊飛分析發(fā)現(xiàn),在知識獲取和學(xué)習(xí)的過程中,廣大用戶能拿到的資料往往不僅是現(xiàn)成的長文本,還有隨手可見的報刊書籍內(nèi)容、各種研討會的PPT內(nèi)容,老師黑板上的板書、同學(xué)的筆記,以及各種會議錄音、訪談,各種網(wǎng)上的發(fā)布會、培訓(xùn)教育視頻等,能不能把這些文本、圖片、語音等都上傳到訊飛星火中,快速地獲取知識?
為此,科大訊飛推出首個支持長文本、長圖文、長語音的大模型,來解決用戶真實(shí)場景中多源信息的獲取需求。
本次訊飛星火長文本功能全新升級后,具備長文檔信息抽取、長文檔知識問答、長文檔歸納總結(jié)、長文檔文本生成等能力,總體已經(jīng)達(dá)到GPT-4 Turbo 4月最新長文本版本的97%水平,而在銀行、保險、汽車、電力等多個垂直領(lǐng)域的知識問答任務(wù)上,訊飛星火長文本總體水平已經(jīng)超過GPT-4 Turbo。
長文本功能的落地需要解決信息高效處理的問題:面對上百萬甚至上千萬文字,長文本大模型消耗的運(yùn)算資源非常大。
為了解決大模型應(yīng)用效率和準(zhǔn)確率問題,劉慶峰談道,基于訊飛星火V3.5對長文本的理解、學(xué)習(xí)、回答能力,科大訊飛進(jìn)行了重要的模型剪枝和蒸餾,從而推出業(yè)界性能最優(yōu)的130億參數(shù)的大模型,在效果損失僅3%以內(nèi)的情況下,使得星火在文檔上傳解析處理、知識問答的首響時間以及文字生成方面都獲得了極大的效率提升。測試顯示,在保障長文本效果的情況下,無論是10K、64K、128K token,還是更長的文本上,星火大模型的性能都做到業(yè)界最優(yōu)。
面向復(fù)雜的圖文場景,科大訊飛在圖文識別、公式識別大賽多年國際第一的技術(shù)積累基礎(chǔ)上,首次推出星火圖文識別大模型。
相比傳統(tǒng)小模型逐行文字識別的限制,星火圖文識別大模型具有三大優(yōu)勢:1)能夠直接處理非常復(fù)雜的版面分析,目前已經(jīng)覆蓋31個典型場景,比如書刊、學(xué)術(shù)論文、專利、報紙、海報、PPT等,同時能自動識別標(biāo)注出18類不同的版面要素,比如頁眉、頁腳、標(biāo)題、段落、表格、公式、印章、手寫等;2)融合篇章上下文語義進(jìn)行文字識別,識別更精準(zhǔn);3)面向教育、金融、醫(yī)療、科研等專業(yè)領(lǐng)域深度優(yōu)化,能自動實(shí)現(xiàn)更多領(lǐng)域的專業(yè)符號識別。
根據(jù)國際公開的權(quán)威英文測試集來看,訊飛星火的圖文識別效果超過微軟和谷歌。從典型應(yīng)用場景來看,在科研、金融以及企業(yè)產(chǎn)品技術(shù)文檔等識別效果都處于業(yè)界領(lǐng)先地位。
此外,面對廣泛的音視頻信息高效獲取需求,科大訊飛也推出長語音功能,將國際領(lǐng)先的語音識別和翻譯技術(shù)結(jié)合起來,可以實(shí)現(xiàn)會議錄音、學(xué)習(xí)視頻等的一鍵研讀,實(shí)現(xiàn)音視頻場景的高效知識獲取。
發(fā)布合同助手、升級AI學(xué)習(xí)機(jī),以技術(shù)進(jìn)步解決真實(shí)剛需
訊飛星火長文本、長圖文、長語音能力的升級,進(jìn)一步推動大模型在各個場景的落地。劉慶峰重點(diǎn)介紹了訊飛星火在招投標(biāo)、合同、教育等場景下的應(yīng)用。
在招投標(biāo)場景,此前憑借訊飛星火領(lǐng)先的文本理解、邏輯推理和數(shù)學(xué)能力,科大訊飛和國家能源物資公司在企業(yè)采購場景合作了智能無人評審系統(tǒng),已經(jīng)在國資委網(wǎng)站上被作為典型案例推薦。據(jù)介紹,在國家能源集團(tuán)已評審5.7萬余單,評審準(zhǔn)確率達(dá)97%。這一次,疊加本次升級的長文本和長圖文能力,可以讓評標(biāo)更便捷、更高效、更準(zhǔn)確。
日常生活中,我們在買賣商品、裝修房屋或者是購買汽車保險時經(jīng)常會遇到各種各樣的合同,看不懂存在風(fēng)險怎么辦?科大訊飛推出星火合同助手,它可以對我們的合同進(jìn)行風(fēng)險審核、合同比對,摘要總結(jié)以及合同生成,迅速識別潛在風(fēng)險漏洞,成為你口袋里的“法務(wù)助手”。
在教育場景,科大訊飛進(jìn)一步升級了訊飛AI學(xué)習(xí)機(jī)產(chǎn)品,不僅對作文的批改、對理科的批改更加精準(zhǔn),也讓智能化輔學(xué)更有針對性更高效;也結(jié)合本次多模態(tài)能力升級了百科問答功能,星火大模型理解并融合了大量圖書知識,對于孩子的奇思妙問等復(fù)雜問題,“愛因斯坦”和他的大咖虛擬人朋友都能回答,讓孩子們在趣味互動中學(xué)知識、長見識,同時提升了孩子主動提問的意愿和能力。
智慧黑板也再次升級,搭載長文本和長語音能力,讓實(shí)錄轉(zhuǎn)寫效率得以提升的同時,提升篇章梳理能力。其次是星火教師助手,融入長文本能力后,可以把優(yōu)質(zhì)教輔內(nèi)容融入,教師在備課的過程中就可以直接融入教輔教參中的內(nèi)容,進(jìn)一步豐富備課資源,提升備課效率。
此外,星火科研助手目前已在中國科學(xué)院、三亞崖州灣科技城、北京郵電大學(xué)、哈爾濱工業(yè)大學(xué)等機(jī)構(gòu)高校鋪開應(yīng)用。多模態(tài)能力升級下,訊飛星火科研助手也進(jìn)一步提升了論文問答、綜述生成、實(shí)驗(yàn)解讀等的效果,使得解析的學(xué)術(shù)資料更加豐富,進(jìn)一步賦能高校和科研院所的科研工作。
能“情感共鳴”,還能“一句話聲音復(fù)刻”
萬物互聯(lián)時代下需要更真實(shí)的AI語音交互。年初訊飛星火V3.5發(fā)布會上,科大訊飛推出了超擬人對話功能,AI的聲音更自然更真實(shí),擬人度達(dá)到了83%,受到用戶的廣泛歡迎。無論是語音可懂度、流暢度還是表現(xiàn)力,效果均超過OpenAI、微軟。
此次科大訊飛發(fā)布多情感超擬人合成,進(jìn)一步提升了情緒表達(dá)的可感知度,對高興、抱歉、安慰、撒嬌、困惑等情緒表達(dá)的可感知度達(dá)到85%以上,AI語音更加生動、真實(shí)。
昊鉑HT 2024 款車型行業(yè)率先搭載科大訊飛超擬人合成技術(shù),已在4月25日正式全球上市。
除了超擬人對話,科大訊飛還推出“一句話聲音復(fù)刻”功能,一句話就可以定制你的AI助手聲音。比如模仿小朋友的聲音,每天給爺爺奶奶讀書讀報;在我們出差的時候,模仿我們的聲音給孩子講故事。這個功能可以讓世界變得更有溫度。
劉慶峰談道,科大訊飛在個性化語音合成一直處于業(yè)界領(lǐng)先,目前已進(jìn)階至一句話聲音復(fù)刻。當(dāng)年訊飛AI模仿林志玲的聲音需要去臺灣錄一個星期的聲音,到后來模仿郭德綱需要一天的聲音,再往后需要5分鐘的錄音,現(xiàn)在一句話就可以模仿。大家可以在訊飛星火APP上體驗(yàn)。
發(fā)布星火智能體平臺,為企業(yè)注入新質(zhì)生產(chǎn)力
自今年1月30日發(fā)布以來,訊飛星火V3.5作為首個全國產(chǎn)算力訓(xùn)練的大模型,受到了各行業(yè)伙伴和開發(fā)者的廣泛歡迎。據(jù)劉慶峰介紹,大模型云邊端的整體解決方案正在賦能汽車、家電、運(yùn)營商等越來越多的行業(yè);在過去不到3個月的時間里,訊飛新增了55萬實(shí)名認(rèn)證的開發(fā)者,其中一半以上來自企業(yè)。
對企業(yè)來說,如何高效地獲取和學(xué)習(xí)知識同樣是痛點(diǎn),科大訊飛給出的答案是智能體,并面向企業(yè)場景推出全新的智能體平臺。
企業(yè)構(gòu)建智能體的環(huán)節(jié)主要涉及任務(wù)理解、外部信源打通、內(nèi)部各個IT系統(tǒng)打通以及私域知識深入融合等環(huán)節(jié),最終根據(jù)每個任務(wù)的執(zhí)行結(jié)果輸出答案,這樣一個完整的過程才能夠最終完成智能體的構(gòu)建。
劉慶峰談道,在訊飛星火智能體平臺上,針對用戶的輸入,首先,基于訊飛星火大模型非常聰明的底座能力,會自動實(shí)現(xiàn)用戶輸入的精準(zhǔn)理解和任務(wù)規(guī)劃。其次,解析完了相關(guān)的任務(wù)和對應(yīng)的工具之后,訊飛星火也構(gòu)建形成了包括天氣、航班、企查查等成體系的外部信息來源的對接;同時,星火智能體平臺還通過互認(rèn)證的機(jī)制,實(shí)現(xiàn)了往往是獨(dú)立的、隔離的OA系統(tǒng)、CRM系統(tǒng)以及ERP系統(tǒng)的打通,完成相應(yīng)操作;最后,通過私域知識融入機(jī)制,智能體平臺很容易實(shí)現(xiàn)企業(yè)所屬行業(yè)以及企業(yè)私域知識的融入,實(shí)現(xiàn)更精準(zhǔn)的專業(yè)理解和知識問答。
此外,星火智能體平臺還可以通過拖拽方式實(shí)現(xiàn)新智能體的創(chuàng)建和多智能體的協(xié)作。星火智能體平臺,敏捷觸達(dá)大模型應(yīng)用企業(yè)落地的最后一公里。
據(jù)劉慶峰透露,科大訊飛將在6月27日發(fā)布訊飛星火大模型V4.0,進(jìn)一步解放生產(chǎn)力、釋放想象力。
今年全國兩會上,開展“人工智能+”行動,加快發(fā)展新質(zhì)生產(chǎn)力首次寫入《政府工作報告》。大模型帶來的知識管理革命正在上演,無論企業(yè)還是個人,都可以站在人工智能的肩膀上,實(shí)現(xiàn)新的比較優(yōu)勢。
責(zé)任編輯:莊婷婷
已有0人發(fā)表了評論