設(shè)置
    • 日夜間
      隨系統(tǒng)
      淺色
      深色
    • 主題色

    Kimi掀起國產(chǎn)大模型長文本競賽

    2024-03-25 12:58:17 來源:

    作為月之暗面的創(chuàng)始人,楊植麟常把他的AGI夢想形容為“登月計(jì)劃”,長文本就是這個(gè)偉大計(jì)劃的第一步。但現(xiàn)在,隨著Kimi的爆火出圈,賽道瞬間變得擁擠,24小時(shí)內(nèi),阿里、360、百度緊急“出手”,紛紛入局長文本賽道。N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    大廠的加入,讓月之暗面充滿理想化色彩的“登月計(jì)劃”有了更接地氣、更市場化的一面——從千億參數(shù)到千萬長文本,大模型好像又“卷”出了新高度。而一同被“卷”起來的,還有大模型的商業(yè)化進(jìn)程。N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    內(nèi)卷長文本

    Kimi像條“鲇魚”,用200萬字無損上下文激活了整個(gè)國產(chǎn)大模型市場。3月23日,360智腦宣布正式內(nèi)測500萬字長文本處理功能,該功能即將入駐360 AI瀏覽器,同時(shí)360 AI瀏覽器App也即將上線。N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    3月22日晚上,阿里通義千問宣布,向所有人免費(fèi)開放1000萬字的長文檔處理功能,成為全球文檔處理容量第一的AI應(yīng)用。與此同時(shí),也有媒體從知情人士處獲悉,百度文心一言下個(gè)月將進(jìn)行版本升級,屆時(shí)也將開放長文本能力,文字范圍會(huì)在200萬—500萬。N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    Kimi是月之暗面推出的一款智能助手。3月18日,月之暗面宣布Kimi智能助手已支持200萬字超長無損上下文,并于即日起開啟產(chǎn)品內(nèi)測。去年10月剛發(fā)布時(shí),Kimi可支持的無損上下文輸入長度為20萬字。3月21日,因過于火爆,Kimi一度“宕機(jī)”。N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    天使投資人、資深人工智能專家郭濤對北京商報(bào)記者分析稱,200萬字的長文本處理能力是一個(gè)巨大的技術(shù)突破,這意味著AI模型可以理解和生成更復(fù)雜、更豐富的內(nèi)容,這對于許多應(yīng)用場景,如自動(dòng)寫作、內(nèi)容生成、信息檢索等,都具有重要的價(jià)值。N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    這可能也是Kimi引爆市場的關(guān)鍵。N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    3月22日,“Kimi概念”進(jìn)入持續(xù)火爆的第四天,不過資本市場上已出現(xiàn)分化跡象,當(dāng)天收盤,掌閱科技、中廣天擇收獲三連板,因賽集團(tuán)股價(jià)則跌超4%,電廣傳媒跌超3%。N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    財(cái)經(jīng)評論員張雪峰對北京商報(bào)記者提到,這一突破意味著在自然語言處理領(lǐng)域,特別是文本生成和理解方面,Kimi取得了重大進(jìn)展,其主要技術(shù)突破包括長文本處理能力、上下文理解和訓(xùn)練技術(shù)三個(gè)方面。N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    以長文本處理能力為例,Kimi能夠處理長達(dá)200萬字的文本,而且在處理過程中不會(huì)出現(xiàn)信息丟失或失真的情況。這種能力在以往的自然語言處理模型中很難實(shí)現(xiàn),因?yàn)殚L文本的處理需要更大的內(nèi)存和更復(fù)雜的模型結(jié)構(gòu)。N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    AGI的初心

    20萬到200萬的變化,不止在于字?jǐn)?shù)的簡單累積,更在于“無損”和它們共同指向的AGI目標(biāo)。N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    楊植麟曾解釋稱,通往AGI,無損的長上下文將會(huì)是一個(gè)很關(guān)鍵的基礎(chǔ)技術(shù)。從Word2vec到RNN、LSTM,再到Transformer,歷史上所有的模型架構(gòu)演進(jìn),本質(zhì)上都是在提升有效的、無損的上下文長度。N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    “上下文長度可能存在摩爾定律,但需要同時(shí)優(yōu)化長度和無損壓縮水平兩個(gè)指標(biāo),才是有意義的規(guī)?;?。”楊植麟說。N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    月之暗面曾介紹,從20萬字到200萬字,由于沒有采用常規(guī)的漸進(jìn)式提升路線,月之暗面團(tuán)隊(duì)遇到的技術(shù)難度也是指數(shù)級增加的。N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    為了達(dá)到更好的長窗口無損壓縮性能,月之暗面研發(fā)和技術(shù)團(tuán)隊(duì)從模型預(yù)訓(xùn)練到對齊、推理環(huán)節(jié)均進(jìn)行了原生的重新設(shè)計(jì)和開發(fā),不走“滑動(dòng)窗口”“降采樣”等技術(shù)捷徑,攻克了很多底層技術(shù)難點(diǎn)。N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    但字?jǐn)?shù)累積的表象以及大廠相繼亮出同類型產(chǎn)品的情況,也讓“吃瓜群眾”對于所謂的技術(shù)突破有些疑慮。N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    在接受北京商報(bào)記者采訪時(shí),伽利略資本合伙人鄭譞做了一個(gè)類比,對象就是不久前火爆全球的文生視頻大模型Sora。N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    鄭譞解釋稱,文生視頻可以看做是連續(xù)的文生圖,從理論層面上,可能并不是顛覆性的突破,但是做到穩(wěn)定生成長視頻確實(shí)有難度,更多解決的是工程上的問題。但也不能說工程上的創(chuàng)新就不是創(chuàng)新,月之暗面無損長文本可能也是這個(gè)道理。N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    概括起來,從底層技術(shù)上來看,Kimi可能確實(shí)沒有顛覆性的突破,更像是一個(gè)突破性技術(shù)的前序技術(shù)。N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    “長文本技術(shù)上需要解決上下文理解、長期記憶、復(fù)雜推理、多任務(wù)適應(yīng)性以及計(jì)算效率等問題,學(xué)界其實(shí)早就有一些相應(yīng)的解決方案,比如長文本處理、注意力機(jī)制優(yōu)化等,但是在復(fù)雜推理和計(jì)算效率上工程難度還是很大的,各大廠也都給出了自己的方案,只不過之前大家并沒有將‘長文本’當(dāng)成關(guān)鍵詞給予足夠的關(guān)注度?!编嵶X稱。N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    郭濤也提到,從目前公開資料來看,Kimi的技術(shù)確實(shí)具有一定的競爭優(yōu)勢,但還不具備技術(shù)壁壘。長文本可能會(huì)成為大模型的下一個(gè)“卷”的領(lǐng)域,因?yàn)檫@是一個(gè)具有廣泛應(yīng)用前景和商業(yè)價(jià)值的研究方向。N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    不過在鄭譞看來,月之暗面與其他人工智能企業(yè)真正的不同點(diǎn),并不在于技術(shù)乃至商業(yè)化路線的差異,而在于“初心”的不同。N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    鄭譞將楊植麟形容為一個(gè)“富有理想主義的創(chuàng)始人”“他的目標(biāo)就是打造自己理想的AGI,而不是從落地或者務(wù)實(shí)的視角去思考當(dāng)下的問題”。N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    商業(yè)化“肉搏”

    理想化的月之暗面,也不能完全“脫俗”。Kimi爆火時(shí),有媒體報(bào)道稱,月之暗面相關(guān)負(fù)責(zé)人提到,年內(nèi)將有商業(yè)化初步方案。對于具體的商業(yè)化路徑以及大廠競相加入是否會(huì)對Kimi的商業(yè)化產(chǎn)生影響等問題,北京商報(bào)記者聯(lián)系了月之暗面,但截至發(fā)稿未收到回復(fù)。N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    鄭譞猜測,相較于特定應(yīng)用,Kimi的商業(yè)化可能類似于OpenAI,更傾向于一種通用性的商業(yè)化,例如商業(yè)化的高端接入入口用以擴(kuò)展客戶的應(yīng)用等。N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    目前已有多家企業(yè)確認(rèn)了與Kimi的合作。例如3月24日,萬興科技對外透露,公司旗下視頻創(chuàng)意軟件萬興喵影已率先接入Kimi,其AI寫文案功能當(dāng)前已采用Kimi大模型服務(wù),萬興科技正加速旗下其他產(chǎn)品對Kimi的對接測試。N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    而對于大廠紛紛加入長文本競爭的原因,張雪峰認(rèn)為,長文本處理能力是自然語言處理領(lǐng)域的一個(gè)重要方向,而且隨著信息量的增加,對長文本處理能力的需求也越來越迫切。N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    張雪峰進(jìn)一步補(bǔ)充稱,Kimi的技術(shù)突破表明長文本處理已經(jīng)成為可能,因此大廠紛紛投入研發(fā)長文本處理技術(shù),以保持競爭力和領(lǐng)先地位。另外,長文本處理也是滿足用戶需求的重要途徑,可以為用戶提供更全面、準(zhǔn)確的信息服務(wù)。N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    至于大廠的入局,是否會(huì)給月之暗面商業(yè)化造成影響,鄭譞則給出了否定的回答,原因在于“雖然都在講長文本,但大家的側(cè)重點(diǎn)顯然是千差萬別的,而且各家所追求的愿景也有著天壤之別”。N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    回歸“為什么是Kimi”的問題,中信建投研報(bào)提到,月之暗面打造高關(guān)注度應(yīng)用Kimi Chat,一方面在于核心團(tuán)隊(duì)技術(shù)背景深,另一方面在于產(chǎn)品面向C端免費(fèi)開放,注重產(chǎn)品運(yùn)營。N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    據(jù)悉,月之暗面目前在招的31個(gè)崗位中,其中6個(gè)為市場、運(yùn)營類崗位,包括達(dá)人運(yùn)營、國內(nèi)廣告投放等?!澳壳罢心几嗍袌?、運(yùn)營類人才,后續(xù)有望推動(dòng)產(chǎn)品進(jìn)一步破圈。”研報(bào)稱。N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    (來源:北京商報(bào) 記者:楊月涵)N46流量資訊——探索最新科技、每天知道多一點(diǎn)www.hxg123.cn

    本文鏈接:Kimi掀起國產(chǎn)大模型長文本競賽http://www.www.hxg123.cn/show-2-4134-0.html

    聲明:本網(wǎng)站為非營利性網(wǎng)站,本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請大家謹(jǐn)防詐騙!若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。

    上一篇: 不用貼膜了!huaweiMate 70系列搭載“玄武鍍膜”:防劃、防反光

    下一篇: 庫克:蘋果頭顯產(chǎn)品年內(nèi)中國上市!產(chǎn)業(yè)鏈核心供應(yīng)商揭秘

    熱門資訊

    • 我國科研團(tuán)隊(duì)揭示非洲豬瘟病毒感染致病機(jī)制

      記者3月18日從蘭州大學(xué)獲悉,該校動(dòng)物醫(yī)學(xué)與生物安全學(xué)院鄭海學(xué)教授團(tuán)隊(duì)解析了非洲豬瘟病毒(ASFV)在豬體內(nèi)感染的靶細(xì)胞,以及在靶細(xì)胞內(nèi)延長感染的機(jī)制

    • 活性氧響應(yīng)性材料 向腸炎部位精準(zhǔn)投藥

      3月17日,記者從陸軍軍醫(yī)大學(xué)西南醫(yī)院獲悉,該院消化內(nèi)科教授陳磊團(tuán)隊(duì)聯(lián)合陸軍軍醫(yī)大學(xué)教授張定林首次提出,活性氧響應(yīng)性納米材料能夠把程序性死亡配體-

    • 馬斯克用行動(dòng)反擊 開源自家頂級大模型 壓力給到OpenAI

        馬斯克用行動(dòng)反擊 開源自家頂級大模型 壓力給到OpenAI  《科創(chuàng)板日報(bào)》3月18日訊(編輯 宋子喬) 似乎是為了表明自己始終堅(jiān)持對AI模型開源,馬斯克做出了與阿爾特曼全然

    • 感染新冠會(huì)“導(dǎo)致智商下降”嗎?

      據(jù)英國《泰晤士報(bào)》網(wǎng)站3月15日報(bào)道,2020年1月,英國帝國理工學(xué)院的亞當(dāng)·漢普希爾與英國廣播公司合作,對8萬人進(jìn)行了30分鐘的測試,目的是揭示生

    • 人工智能重新定義職場技能

      據(jù)阿根廷布宜諾斯艾利斯經(jīng)濟(jì)新聞網(wǎng)2月19日報(bào)道,在人工智能(AI)迅速重新定義就業(yè)格局的今天,通常被稱為“軟”技能的人類技能成為最有韌性、最有價(jià)值

    • 睡不夠很焦慮?專家:警惕常見睡眠認(rèn)知誤區(qū)

      3月21日是世界睡眠日,今年中國主題為“健康睡眠 人人共享”。人的一生約有三分之一的時(shí)間是在睡眠中度過,睡眠、運(yùn)動(dòng)、營養(yǎng)被視為保障機(jī)體正常發(fā)育和

    • CRISPR能消除培養(yǎng)細(xì)胞中艾滋病病毒

      荷蘭阿姆斯特丹大學(xué)醫(yī)學(xué)院科學(xué)家開展的一項(xiàng)新研究證明,利用最新CRISPR-Cas基因編輯技術(shù),能消除實(shí)驗(yàn)室中受感染細(xì)胞內(nèi)所有艾滋病病毒(HIV)的痕跡,為治愈

    • 人工納米流體突觸可實(shí)現(xiàn)存內(nèi)計(jì)算

      瑞士洛桑聯(lián)邦理工學(xué)院工程學(xué)院研究團(tuán)隊(duì)制造了一種用于內(nèi)存的新型納米流體設(shè)備,這使他們第一次能連接兩個(gè)“人工突觸”。該設(shè)備為受大腦啟發(fā)的液體硬

    • 首批量子測量領(lǐng)域國家標(biāo)準(zhǔn)發(fā)布

      隨著量子技術(shù)的發(fā)展,利用量子特性突破傳統(tǒng)測量技術(shù)極限的新一代精密測量技術(shù)——量子測量開始得到應(yīng)用。記者從中國計(jì)量科學(xué)研究院獲悉,由

    • 1799元!紅米狙擊一加Ace3V 簡直就是來搗亂的

      一加Ace 3V剛發(fā)布,就被紅米砍了一刀!隨著昨天一加Ace 3V的發(fā)布,新一輪中端機(jī)的內(nèi)卷終于拉開了序幕。 而且這電話售價(jià)居然還不增反降,直接1999起步。 先來回

    • 男孩撿17歲女生iPhone電話歸還反被訛200元引熱議:最終獲道歉

      3月24日消息,今日一則#男孩撿17歲女生電話歸還反被訛200#的話題登上微博熱搜,引發(fā)網(wǎng)民熱議。據(jù)報(bào)道,3月23日,山西長治。郭女士父親撿到一臺iPhone電話,歸還

    • 北京市青少年科學(xué)教育基地揭牌

      為構(gòu)建有效聯(lián)動(dòng)、密切配合的青少年科學(xué)教育協(xié)同機(jī)制,提升科學(xué)教育實(shí)施效能,3月23日,北京市關(guān)心下一代工作委員會(huì)(以下簡稱“北京市關(guān)工委”)、北京市科

    推薦資訊

    • 日榜
    • 周榜
    • 月榜