設置
    • 日夜間
      隨系統
      淺色
      深色
    • 主題色

    馬斯克用行動反擊 開源自家頂級大模型 壓力給到OpenAI

    2024-03-20 17:23:16 來源:

      馬斯克用行動反擊 開源自家頂級大模型 壓力給到OpenAInKN流量資訊——探索最新科技、每天知道多一點www.hxg123.cn

      《科創板日報》3月18日訊(編輯 宋子喬) 似乎是為了表明自己始終堅持對AI模型開源,馬斯克做出了與阿爾特曼全然不同的選擇。3月17日,馬斯克宣布開源Grok-1,這使得Grok-1成為當前參數量最大的開源大語言模型,擁有3140億參數,遠超OpenAI GPT-3.5的1750億。nKN流量資訊——探索最新科技、每天知道多一點www.hxg123.cn

      有意思的是,Grok-1宣布開源的封面圖為Midjourney生成,可謂“AI helps AI”。nKN流量資訊——探索最新科技、每天知道多一點www.hxg123.cn

      一直吐槽OpenAI不open的馬斯克,自然要在社交平臺上含沙射影一番,“我們想了解更多OpenAI的開放部分。”nKN流量資訊——探索最新科技、每天知道多一點www.hxg123.cn

      Grok-1遵照Apache 2.0協議開放模型權重和架構。這意味著它允許用戶自由地使用、修改和分發軟件,無論是個人還是商業用途。這種開放性鼓勵了更廣泛的研究和應用開發。項目發布至今,已經在GitHub上攬獲6.5k星標,熱度還在持續增加。nKN流量資訊——探索最新科技、每天知道多一點www.hxg123.cn

      項目說明中明確強調,由于Grok-1是一個規模較大(314B參數)的模型,需要有足夠GPU內存的機器才能使用示例代碼測試模型。網友表示這可能需要一臺擁有628 GB GPU內存的機器。nKN流量資訊——探索最新科技、每天知道多一點www.hxg123.cn

      此外,該存儲庫中MoE層的實現效率并不高,之所以選擇該實現是為了避免需要自定義內核來驗證模型的正確性。nKN流量資訊——探索最新科技、每天知道多一點www.hxg123.cn

      目前已開源的熱門大模型包括Meta的Llama2、法國的Mistral等。通常來說,發布開源模型有助于社區展開大規模的測試和反饋,意味著模型本身的迭代速度也能加快。nKN流量資訊——探索最新科技、每天知道多一點www.hxg123.cn

      Grok-1是一個混合專家(Mixture-of-Experts,MOE)大模型,由馬斯克旗下的AI創企xAI在過去4個月里開發。回顧該模型的開發歷程:nKN流量資訊——探索最新科技、每天知道多一點www.hxg123.cn

      在宣布成立xAI之后,相關研究人員首先訓練了一個330億參數的原型語言模型(Grok-0),這個模型在標準語言模型測試基準上接近LLaMA2(70B)的能力,但使用了更少的訓練資源;nKN流量資訊——探索最新科技、每天知道多一點www.hxg123.cn

      之后,研究人員對模型的推理和編碼能力進行了重大改進,最終開發出了Grok-1并于2023年11月發布,這是一款功能更為強大的SOTA語言模型,在HumanEval編碼任務中達到了63.2%的成績,在MMLU中達到了73%,超過了其計算類中的所有其他模型,包括ChatGPT-3.5和Inflection-1。nKN流量資訊——探索最新科技、每天知道多一點www.hxg123.cn

      與其他大模型相比,Grok-1的優勢在哪呢?nKN流量資訊——探索最新科技、每天知道多一點www.hxg123.cn

      xAI特別強調,Grok-1是他們自己從頭訓練的大模型,即從2023年10月開始使用自定義訓練堆棧在JAX和Rust上訓練,沒有針對特定任務(如對話)進行微調;nKN流量資訊——探索最新科技、每天知道多一點www.hxg123.cn

      Grok-1的一個獨特而基本的優勢是,它可以通過X平臺實時了解世界,這使得它能夠回答被大多數其他AI系統拒絕的辛辣問題。Grok-1發布版本所使用的訓練數據來自截至2023年第三季度的互聯網數據和xAI的AI訓練師提供的數據;nKN流量資訊——探索最新科技、每天知道多一點www.hxg123.cn

      3140億參數的Mixture-of-Experts模型,其對于每個token,活躍權重比例為25%,這一龐大的參數量為其提供了強大的語言理解和生成能力。nKN流量資訊——探索最新科技、每天知道多一點www.hxg123.cn

      xAI此前介紹,Grok-1將作為Grok背后的引擎,用于自然語言處理任務,包括問答、信息檢索、創意寫作和編碼輔助。未來,長上下文的理解與檢索、多模態能力都是該模型將會探索的方向之一。nKN流量資訊——探索最新科技、每天知道多一點www.hxg123.cn

    本文鏈接:馬斯克用行動反擊 開源自家頂級大模型 壓力給到OpenAIhttp://www.www.hxg123.cn/show-2-3998-0.html

    聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。

    上一篇: 馬斯克開源3140億參數的Grok,大模型爭相開源所為何求?

    下一篇: AI領域,重磅消息傳來!

    熱門資訊

    • 站在“人工智能+”探索前列

      今年全國兩會期間,人工智能成為熱點話題,“人工智能+”首次被寫入政府工作報告。一頭連著數字經濟發展大局,一頭連著行業變革與創新,“人工智能+”既是

    • 聚焦AWE2024|從單品升級到構建生態 家電產業智能化仍需突破與完善

      南方財經全媒體記者 吳立洋 上海報道日前,2024中國家電及消費電子博覽會(AWE)在上海新國際博覽中心閉幕。作為一年一度的家電產業盛會,AWE既是

    • 我國首個適應高寒氣候肉羊品種通過鑒定

      記者19日從蘭州大學獲悉,天華肉羊通過國家畜禽遺傳資源委員會審定鑒定,成為我國首個適應高寒氣候的肉羊品種。該品種由蘭州大學草地農業科技學院李發

    • 感染新冠會“導致智商下降”嗎?

      據英國《泰晤士報》網站3月15日報道,2020年1月,英國帝國理工學院的亞當·漢普希爾與英國廣播公司合作,對8萬人進行了30分鐘的測試,目的是揭示生

    • 人工智能重新定義職場技能

      據阿根廷布宜諾斯艾利斯經濟新聞網2月19日報道,在人工智能(AI)迅速重新定義就業格局的今天,通常被稱為“軟”技能的人類技能成為最有韌性、最有價值

    • 我國科學家揭示東北黑土成因

      記者3月20日從中國科學院地質與地球物理研究所獲悉,該所科研人員在東北黑土區開展了大范圍的野外調查和樣品采集工作,通過分析采集的黑土樣品發現,黑

    • 每12個恒星或有一個吞過行星

      據《自然》20日消息稱,天文學家對91對恒星所作的光譜分析顯示,大約每12個恒星中就有一個可能吞噬了一個行星。在吞噬一個行星后,恒星的化學構成可能發

    • 一種新的結核病候選疫苗在南非啟動Ⅲ期臨床試驗

      在3月24日世界防治結核病日前夕,比爾及梅琳達?蓋茨醫學研究所(以下簡稱蓋茨醫學研究所)宣布,啟動評估結核病候選疫苗M72有效性的Ⅲ期臨床試驗。在Ⅱb

    • CSHIA與創米數聯聯合發布《2024智能門創新趨勢報告》

      2024年03月19日,以“初心如磐•向新出發”為主題的2024智能家居UP峰會CSHIA智能家居開年盛典在杭州成功舉行。大會現場,由全國專業標準化技術委

    • 我國成功發射云海二號02組衛星

        我國成功發射云海二號02組衛星  中新網北京3月21日電(馬帥莎 曹譯 張艷)北京時間2024年3月21日13時27分,我國在酒泉衛星發射中心使用長征二號丁運載火箭/遠征三號上面

    • “AI鋼鐵俠”黃仁勛,又進化了英偉達

        “AI鋼鐵俠”黃仁勛,又進化了英偉達  作 者丨倪雨晴  2024年,英偉達一年一度的GTC大會已然成為AI界春晚,現場座無虛席,全球AI愛好者翹首以待黃仁勛的獨家SOLO。  北京

    • 京東與OPPO重磅合作:銷售額3年翻倍!

      3月23日消息,京東與OPPO戰略合作協議簽約儀式舉行,雙方簽訂未來三年OPPO在京東全渠道實現銷售額同比增長100%的目標。在簽約儀式上,OPPO高級副CEO、首席產

    推薦資訊

    • 日榜
    • 周榜
    • 月榜