亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

與ChatGPT性能最相匹配的開源模型

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 2023-04-06 10:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

前言

最近由UC Berkeley、CMU、Stanford, 和 UC San Diego的研究人員創(chuàng)建的 Vicuna-13B,通過在 ShareGPT 收集的用戶共享對話數(shù)據(jù)中微調 LLaMA獲得。其中使用 GPT-4 進行評估,發(fā)現(xiàn)Vicuna-13B 的性能達到了ChatGPT 和 Bard 的 90% 以上,同時在 90% 情況下都優(yōu)于 LLaMA 和 Alpaca 等其他模型。訓練 Vicuna-13B 的費用約為 300 美元。訓練和代碼[1]以及在線演示[2]已公開。

Vicuna到底怎么樣?

Vicuna在官網中通過和Alpaca、LLaMA、ChatGPT和Bard對比,然后通過GPT4當裁判來打出分數(shù),具體如下。

13c714ec-d401-11ed-bfe3-dac502259ad0.png

問題

13de1fde-d401-11ed-bfe3-dac502259ad0.png

Alpaca-13b vs Vicuna

140b2c9a-d401-11ed-bfe3-dac502259ad0.png

LLaMA-13b vs Vicuna

1430ff2e-d401-11ed-bfe3-dac502259ad0.png

ChatGPT vs Vicuna

1454ff3c-d401-11ed-bfe3-dac502259ad0.png

Bard vs Vicuna

可以看出,Vicuna的回答還是非常棒的,讓GPT4來打分,Vicuna和ChatGPT是十分接近的,遠遠高于Alpaca和LLaMA。

如果大家想試試別的問題,可以自己去嘗試[3]哈。

1476f48e-d401-11ed-bfe3-dac502259ad0.png

可換不同類型的不同問題

然而,官方認為評估聊天機器人絕非易事,聽過GPT4進行評估是一件十分不嚴格的事情,但是目前還是無法解決評估的問題,需要后續(xù)學者進行進一步探索。

148f1b54-d401-11ed-bfe3-dac502259ad0.png

圖1 GPT-4 評估

在線demo

14a82ec8-d401-11ed-bfe3-dac502259ad0.png

概述

14cef7ec-d401-11ed-bfe3-dac502259ad0.png

圖2 工作流

圖 2 介紹了整體工作流程。訓練是在一天時間在 8 個 A100 上使用 PyTorch FSDP 完成的。 LLaMA、Alpaca、ChatGPT 和 Vicuna 的詳細比較如表 1 所示。

14f36212-d401-11ed-bfe3-dac502259ad0.png

表1 一些模型的對比

訓練

Vicuna 是通過使用從 ShareGPT.com 使用公共 API 收集的大約 7萬 用戶共享對話微調 LLaMA 基礎模型創(chuàng)建的。為了確保數(shù)據(jù)質量,將 HTML 轉換回 markdown 并過濾掉一些不合適或低質量的樣本。此外,將冗長的對話分成更小的部分,以適應模型的最大上下文長度。

訓練方法建立在斯坦福alpaca的基礎上,并進行了以下改進。

內存優(yōu)化:為了使 Vicuna 能夠理解長上下文,將最大上下文長度從alpaca 中的 512 擴展到 2048。還通過gradient checkpointingflash attentio來解決內存壓力。

多輪對話調整訓練損失考慮多輪對話,并僅根據(jù)聊天機器人的輸出進行微調。

通過 Spot 實例降低成本:使用 SkyPilot 托管點來降低成本。該解決方案將 7B 模型的訓練成本從 500 美元削減至 140 美元左右,將 13B 模型的訓練成本從 1000 美元左右削減至 300 美元。

150d9588-d401-11ed-bfe3-dac502259ad0.png

圖3 通過GPT4來評估打分

153299aa-d401-11ed-bfe3-dac502259ad0.png

通過GPT4評估得出的總分






審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    213

    文章

    30401

    瀏覽量

    218825
  • CMU
    CMU
    +關注

    關注

    0

    文章

    21

    瀏覽量

    15555
  • GPT
    GPT
    +關注

    關注

    0

    文章

    368

    瀏覽量

    16677
  • ChatGPT
    +關注

    關注

    30

    文章

    1595

    瀏覽量

    10011

原文標題:Vicuna:與ChatGPT 性能最相匹配的開源模型

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    OpenAI發(fā)布2款開源模型

    OpenAI開源了兩款高性能權重語言模型gpt-oss-120b和gpt-oss-20b,OpenAI CEO Sam Altman表示:「gpt-oss 發(fā)布了!我們做了一個開放模型
    的頭像 發(fā)表于 08-06 14:25 ?829次閱讀

    【VisionFive 2單板計算機試用體驗】3、開源大語言模型部署

    , Gemma等開源模型。當然,一些閉源的(類似chatgpt, gemini)是不支持部署的。如下圖: 在端側部署大模型,個人認為最大的好處:是可以避免因文本或圖片上傳而造成的信
    發(fā)表于 07-19 15:45

    上新:小米首個推理大模型開源 馬斯克:下周推出Grok 3.5

    開源新一代通義千問模型Qwen3。據(jù)悉,Qwen3模型參數(shù)量僅為DeepSeek - R1的1/3,能夠大幅降低成本,而且性能全面超越R1、OpenAI - o1等全球頂尖
    的頭像 發(fā)表于 04-30 16:08 ?1070次閱讀

    構建開源OpenVINO?工具套件后,模型優(yōu)化器位于何處呢?

    構建開源OpenVINO?工具套件后,模型優(yōu)化器位于何處?
    發(fā)表于 03-06 08:18

    AI開源模型庫有什么用

    AI開源模型庫作為推動AI技術發(fā)展的重要力量,正深刻改變著我們的生產生活方式。接下來,AI部落小編帶您了解AI開源模型庫有什么用。
    的頭像 發(fā)表于 02-24 11:50 ?754次閱讀

    模型訓練:開源數(shù)據(jù)與算法的機遇與挑戰(zhàn)分析

    最近,開源中國 OSCHINA、Gitee 與 Gitee AI 聯(lián)合發(fā)布了《2024 中國開源開發(fā)者報告》。 報告聚焦 AI 大模型領域,對過去一年的技術演進動態(tài)、技術趨勢、以及開源
    的頭像 發(fā)表于 02-20 10:40 ?935次閱讀
    大<b class='flag-5'>模型</b>訓練:<b class='flag-5'>開源</b>數(shù)據(jù)與算法的機遇與挑戰(zhàn)分析

    階躍星辰開源多模態(tài)模型,天數(shù)智芯迅速適配

    近日,頭部大模型創(chuàng)業(yè)公司階躍星辰在行業(yè)內引起了軒然大波,宣布正式開源兩款Step系列多模態(tài)模型——Step-Video-T2V視頻生成模型和Step-Audio語音交互
    的頭像 發(fā)表于 02-19 14:30 ?748次閱讀

    開源模型DeepSeek的開放內容詳析

    當大家討論為什么 DeepSeek 能夠形成全球刷屏之勢,讓所有廠商、平臺都集成之時,「開源」成為了最大的關鍵詞之一,圖靈獎得主 Yann LeCun 稱其是「開源的勝利」。模型開源
    的頭像 發(fā)表于 02-19 09:48 ?2339次閱讀
    <b class='flag-5'>開源</b>大<b class='flag-5'>模型</b>DeepSeek的開放內容詳析

    開源模型在多個業(yè)務場景的應用案例

    在人工智能發(fā)展浪潮中,大模型開源與閉源之爭一直是業(yè)內的熱點話題。隨著技術的不斷進步和應用場景的日益豐富,如何降低大模型的使用門檻,讓更多人能夠便捷地應用于實際業(yè)務場景,成為了推動行業(yè)發(fā)展的關鍵所在。而
    的頭像 發(fā)表于 12-30 10:16 ?1530次閱讀

    【「大模型啟示錄」閱讀體驗】+開啟智能時代的新鑰匙

    閱讀之旅。在翻開這本書之前,我對大模型的認知僅僅停留在它是一種強大的人工智能技術,可以進行自然語言處理、圖像識別等任務。我知道像 ChatGPT 這樣的應用是基于大模型開發(fā)的,能夠與人類進行較為流暢
    發(fā)表于 12-24 13:10

    開源AI模型庫是干嘛的

    開源AI模型庫是指那些公開源代碼、允許自由訪問和使用的AI模型集合。這些模型通常經過訓練,能夠執(zhí)行特定的任務。以下,是對
    的頭像 發(fā)表于 12-14 10:33 ?1172次閱讀

    OpenAI發(fā)布滿血版ChatGPT Pro

    科技巨頭OpenAI近期宣布了一項重大更新,正式推出了其備受期待的“滿血版”ChatGPT Pro。這一新版本基于全新的推理模型o1,旨在為用戶提供更為強大的處理能力和更高質量的回答。 據(jù)了解
    的頭像 發(fā)表于 12-06 11:10 ?1056次閱讀

    開源與閉源之爭:最新的開源模型到底還落后多少?

    一,引言 隨著人工智能(AI)技術的迅猛發(fā)展,大模型已經成為推動科技進步的重要力量。然而,超大規(guī)模模型在帶來高性能的同時,也面臨著資源消耗大、部署困難等問題。本文將探討AI大模型未來的
    的頭像 發(fā)表于 11-15 11:16 ?1209次閱讀
    <b class='flag-5'>開源</b>與閉源之爭:最新的<b class='flag-5'>開源</b><b class='flag-5'>模型</b>到底還落后多少?

    阿里通義千問代碼模型全系列開源

    近日,阿里云通義大模型團隊宣布了一項重大決策:將通義千問代碼模型全系列正式開源。此次開源模型系列共包含6款Qwen2.5-Coder
    的頭像 發(fā)表于 11-14 15:26 ?1381次閱讀

    阿里云開源Qwen2.5-Coder代碼模型系列

    Qwen2.5-Coder-32B-Instruct,在代碼生成領域取得了顯著成就。據(jù)官方介紹,該模型在EvalPlus等十多個主流的代碼生成基準測試中,均刷新了開源模型的得分紀錄,展現(xiàn)出了卓越的
    的頭像 發(fā)表于 11-14 11:28 ?1435次閱讀