Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537 Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537
已上微軟 Azure,即將要上 AWS、Hugging Face。
一夜之間,大模型格局再次發生巨變。
一直以來 Llama 可以說是 AI 社區內最強大的開源大模型。但因為開源協議問題,一直不可免費商用。
今日,Meta 終于發布了大家期待已久的免費可商用版本 Llama 2。
此次 Meta 發布的Llama 2 模型系列包含 70 億、130 億和 700 億三種參數變體。此外還訓練了 340 億參數變體,但并沒有發布,只在技術報告中提到了。
據介紹,相比于 Llama 1,Llama 2 的訓練數據多了 40%,上下文長度也翻倍,并采用了分組查詢注意力機制。具體來說,Llama 2 預訓練模型是在2 萬億的 token上訓練的,精調 Chat 模型是在100 萬人類標記數據上訓練的。
公布的測評結果顯示,Llama 2 在包括推理、編碼、精通性和知識測試等許多外部基準測試中都優于其他開源語言模型。
接下來,我們就從 Meta 公布的技術報告中,詳細了解下 Llama 2。
論文地址:
項目地址:
總的來說,作為一組經過預訓練和微調的大語言模型(LLM),Llama 2 模型系列的參數規模從 70 億到 700 億不等。其中的 Llama 2-Chat 針對對話用例進行了專門優化。
Llama 2-Chat 的訓練 。
Llama 2 模型系列除了在大多數基準測試中優于開源模型之外,根據 Meta 對有用性和安全性的人工評估,它或許也是閉源模型的合適替代品。
Llama 2-Chat 與其他開源和閉源模型在安全性人類評估上的結果。
Meta 詳細介紹了 Llama 2-Chat 的微調和安全改進方法,使社區可以在其工作基礎上繼續發展,為大語言模型的負責任發展做出貢獻。
預訓練
為了創建全新的 Llama 2 模型系列,Meta 以 Llama 1 論文中描述的預訓練方法為基礎,使用了優化的自回歸 ,并做了一些改變以提升性能。
具體而言,Meta 執行了更穩健的數據清理,更新了混合數據,訓練 token 總數增加了 40%,上下文長度翻倍。下表 1 比較了 Llama 2 與 Llama 1 的詳細數據。
Llama 2 的訓練語料庫包含了來自公開可用資源的混合數據,并且不包括 Meta 產品或服務相關的數據。Llama 2 采用了 Llama 1 中的大部分預訓練設置和模型架構,包括標準 架構、使用 RMSNorm 的預歸一化、SwiGLU 激活函數和旋轉位置嵌入。
在超參數方面,Meta 使用 AdamW 優化器進行訓練,其中 β_1 = 0.9,β_2 = 0.95,eps = 10^?5。同時使用余弦學習率計劃(預熱 2000 步),并將最終學習率衰減到了峰值學習率的 10%。
下圖 5 為這些超參數設置下 Llama 2 的訓練損失曲線。
在訓練硬件方面,Meta 在其研究超級集群( Super Cluster, RSC)以及內部生產集群上對模型進行了預訓練。兩個集群均使用了 NVIDIA A100。
在預訓練的碳足跡方面,Meta 根據以往的研究方法,利用 GPU 設備的功耗估算和碳效率,計算了 Llama 2 模型預訓練所產生的碳排放量。
預訓練期間 Llama 2 各個模型的碳排放量。
Llama 2 預訓練模型評估
Meta 報告了 Llama 1、Llama 2 基礎模型、MPT()和 Falcon 等開源模型在標準學術基準上的結果。
下表 3 總結了這些模型在一系列流行基準上的整體性能,結果表明,Llama 2 優于 Llama 1 。
除了開源模型之外,Meta 還將 Llama 2 70B 的結果與閉源模型進行了比較,結果如下表 4 所示。Llama 2 70B 在 MMLU 和 GSM8K 上接近 GPT-3.5,但在編碼基準上存在顯著差距。
此外,在幾乎所有基準上,Llama 2 70B 的結果均與谷歌 PaLM (540B) 持平或表現更好,不過與 GPT-4 和 PaLM-2-L 的性能仍存在較大差距。
微調
Llama 2-Chat 是數個月研究和迭代應用對齊技術(包括指令調整和 RLHF)的成果,需要大量的計算和注釋資源。
監督微調 (SFT)
第三方監督微調數據可從許多不同來源獲得,但 Meta 發現其中許多數據的多樣性和質量都不夠高,尤其是在使 LLM 與對話式指令保持一致方面。因此,他們首先重點收集了幾千個高質量 SFT 數據示例,如下表 5 所示。
在微調過程中,每個樣本都包括一個提示和一個回答。為確保模型序列長度得到正確填充,Meta 將訓練集中的所有提示和答案連接起來。他們使用一個特殊的 token 來分隔提示和答案片段,利用自回歸目標,將來自用戶提示的 token 損失歸零,因此只對答案 token 進行反向傳播。最后對模型進行了 2 次微調。
RLHF
RLHF 是一種模型訓練程序,適用于經過微調的語言模型,以進一步使模型行為與人類偏好和指令遵循相一致。Meta 收集了代表了人類偏好經驗采樣的數據,人類注釋者可據此選擇他們更喜歡的兩種模型輸出。這種人類反饋隨后被用于訓練獎勵模型,該模型可學習人類注釋者的偏好模式,然后自動做出偏好決定。
下表 6 報告了 Meta 長期以來收集到的獎勵建模數據的統計結果,并將其與多個開源偏好數據集進行了對比。他們收集了超過 100 萬個基于人類應用指定準則的二元比較的大型數據集,也就是元獎賞建模數據。
請注意,提示和答案中的標記數因文本領域而異。摘要和在線論壇數據的提示通常較長,而對話式的提示通常較短。與現有的開源數據集相比,本文的偏好數據具有更多的對話回合,平均長度也更長。
獎勵模型將模型響應及其相應的提示(包括前一輪的上下文)作為輸入,并輸出一個標量分數來表示模型生成的質量(例如有用性和安全性)。利用這種作為獎勵的響應得分,Meta 在 RLHF 期間優化了 Llama 2-Chat,以更好地與人類偏好保持一致,并提高有用性和安全性。
在每一批用于獎勵建模的人類偏好注釋中,Meta 都拿出 1000 個樣本作為測試集來評估模型,并將相應測試集的所有提示的集合分別稱為「元有用性」和「元安全性」。
下表 7 中報告了準確率結果。不出所料,Meta 自己的獎勵模型在基于 Llama 2-Chat 收集的內部測試集上表現最佳,其中「有用性」獎勵模型在「元有用性」測試集上表現最佳,同樣,「安全性」獎勵模型在「元安全性」測試集上表現最佳。
總體而言,Meta 的獎勵模型優于包括 GPT-4 在內的所有基線模型。有趣的是,盡管 GPT-4 沒有經過直接訓練,也沒有專門針對這一獎勵建模任務,但它的表現卻優于其他非元獎勵模型。
縮放趨勢。Meta 研究了獎勵模型在數據和模型大小方面的縮放趨勢,在每周收集的獎勵模型數據量不斷增加的情況下,對不同的模型大小進行了微調。下圖 6 報告了這些趨勢,顯示了預期的結果,即在類似的數據量下,更大的模型能獲得更高的性能。
隨著收到更多批次的人類偏好數據注釋,能夠訓練出更好的獎勵模型并收集更多的提示。因此,Meta 訓練了連續版本的 RLHF 模型,在此稱為 RLHF-V1、...... , RLHF-V5。
此處使用兩種主要算法對 RLHF 進行了微調:
近端策略優化 (PPO);
采樣微調。
RLHF 結果
首先是基于模型的評估結果。下圖 11 報告了不同 SFT 和 RLHF 版本在安全性和有用性方面的進展,其中通過 Meta 內部的安全性和有用性獎勵模型進行評估。
再來看人類評估結果。如下圖 12 所示,Llama 2-Chat 模型在單輪和多輪提示方面均顯著優于開源模型。特別地,Llama 2-Chat 7B 在 60% 的提示上優于 MPT-7B-chat,Llama 2-Chat 34B 相對于同等大小的 Vicuna-33B 和 Falcon 40B,表現出了 75% 以上的整體勝率。
在這里,Meta 也指出了人工評估的一些局限性。
雖然結果表明 Llama 2-Chat 在人工評估方面與 ChatGPT 不相上下,但必須指出的是,人工評估存在一些局限性。
按照學術和研究標準,本文擁有一個 4k 提示的大型提示集。但是,這并不包括這些模型在現實世界中的使用情況,而現實世界中的使用情況可能要多得多。
提示語的多樣性可能是影響結果的另一個因素,例如本文提示集不包括任何編碼或推理相關的提示。
本文只評估了多輪對話的最終生成。更有趣的評估方法可能是要求模型完成一項任務,并對模型在多輪對話中的整體體驗進行評分。
人類對生成模型的評估本身就具有主觀性和噪聲性。因此,使用不同的提示集或不同的指令進行評估可能會產生不同的結果。
安全性
該研究使用三個常用基準評估了 Llama 2 的安全性,針對三個關鍵維度:
真實性,指語言模型是否會產生錯誤信息,采用 基準;
毒性,指語言模型是否會產生「有毒」、粗魯、有害的內容,采用 ToxiGen 基準;
偏見,指語言模型是否會產生存在偏見的內容,采用 BOLD 基準。
預訓練的安全性
首先,預訓練數據對模型來說非常重要。Meta 進行實驗評估了預訓練數據的安全性。
該研究使用在 ToxiGen 數據集上微調的 分類器來測量預訓練語料庫英文數據的「毒性」,具體結果如下圖 13 所示:
為了分析偏見方面的問題,該研究統計分析了預訓練語料庫中的代詞和身份相關術語及其占比,如下表 9 所示:
此外,在語言分布方面,Llama 2 語料庫涵蓋的語種及其占比如下表 10 所示:
安全微調
具體來說,Meta 在安全微調中使用了以下技術:1、監督安全微調;2、安全 RLHF;3、安全上下文蒸餾。
Meta 在 Llama 2-Chat 的開發初期就觀察到,它能夠在有監督的微調過程中從安全演示中有所總結。模型很快就學會了撰寫詳細的安全回復、解決安全問題、解釋話題可能敏感的原因并提供更多有用信息。特別是,當模型輸出安全回復時,它們往往比普通注釋者寫得更詳細。因此,在只收集了幾千個有監督的示范后,Meta 就完全改用 RLHF 來教模型如何寫出更細致入微的回復。使用 RLHF 進行全面調整的另一個好處是,它可以使模型對越獄嘗試更加魯棒。
Meta 首先通過收集人類對安全性的偏好數據來進行 RLHF,其中注釋者編寫他們認為會引發不安全行為的 prompt,然后將多個模型響應與 prompt 進行比較,并根據一系列指南選擇最安全的響應。接著使用人類偏好數據來訓練安全獎勵模型,并在 RLHF 階段重用對抗性 prompt 以從模型中進行采樣。
如下圖 15 所示,Meta 使用平均獎勵模型得分作為模型在安全性和有用性方面的表現結果。Meta 觀察到,當他們增加安全數據的比例時,模型處理風險和對抗性 prompt 的性能顯著提高。
最后,Meta 通過上下文蒸餾完善了 RLHF 流程。這涉及到通過在 prompt 前加上安全前置 prompt 來生成更安全的模型響應,例如「你是一個安全且負責任的助手」,然后在沒有前置 prompt 的情況下根據更安全的響應微調模型,這本質上是提取了安全前置 prompt(上下文)進入模型。
Meta 使用了有針對性的方法,允許安全獎勵模型選擇是否對每個樣本使用上下文蒸餾。
下圖 17 展示了各種 LLM 的總體違規百分比和安全評級。
下圖 18 展示了單輪和多輪對話的違規百分比。跨模型的一個趨勢是,多輪對話更容易引發不安全的響應。也就是說,與基線相比,Llama 2-Chat 仍然表現良好,尤其是在多輪對話中。
下圖 19 顯示了不同 LLM 在不同類別中安全違規百分比。
參考鏈接:
本文來自微信公眾號“機器之心”(ID:),36氪經授權發布。
12 種簡單的修復方法 Twitter 鏈接打不開 Chrome 和野生動物園
除了分享視頻、GIF 和表情包之外, Twitter 還允許您將鏈接附加到自動縮短的推文。 但是,當這些鏈接拒絕在您的桌面瀏覽器中打開時,它會變得很麻煩。 如果您遇到這個問題,我們有 12 種方法可以解決 Twitter 鏈接打不開 Chrome 和野生動物園。
但是,這個問題并不普遍,主要影響 Chrome 和 Safari 用戶。 好消息是,在大多數情況下這只是暫時的故障。 因此,可以使用基本的故障排除方法和解決方法來解決。 那么,讓我們開始吧。
提示:如果您正在使用該應用程序,請查看我們的指南,了解如何修復鏈接在 Twitter 應用程序。
1.重啟瀏覽器
修復可能阻止的任何瀏覽器錯誤 Twitter 鏈接無法正常工作,退出或強制退出瀏覽器。 雖然是最基本的修復,但它是最簡單、最有效的故障排除方法之一。
這會刷新瀏覽器緩存并從頭開始加載頁面。 這是如何做的。
在 Windows 上
步驟1: 打開 Chrome 并單擊菜單圖標。
第2步: 在這里,點擊 Exit.
您的瀏覽器現在將 close.
在 Mac 上
步驟1: 單擊蘋果圖標。
第2步: 然后,單擊強制退出。
第 3 步: 在這里,選擇 Safari(或 Google Chrome) 并單擊強制退出。
這將強制退出 Safari 或 Chrome. 現在,再次打開您的默認網絡瀏覽器并嘗試打開 Twitter 關聯。 如果這不起作用,請不要擔心。 繼續下一節。
2.重新加載網頁
如果你的 Twitter 鏈接無法正常打開,請嘗試重新加載頁面。 這將使您的瀏覽器下載該頁面的新副本。 因此,修復任何間歇性錯誤。 為此,只需單擊瀏覽器上的重新加載圖標即可。
頁面完成重新加載后,嘗試打開 Twitter 再次鏈接。
3.以隱身模式打開瀏覽器
隱身模式允許您在沒有任何擴展、cookie 或緩存數據的情況下加載瀏覽器。 因此,這是繞過擴展無意中引起的隱私限制的最簡單方法。
打開隱身模式 Chrome
打開 Chrome 在隱身模式下,打開 Chrome,單擊菜單圖標,然后選擇新建隱身窗口。
或者,您也可以按 Ctrl + Shift + N(在 Windows 上)或 command + shift + N(在 Mac 上)啟動 Chrome 在隱身模式下。
在 Safari 中打開隱私窗口
如果您在 Mac 上使用 Safari,請打開 Safari,單擊菜單欄中的文件,然后選擇新建無痕瀏覽窗口。 您還可以使用 Command + Shift + N 快捷方式以隱身模式啟動 Safari。
現在,打開 Twitter 私人窗口中的鏈接。 如果仍然不起作用,請按照以下步驟操作。
4. 檢查瀏覽器更新
定期更新您的瀏覽器可以修復錯誤并獲得新功能和安全更新。 此外,如果許多用戶無法打開 Twitter 中的鏈接 Chrome 或 Safari,開發人員肯定會發布新的更新來解決此問題。
因此,始終建議保持最新更新。 更新方法如下 Chrome 和 Safari 瀏覽器。
更新 Chrome 在 Windows 和 Mac 上
步驟1: 打開 Chrome 并單擊菜單圖標。
第2步: 在這里,單擊幫助。
第 3 步: 然后,點擊“關于 Google Chrome’.
如果有更新可用,請安裝它并等待瀏覽器重新啟動。
在 Mac 上更新 Safari
筆記:更新 macOS 會自動更新 Safari。 要在 Mac 上檢查更新,請按照以下步驟操作。
步驟1: 按 Command + 空格鍵打開 搜索。
第2步: 在搜索欄中,鍵入“檢查軟件更新”并按回車鍵。
下載更新(如果可用)。 安裝完成后,再次打開 Safari。 現在,去 Twitter 并嘗試再次打開鏈接。
還讀了: 如何更新 Mac 上的任何應用程序。
5. 檢查 Wi-Fi Signal 力量
有效的 Wi-Fi 連接可確保您擁有順暢的瀏覽體驗。 所以,如果你有麻煩 Twitter 鏈接打不開,請檢查您的系統是否已連接到信號強度良好的活動 Wi-Fi 連接。 這是檢查方法。
在 Windows 上
要在 Windows 上檢查設備的信號強度,請確保您的設備連接到具有大量信號條的網絡。
步驟1: 在 Windows 任務欄中,單擊 Wi-Fi 圖標以打開“快速設置”。
第2步: 在這里,單擊 Wi-Fi 圖標。
第 3 步: 從此列表中,連接到所需的網絡。
您還可以參考我們的指南,了解有關如何在 Windows 中查看 Wi-Fi 信號強度的更多信息。
在 Mac 上
檢查 Wi-Fi 的 dBm 或分貝水平是在 Mac 上檢查 Wi-Fi 信號強度的好方法。 如果電平低于 -50 dBm,最好連接到附近的另一個網絡。
步驟1: 按選項鍵并同時單擊 Wi-Fi 圖標。
第2步: 在這里,檢查 RSSI 是否在 -30 dBm 到 -50 dBm 范圍之間。
如果 Wi-Fi 連接良好,請繼續下一步。 如果沒有,請聯系您的互聯網服務提供商以解決問題。
6.關閉計量連接設置
計量連接設置限制您的系統在特定時期內使用的數據量。 如果您連接的數據有限,這會有所幫助。 但是,如果您已用盡數據限制,這也可以阻止瀏覽器加載內容。
在這種情況下,按流量計費的連接設置可能會阻止您打開 Twitter 關聯。 這是在 Windows 上禁用它的方法。
筆記: 計量連接設置在 Mac 上不可用。
步驟1: 打開“設置”應用,然后單擊“網絡和互聯網”。
第2步: 然后,單擊 Wi-Fi。
第 3 步: 在這里,轉到您的 Wi-Fi 屬性。
步驟4: 向下滾動并關閉計量連接的開關。
完成后,打開瀏覽器并嘗試再次打開鏈接。 如果它打開正常,你就知道罪魁禍首了。 另一方面,如果問題仍然存在,請按照接下來的幾個修復程序進行操作。
7. 禁用 VPN 和代理服務
VPN 和代理服務通常用于隱藏瀏覽信息和訪問可能會受到限制的內容。 但是,它們也可能導致互聯網速度不穩定和某些內容的地理限制。 這也可以防止 Twitter 工作鏈接。
要解決此問題,請通過打開應用程序然后單擊“斷開連接”按鈕來關閉您的 VPN 服務。
另一方面,要禁用代理服務,請按照下列步驟操作。
步驟1: 打開 Chrome 然后單擊三點圖標。
第2步: 在這里,單擊設置。
第 3 步: 轉到系統并單擊“打開計算機的代理設置”。
打開系統的代理設置后,將其禁用。 然后,嘗試打開 Twitter 再次鏈接。
8.刪除瀏覽器擴展
Chrome 和 Safari 附帶大量擴展,可為您的瀏覽器提供額外的功能。 但是,有時這些擴展程序最終可能會干擾您瀏覽器的功能,從而導致 Twitter 鏈接不工作。
要解決此問題,您只需刪除瀏覽器擴展并嘗試再次打開鏈接即可。 您還可以查看這些文章以了解更多關于如何從 Google Chrome 和 蘋果瀏覽器.
9. 清除 Cookie 和緩存
雖然瀏覽器緩存和 cookie 可以幫助更快地加載頁面,但眾所周知它們偶爾會降低瀏覽器的速度。 此外,如果此緩存遭到破壞,它還可以防止 Twitter 工作鏈接。
為幫助您的瀏覽器順暢運行,建議定期清除 Chrome cookie 和緩存。 您還可以參考我們關于清除 cookie 和緩存的詳細指南 Chrome 和野生動物園。
注銷帳戶并重新登錄有助于刷新瀏覽器上的帳戶信息。 這也可以幫助解決與以下相關的問題 Twitter 鏈接。 這是如何做的。
步驟1: 打開 Twitter 并單擊帳戶圖標。
第2步: 然后,單擊注銷選項。
第 3 步: 再次單擊注銷以確認。
步驟4: 現在,重啟瀏覽器,打開 Twitter,然后重新登錄您的帳戶。
現在,嘗試再次打開鏈接。 這應該可以為您解決問題。
11. 在不同的瀏覽器中打開鏈接
如果您仍然無法打開來自 Twitter, 更改您的瀏覽器可能會成功。 只需將鏈接復制并粘貼到其他網絡瀏覽器的地址欄中,例如 Firefox 并檢查它是否有效。
您還可以查看我們的列表,以了解有關當前可用的最佳基于 的瀏覽器的更多信息。
如果問題仍然存在,最后的辦法是聯系 Twitter 支持團隊。 這是如何做的。
步驟1: 打開 Twitter 然后單擊三點圖標。
第2步: 然后,轉到“設置和支持”并單擊“幫助中心”。
現在,將打開一個單獨的選項卡 Twitter 幫助中心。 在這里您可以搜索提供的幫助主題并聯系 Twitter 支持進一步的援助。
使用常見問題 Twitter 在 Chrome 和野生動物園
1.我可以用一樣的嗎 Twitter 帳戶 Chrome 和安卓?
是的,一樣的 Twitter 兩個賬號都可以用 Chrome 和安卓。
2.我可以保留我的習慣嗎 Twitter 應用程序設置 Google Chrome 還有嗎?
與您相關的設置 Twitter 使用時帳戶將保持不變 Google Chrome. 但是,任何與 Twitter 使用時app不會被轉移過來 Twitter 在 Google Chrome.
隨心所欲地發推文
因此,我們希望上述方法能幫助您解決問題 Twitter 鏈接打不開 Chrome 和野生動物園。 有了這個,學習如何分享你的 Twitter 個人資料和推文鏈接。
*請認真填寫需求信息,我們會在24小時內與您取得聯系。