在人工智能技術迅猛發展的今天,Meta公司再次引領潮流,推出了備受期待的開源大模型——Llama 3。這一模型的發布,不僅標志著Meta在AI領域的技術實力,也預示著開源模型在與閉源模型的競爭中邁出了堅實的一步。
當地時間4月18日,Meta公司正式發布了Llama 3,這一消息立即在AI界引起了廣泛關注。Meta首席執行官馬克·扎克伯格宣布,基于Llama 3模型的AI助手現已全面覆蓋Instagram、WhatsApp、Facebook等Meta全系應用,并且單獨開啟了網站,提供圖像生成器功能,可根據自然語言提示詞生成圖片。
Llama 3模型在多個關鍵基準測試中性能優于業界先進同類模型,尤其在代碼生成等任務上實現了全面領先。它能夠進行復雜的推理,更遵循指令,能夠可視化想法并解決許多微妙的問題。Llama 3的主要亮點包括基于超過15T token的訓練,支持8K長文本,改進的tokenizer具有128K token的詞匯量,以及訓練效率比Llama 2高3倍。
目前發布的8B和70B版本的Llama 3模型已用于Meta AI助手,并且面向開發者進行了開源,包括預訓練和微調版本。Meta計劃在今年推出正式版Llama 3,目前用4000億個參數進行訓練,MMLU得分達到85分。此外,Meta還宣布與谷歌建立新的合作伙伴關系,在助手的答復中包括實時搜索結果。
Llama 3的推出,正值開源與閉源AI模型優劣之爭的熱議之際。Meta堅定地選擇了開源路線,認為開源對社區和公司都有好處,因為可以促進創新。Llama 3的發布,不僅為開源模型扳回一局,也為AI未來的發展提供了新的方向。
Meta表示,Llama 3是在兩個定制的24K GPU集群上、基于超過15T token的數據上進行了訓練,是迄今為止最強大的Llama模型。公司還計劃在未來幾個月內推出更多具備多模態、多語言對話、更長上下文窗口等能力的新模型。
Llama 3的發布,不僅是Meta公司在AI領域的一次重大技術突破,也是開源AI模型發展史上的重要里程碑。隨著Llama 3的開源,我們有理由相信,它將為全球的AI研究和應用帶來深遠的影響,推動整個行業向更智能、更開放的未來發展。