亞馬遜(Amazon)推出新一代基礎模型Amazon Nova系列,擴展Amazon Bedrock針對企業客戶提供的基礎模型選擇,Nova系列包括四種文本生成模型和兩種圖像與影片的模型。包括超快速文本生成模型Amazon Nova Micro,能夠處理文本、圖像和影片並生成文本的多模態模型Amazon Nova Lite、Amazon Nova Pro和Amazon Nova Premier。以及用於生成高品質圖像的Amazon Nova Canvas和用於生成高品質影片的Amazon Nova Reel。
亞馬遜通用AI資深副總裁Rohit Prasad表示,新一代Amazon Nova模型旨在幫助內外部開發者應對這些挑戰,提供強大的智慧和內容生成功能,並在延遲、成本效益、客製化、檢索增強生成(RAG)和智慧代理(agentic)等方面取得顯著進展。2025年第1季度更將推出Amazon Nova語音到語音模型。
Amazon Nova包含四款先進的模型。Amazon Nova Micro是一款僅處理文本的模型,能夠以極低的延遲和成本提供回應;Amazon Nova Lite是一款極具成本效益的多模態模型,能夠快速處理圖像、影片和文本輸入;Amazon Nova Pro是一款功能強大的多模態模型,可在準確性、速度和成本之間實現絕佳平衡,適合多種任務;Amazon Nova Premier是亞馬遜的頂級多模態模型,專為複雜推論任務而生,並將其作為蒸餾客製化模型(distilling custom models)的最佳典範模型(teacher model)使用。目前,Amazon Nova Micro、Amazon Nova Lite和Amazon Nova Pro已全部正式可用,Amazon Nova Premier明年第1季上線。
Amazon Nova Micro在11項適用基準測試中,其表現與Meta的LLaMa 3.1 8B相當或更優,而在12項適用基準測試中,與Google Gemini 1.5 Flash-8B持平或更優。憑藉每秒210個輸出token的業界領先速度,Amazon Nova Micro非常適合需要快速回應的應用場景。
Amazon Nova Lite在同類模型中同樣具備強勁競爭力。與OpenAI的GPT-4o mini相比,它在19項基準測試中有17項表現持平或更優;與Google的Gemini 1.5 Flash-8B相比,在21項基準測試中也有17項表現相當或更優;與Anthropic的Claude Haiku 3.5相比,則在12項基準測試中有10項表現相當或更優。除了在文本基準測試中展現出色的準確性外,Amazon Nova Lite在影片、圖表和文檔理解方面也表現突出,這一點透過VATEX、ChartQA和DocVQA等基準測試得到了證明。此外,Amazon Nova Lite在代理工作流程上也表現優異,如在Berkeley Function Calling Leaderboard上的函式呼叫能力,以及在理解視覺元素以在瀏覽器和電腦螢幕上執行操作的核心能力方面表現出色,這一點在VisualWebBench(網頁瀏覽器操作基準測試)和Mind2Web(通用多模態代理基準測試)得到證明。
Amazon Nova Pro在與OpenAI的GPT-4o的20項基準測試中,有17項表現相當或更優;在與Google的Gemini 1.5 Pro的21項基準測試中,有16項表現持平或更優;在與Anthropic的Claude Sonnet 3.5v2的20項基準測試中,有9項表現相當或更優。除了在文本和視覺智慧基準測試中的準確性外,Amazon Nova Pro在遵循指令和多模態代理工作流程方面也表現出色,相關測試包括綜合RAG(Comprehensive RAG Benchmark)、Berkeley Function Calling Leaderboard和Mind2Web。
Amazon Nova Micro、Lite和Pro支援200多種語言。Amazon Nova Micro支援128K輸入token的上下文長度,而Amazon Nova Lite和Pro的上下文長度可達300K token,處理影片時長可達30分鐘。到2025年初,亞馬遜將支援超過200萬輸入token的上下文長度。
2024/12/04 19:20
轉載自聯合新聞網: https://udn.com/news/story/7240/8404211?from=udn-ch1_breaknews-1-99-news