台灣新聞通訊社-IBM 推出新一代企業 AI 模型 Granite 3.0 可與業務場景無縫整合

IBM在美國時間10月21日舉行的TechXchange年度技術大會上,發表了自家旗艦級模型系列第三代Granite 3.0;它經由寬鬆的Apache 2.0許可發布,在眾多學術與行業評比測試中,均超越或與類似規模的競者模型並駕齊驅,展現了優異的性能、建模彈性、透明度與安全性。

此次發布的IBM Granite 3.0系列模型包括:通用/語言模型:Granite 3.0 8B Instruct, Granite 3.0 2B Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base。護欄與安全模型:Granite Guardian 3.0 8B, Granite Guardian 3.0 2B。專家混合模型:Granite 3.0 3B-A800M Instruct, Granite 3.0 1B-A400M Instruct, Granite 3.0 3B-A800M Base, Granite 3.0 1B-A400M Base。

IBM表示,IBM Granite 3.0系列模型的主要特點:在適合性方面,許多大語言模型(LLM)是基於可用的公開數據訓練而成;絕大多數的企業內部數據未被使用。Granite 3.0 8B與2B被設計為企業級AI的主力模型,可為檢索增強生成(RAG)、分類、摘要、實體提取、工具使用等企業任務,提供強大的性能。這些小巧、多功能模型可以根據企業數據進行微調,與業務場景或工作流程無縫整合。

而在性能上,在Hugging Face的OpenLLM排行榜評比測試中,Granite 3.0 8B Instruct模型的整體性能,平均領先Meta與Mistral類似大小的開源模型的最佳性能。在IBM的AttaQ安全評比測試中,上述模型在所有受測的安全維度裡,表現均優於Meta與Mistral的模型。

IBM指出,在這次發布裡,還有專家混合架構(Mixture of Experts, MOE)Granite 3.0 1B-A400M與Granite 3.0 3B-A800M,這些較小型、輕量級的模型可建置在傳統CPU伺服器,用於低延遲應用程式,兼顧性能與推理成本的完美平衡。

2024/10/23 18:42

轉載自聯合新聞網: https://udn.com/news/story/7238/8311451?from=udn-ch1_breaknews-1-99-news