IBM在开源AI上加倍下注,推出了新的Granite 3.0模型

2024-10-24 12:01来源:本站编辑

开源和人工智能之间的关系并不融洽。人工智能离不开开源,但很少有公司愿意开源他们的人工智能程序或大型语言模型(LLM)。值得注意的是,IBM此前开放了其Granite模型的源代码。现在,蓝色巨人在Apache 2.0许可下发布了最新的Granite AI 3.0模型,在开源AI上加倍下注。

IBM使用来自公开可用数据集的预训练数据来实现这一点,例如GitHub Code Clean、Starcoder数据、公共代码存储库和GitHub问题。IBM已经竭尽全力避免潜在的版权或法律问题。

为什么其他大型人工智能公司没有这样做?一个重要原因是他们的数据集充满了受版权或其他知识产权保护的数据。如果他们公开自己的数据,他们也会面临诉讼。例如,《华尔街日报》(Wall Street Journal)和《纽约邮报》(New York Post)等新闻集团出版物正起诉Perplexity窃取其内容。

相比之下,Granite模型是专门为业务用例设计的llm,非常强调编程和软件开发。IBM声称,这些新模型的训练数据量是今年早些时候发布的模型的三倍。它们还具有更大的建模灵活性,并支持外部变量和滚动预测。

特别是,新的Granite 3.0 8B和2B语言模型被设计为企业人工智能的“驮马”模型,为检索增强生成(RAG)、分类、摘要、实体提取和工具使用等任务提供强大的性能。

这些模型也有指示和守护变体。第一种,顾名思义,帮助人们学习一种特定的语言。Guardian旨在检测用户提示和人工智能响应中的风险。这一点至关重要,因为正如安全专家布鲁斯·辛德勒(Bruce Schindler)在安全开源软件(SOSS)融合大会上指出的那样,“即时注入(攻击)之所以有效,是因为我正在向人工智能发送数据,而人工智能将这些数据解读为命令”——这可能会导致灾难性的结果。

Granite代码模型的参数范围从30亿到340亿个不等,已经在116种编程语言和3到4 tb的令牌上进行了训练,结合了广泛的代码数据和自然语言数据集。这些模型可以通过多个平台访问,包括hugs Face、GitHub和IBM自己的Watsonx。Red Hat Enterprise Linux (RHEL) ai。花岗岩3.0模型的精选集也可以在Ollama和Replicate上获得。

此外,IBM还发布了用于应用程序开发的新版Watsonx Code Assistant。在那里,Granite提供了跨语言(如C、c++、Go、Java和Python)的通用编码帮助,并为企业Java应用程序提供了高级应用程序现代化功能。现在可以通过Visual Studio code扩展IBM Granite. code访问Granite的代码功能。

Apache 2.0许可证允许研究和商业用途,这是与其他主要llm相比的一个显著优势,其他主要llm可能声称是开源的,但将其llm与商业限制绑定在一起。最显著的例子便是meta的《Llama》。

通过免费提供这些模型,IBM降低了人工智能开发和使用的门槛。IBM也有理由相信,由于它们是真正的开源,开发人员和研究人员可以快速构建和改进这些模型。

IBM还声称,这些模型的性能可以与更大、更昂贵的模型相媲美。

综上所述,我对此印象深刻。没错,Granite不会帮助孩子完成家庭作业,也不会写出伟大的人工智能美国小说,但它会帮助你开发有用的程序和基于人工智能的专家系统。

中名网声明:未经许可,不得转载。