Escolha o modelo certo, de sub-bilhões a parâmetros de 34B, de código aberto inferior ao Apache 2.0.
Não sacrifique o desempenho pelo custo. O Granite supera os modelos comparáveis1 em uma grande variedade de tarefas corporativas.
Crie uma IA responsável com um conjunto abrangente de recursos de detecção de riscos e danos, transparência e proteção de IP.
Modelos de linguagem básicos e ajustados por instrução com novos recursos de raciocínio, desenvolvidos para fluxos de trabalho autônomos, RAG, resumo de textos, análise e extração de dados textuais, classificação e geração de conteúdo.
Modelo pré-treinado especializado em tarefas de visão para compreensão de documentos e imagens, compatível com vários formatos e resoluções de arquivos, projetado para implementação eficiente em ambientes empresariais.
Modelos exclusivamente decodificadores, desenvolvidos para tarefas generativas de código, incluindo geração, explicação e edição de código, treinados com códigos desenvolvidos em 116 linguagens de programação.
Leve e treinado previamente para previsão de séries temporais, otimizado para ser executado com eficiência em uma grande variedade de configurações de hardware.
Proteja a IA com o Granite Guardian, garantindo a segurança de dados corporativos e mitigando riscos em uma grande variedade de solicitações de usuários e respostas de LLM, com desempenho máximo em comparação a mais de 15 referências de segurança.
A NASA e a IBM se uniram para criar um modelo de base de IA para observações da Terra com dados em grande volume de sensoriamento remoto e satélites.
Projetados para aprimorar significativamente a compreensão da intenção do usuário e aumentar a relevância das informações e fontes em resposta a uma consulta.
A nossa terceira geração de modelos de linguagem de IA já está aqui. Adequados à finalidade e de código aberto, esses modelos prontos para uso corporativo oferecem um desempenho excepcional em relação às referências de segurança e em uma ampla variedade de tarefas corporativas, da segurança cibernética ao RAG.
Granite-3.2-8B-Instruct
DeepSeek-R1-Distill-Llama-8B
DeepSeek-R1-Distill-Qwen-7B
ArenaHard
55,23
| 17,17 |
10,36
Alpaca-Eval-2
61,16
21,85
15,35
IFEval
73,57
66,50
59,10
| MMLU |
66,93
45,80
50,72
| PopQA |
28,08
13,25
9,94
| TruthfulQA |
66,37
47,43
47.14
BigBenchHard
65,60
65,71
65,04
DROP
50,73
44,46
42,76
GSM8K
83,09
72,18
78,47
HumanEval
89,47
67,54
79,89
HumanEval+
86,88
62,91
78,43
AtaQ
85,99
42,87
42,45
*Os preços apresentados são indicativos, podem variar de acordo com o país, excluem impostos e taxas aplicáveis e estão sujeitos à disponibilidade de ofertas do produto em uma localidade.
"Na CrushBank, observamos em primeira mão como os modelos de IA abertos e otimizados da IBM agregam valor real à IA empresarial, garantindo o equilíbrio certo entre desempenho, custo e escalabilidade. O Granite 3.2 vai além com novos recursos de raciocínio, e estamos animados para explorá-los no desenvolvimento de novas soluções agêntivas."
David Tan
CTO
CrushBank
Use o IBM Docling e o Granite 3.1 de código aberto para realizar respostas visuais a perguntas sobre documentos em diversos formatos de arquivo
Aprenda a criar um agente de IA capaz de responder a perguntas
Neste tutorial, você usará o IBM Granite-3.0-8B-Instruct modelo agora disponível no watsonx.ai para executar chamadas de funções personalizadas.
Quantifique um modelo pré-treinado de diversas formas para demonstrar o tamanho dos modelos e comparar seu desempenho em uma tarefa específica
Preveja o futuro com base no aprendizado com o modelo Granite TinyTimeMixer (TTM)
Converta texto em uma representação estruturada e gere SQL Query semanticamente correto
Faça o ajuste dos prompts de um modelo Granite no Python com um conjunto de dados sintético contendo avaliações positivas e negativas de clientes
Veja o manual completo do Granite
Implemente a IA em grande escala com confiança usando os modelos Granite de código aberto em produção com Red Hat Enterprise Linux AI e watsonx. Desenvolva mais rápido com recursos como chamadas de ferramentas, suporte a 12 idiomas, raciocínio encadeado e adaptadores multimodais
Os novos modelos do Granite trazem novos recursos de raciocínio, um modelo que viabiliza a visão e mais eficiência, proporcionando resultados competitivos com menor custo.
Em Mixture of Experts - episódio 40, o painel aborda os equívocos do DeepSeek R1, explica a destilação de modelos e disseca o cenário de concorrência de código aberto.
Receba uma seleção de assuntos, tendências e pesquisas de IA diretamente na sua caixa de entrada.
O DeepSeek-R1 é um assistente digital cujo desempenho se assemelha ao do o1 da OpenAI em determinados benchmarks de IA em tarefas de matemática e programação, foi treinado com muito menos chips e, de acordo com a empresa, o uso dele custa 96% menos.
A IBM acredita na criação, na implementação e na utilização de modelos de IA que promovam a inovação responsável em toda a empresa. A plataforma de dados e IA watsonx da IBM conta com um processo completo para criação e teste de modelos de base e IA generativa. Nos modelos desenvolvidos pela IBM, procuramos e removemos duplicidades e empregamos listas de bloqueio de URL, filtros de conteúdo questionável e qualidade de documento, divisão de frases e técnicas de tokenização, tudo antes do treinamento do modelo.
Durante o processo de treinamento de dados, trabalhamos para evitar desajustes nos resultados do modelo e aplicamos ajuste fino supervisionado para melhor acompanhamento das instruções, para que o modelo possa ser utilizado em tarefas empresariais via engenharia de prompt. Continuamos desenvolvendo os modelos Granite em diversos sentidos, incluindo outras modalidades, conteúdo específico do setor e mais anotações de dados para treinamento e ainda implementamos regularmente salvaguardas de proteção de dados para os modelos desenvolvidos pela IBM.
Dado o cenário de rápida mudança da tecnologia da IA generativa, espera-se que nosso processo completo evolua e melhore constantemente. Como prova do rigor que a IBM aplica no desenvolvimento e teste de seus modelos de base, a empresa oferece indenização contratual padrão de propriedade intelectual para os modelos desenvolvidos pela IBM, semelhante àquelas que oferece para itens de hardware e software da IBM.
Além disso, ao contrário de alguns outros fornecedores de grandes modelos de linguagem e coerente com a abordagem padrão da IBM sobre indenização, a IBM não exige que seus clientes indenizem a IBM pelo uso, por parte dos clientes, de modelos desenvolvidos pela IBM. Além disso, de acordo com a abordagem da IBM em relação à sua obrigação de indenização, a IBM não limita sua responsabilidade de indenização para os modelos desenvolvidos pela IBM.
Agora, sob essas proteções, os modelos watsonx incluem:
(1) Família Slate de modelos somente para codificação.
(2) Família Granite de modelos somente para decodificação.
* Como modelos menores de IA adaptados ao setor podem oferecer maiores benefícios
https://www.ft.com/partnercontent/ibm/how-smaller-industry-tailored-ai-models-can-offer-greater-benefits.html
1Avaliação comparativa do desempenho dos modelos Granite e dos principais modelos abertos, conduzida pela IBM Research, em relação a referências acadêmicas e empresariais — https://ibm.com/new/ibm-granite-3-0-open-state-of-the-art-enterprise-models