A geração aumentada de recuperação funciona localizando dados relevantes para a consulta do usuário e, em seguida, usando esses dados para criar prompts mais informativos. Um mecanismo de recuperação de informações é adicionado para aumentar os prompts do LLM e ajudá-lo a gerar respostas mais relevantes.
Os modelos RAG geram respostas por meio de um processo de quatro estágios:
Consulta: um usuário envia uma consulta, que inicializa o sistema RAG.
Recuperação de informações: algoritmos ou APIs complexos examinam os repositórios internos e externos de conhecimento em busca de informações relevantes.
Integração: os dados recuperados são combinados com a consulta do usuário e entregues ao modelo RAG para resposta. Até esse ponto, o LLM não processou a consulta.
Resposta: combinando os dados recuperados com seu próprio treinamento e conhecimento armazenado, o LLM gera uma resposta rica e precisa contextualmente.
Ao pesquisar documentos, os sistemas RAG usam pesquisa semântica. Os bancos de dados de vetores organizam dados por similaridade, permitindo pesquisas por significado em vez de por palavras-chave. As técnicas de pesquisa semântica permitem que algoritmos RAG consigam ir além das palavras-chave, captando a intenção da pergunta e retornando os dados mais pertinentes.
Os sistemas RAG demandam ampla elaboração e manutenção da arquitetura de dados. Os engenheiros de dados devem construir os pipelines de dados necessários para conectar os data lakehouses da organização com o LLM e usar o RAG. Os sistemas RAG também precisam de engenharia de prompts precisa para localizar os dados corretos e garantir que o LLM saiba o que fazer com eles.
Novamente, imagine um modelo de IA generativa como um cozinheiro doméstico amador. Ele conhece o básico da culinária, mas não têm as informações mais recentes e o conhecimento especializado de um chef treinado em uma determinada culinária. O RAG é como oferecer ao cozinheiro amador um livro de receitas daquela culinária. Ao combinar seu conhecimento geral de cozinha com as receitas do livro, o cozinheiro amador consegue preparar facilmente pratos específicos dessa culinária.