Retrival-Augmented Generation (RAG): a sinergia entre memória e criatividade

Um dos principais desafios na implementação de casos de utilização baseados em IA generativa textual é fornecer-lhe informações externas. As técnicas RAG permitem resolver este problema fornecendo aos modelos de linguagem a capacidade de procurar respostas em documentação externa para a qual não foram treinados.

O que é RAG?

Consiste em enriquecer a informação disponível num modelo linguístico

Embora não tenha uma boa tradução em português, é algo como “geração aumentada de recuperação”. Consiste em enriquecer a informação disponível para um modelo de linguagem, de modo a que este possa responder utilizando informação adicional que nunca viu ante, como dados financeiros privados ou discursos de vendas internos de uma empresa. Não só isso, mas graças ao avanço dos modelos open source, é possível fazer isso completamente on-premise, para que todas as informações possam permanecer confidenciais.

A ideia subjacente ao RAG consiste em, a partir de um prompt do utilizador à IA, procurar automaticamente num corpo de conhecimento que fragmentos de texto que mais se assemelham à pergunta feita pelo utilizador e utilizar essa informação recolhida para construir um novo prompt, que inclui tanto a pergunta original como o contexto adicional relevante extraído da base de conhecimentos. Finalmente, com este novo prompt, um modelo de linguagem gera uma resposta.

Desta forma, é possível que este modelo de linguagem seja capaz de responder com base em informações adicionais às utilizadas para a sua formação, tais como documentos PDF, emails, bases de dados ou websites.

Como funciona o RAG?

Existem diferentes arquiteturas, mas a mais básica e comum consiste em três etapas:

Criação de índices: antes de se poderem efetuar consultas, é necessário que a informação seja pré-processada num formato que permita pesquisar nela a alta velocidade. Para isso, os textos são divididos em pedaços mais pequenos, denominados chunks. Cada um destes chuncks é passado por um modelo de embedding, que transforma o fragmento de texto num vetor numérico que, idealmente, contém a informação sobre o assunto do chunck. Ou seja, pedaços de texto que são semanticamente muito semelhantes, dado um bom modelo de embedding, devem gerar vetores que são muito semelhantes, mesmo que o mesmo significado seja expresso com um vocabulário completamente diferente. Por outro lado, um par de fragmentos de texto não relacionados deverá gerar vetores muito diferentes. Estes modelos de incorporação são o coração do RAG e tornam-no mais eficaz do que uma simples pesquisa por palavra-chave, uma vez que a mesma ideia pode ser expressa com muitas palavras diferentes, mas também a mesma palavra pode significar coisas que não têm absolutamente nada a ver uma com a outra.
Pesquisa: dada uma consulta ao sistema por um utilizador, é efectuada uma pesquisa vetorial para devolver os fragmentos de texto que mais se aproximam da consulta. Esta fase é fundamental para o seu correto funcionamento e existem dezenas de técnicas para a melhorar. Por exemplo, combinando esta pesquisa com uma pesquisa por palavra-chave (utilizando BM25 e combinando os resultados utilizando RRF) ou criando respostas hipotéticas e efectuando a pesquisa, uma vez que estas se assemelham semanticamente mais aos fragmentos do que à pergunta original (Hypothetical Document Embeddings, HyDEs). Há tantas possibilidades que só isto é tema para um artigo inteiro, pelo que não serão aqui detalhadas. Mas isto não significa que estas técnicas devam ser subestimadas: acertar nesta fase é o ponto mais importante de todo o sistema.
Geração de respostas: finalmente, tanto a pergunta original como os fragmentos de texto recolhidos na fase anterior são utilizados para gerar uma resposta.

Todo o sistema funciona da mesma forma que copiar e colar o texto relevante no chatGPT juntamente com a pergunta a fazer, com a grande vantagem de não ter de ler e procurar manualmente estes fragmentos de contexto.

Vantagens do RAG

O RAG dá acesso a vastos recursos de conhecimento armazenados em bases de dados

Conhecimento atualizado: os modelos de geração de texto puro, embora impressionantes na sua capacidade de imitar a linguagem humana, podem não estar atualizados ou não ter informações sobre tópicos específicos. O RAG permite que o modelo complemente as suas capacidades criativas com dados externos atualizados e específicos, resultando em respostas mais relevantes e precisas em vez de respostas vagas e genéricas.
Memória alargada: em vez de depender apenas da memória interna do modelo, o RAG permite o acesso a vastos recursos de conhecimento armazenados em bases de dados, documentos de texto desorganizados, e-mails... Isto permite que o sistema tenha uma “memória infinita” na prática, onde a informação não se limita apenas ao conjunto de dados com que o modelo foi treinado.
Adaptabilidade: o RAG pode personalizar as suas respostas de acordo com a informação que recupera. Isto torna-o ideal para tarefas como a assistência personalizada, a pesquisa de informações técnicas, a criação de conteúdos específicos para diferentes indústrias, entre outras.
Redução das alucinações: um dos problemas comuns dos modelos generativos é a tendência para produzir respostas que parecem verdadeiras, mas que não têm base em factos reais, conhecidas como “alucinações”. Ao incorporar uma camada de recuperação de dados verificados, o RAG reduz consideravelmente a ocorrência destas respostas incorretas.

Aplicações RAG

Os modelos RAG podem ajudar os profissionais a aceder a investigação actualizada

As aplicações do RAG são vastas e variadas, abrangendo múltiplos setores e casos de utilização. Algumas das mais proeminentes incluem:

Sistemas de apoio ao cliente: com o RAG, as empresas podem fornecer aos seus clientes respostas mais detalhadas e precisas às suas questões, acedendo a manuais, documentação de produtos ou bases de conhecimento específicas, melhorando a satisfação do cliente. Provavelmente o caso de utilização nº 1 sobre RAG atualmente.
Motores de pesquisa avançada de informação especializada: por exemplo, no domínio da medicina, os modelos RAG podem ajudar os profissionais a aceder a investigação atualizada ou a artigos médicos quando confrontados com casos clínicos complexos. Os jornalistas podem utilizar sistemas baseados em RAG para aceder a dados históricos ou relatórios em tempo real, permitindo-lhes gerar artigos informativos e precisos sobre eventos recentes ou investigação em curso.
Geração de conteúdos especializados: quer se trate de domínios técnicos como a engenharia, a economia, a ciência ou de uma simples resposta a uma mensagem de correio eletrónico, o RAG permite a criação de conteúdos não só coerentes, mas também apoiados em dados atualizados e fiáveis.

Desafios e futuro do RAG

Embora o RAG represente um avanço significativo na geração de texto, ainda enfrenta alguns desafios. A seleção correta das fontes de dados é crucial para evitar a divulgação de informações erradas ou tendenciosas. Além disso, a eficiência da recuperação de informações é um fator determinante para a qualidade das respostas.

A Geração Aumentada por Recuperação é um passo em direção à criação de sistemas de IA

É necessário tomar muitas decisões acertadas durante a conceção do sistema, bem como um sistema de teste robusto para garantir que cada alteração no sistema melhora os resultados globais. É por isso que é uma boa ideia desenvolver sistemas RAG com um partner especializado que poupa tempo, retrabalho desnecessário e dores de cabeça como a Izertis.

O Retrieval-Augmented Generation é um passo em frente na criação de sistemas de IA que não só são capazes de gerar texto fluido e coerente, como também podem aceder e utilizar informação externa em tempo real para dar respostas precisas e relevantes. Com a sua capacidade de combinar criatividade e conhecimento, a RAG tem o potencial de transformar indústrias inteiras, desde o serviço de apoio ao cliente à investigação científica, e marcar uma nova era na interação entre humanos e máquinas.

Digital Transformation Data Science & IA Blog

< Voltar

Nó: portalesizertis-webapp-6896d4b56c-nlqsh:8080

Nome	Descrição	Tipo	Fornecedor
COOKIE_SUPPORT	Este cookie determina se o seu navegador aceita cookies.	HTTP	izertis.com
INGRESSCOOKIE	Grava a piscina que serve o visitante. Isto é usado em relação ao equilíbrio de carga para otimizar a experiência do utilizador.	HTTP	izertis.com
JSESSIONID	Preserva os estados dos utilizadores em todos os pedidos da página.	HTTP	izertis.com
LFR_SESSION_STATE_20103	Cookie utilizado pelo portal web para controlo de tempo de sessão.	HTTP	izertis.com

Nome	Descrição	Tipo	Fornecedor	com.cookies.table.life
GUEST_LANGUAGE_ID	Os cookies preferenciais permitem ao site lembrar informações que alteram a forma como a página se comporta ou como parece, como o seu idioma preferido ou a região em que está localizada. ...	HTTP	izertis.com
lang	Lembre-se do idioma selecionado por um utilizador para ver uma página web	HTTP	ads.linkedin.com

Nome	Descrição	Tipo	Fornecedor
_ga	Regista uma identificação única que é usada para gerar dados estatísticos sobre como a visita utiliza o website.	HTTP	izertis.com
_gat	Usado pelo Google Analytics para controlar a taxa de pedidos.	HTTP	izertis.com
_gid	Regista uma identificação única que é usada para gerar dados estatísticos sobre como o visitante utiliza o site.	HTTP	izertis.com
bounce	Determina se um visitante sai imediatamente do site - Esta informação é utilizada para estatísticas internas e análise pelo operador web.	Pixel	adnxs.com
cb	Recoge información de la dirección de IP del visitante, localización geográfica y navegación. Esta información se utiliza para la optimización interna y estadísticas para el operador de la web.	Pixel	pixel.prfct.co
cb	Recolher informações sobre o endereço IP do visitante, localização geográfica e navegação. Esta informação é utilizada para otimização interna e estatísticas para o operador web.	Pixel	pixel-geo.prfct.co
personalization_id	Definido pelo Twitter - O cookie permite ao visitante partilhar conteúdo sonoro no seu perfil de Twitter.	HTTP	twitter.com
seg	Regista dados estatísticos do comportamento dos visitantes na web. Isto é usado para análise interna pelo operador web.	Pixel	adnxs.com
seg	Regista dados estatísticos do comportamento dos visitantes na web. Isto é usado para análise interna pelo operador web.	Pixel	pixel-geo.prfct.co

Nome	Descrição	Tipo	Fornecedor
__ss	Recoge información del comportamiento del visitante en múltiples webs - Esta información se utiliza dentro de la web para optimizar la relevancia de la publicidad. La cookie también ayuda a determinar cómo el visitante accede a la web	HTTP	izertis.com
__ss_referrer	Recolher informações sobre o comportamento do visitante em vários sites - Esta informação é usada dentro da web para otimizar a relevância da publicidade. O cookie também ajuda a determinar como o visitante acede ao site.	HTTP	izertis.com
__ss_tk	Recolher informações sobre o comportamento do visitante em vários sites - Esta informação é usada dentro da web para otimizar a relevância da publicidade. O cookie também ajuda a determinar como o visitante acede ao site	HTTP	izertis.com
_fbp	Usado pelo Facebook para fornecer uma série de produtos publicitários, como licitação em tempo real de anunciantes de terceiros.	HTTP	izertis.com
A3	Recoge información del comportamiento del visitante en múltiples webs - Esta información se utiliza dentro de la web para optimizar la relevancia de la publicidad.	HTTP	yahoo.com
ads/ga-audiences	Recolher informações sobre o comportamento do visitante em vários sites - Esta informação é usada dentro da web para otimizar a relevância da publicidade.	Pixel	google.com
anj	Registra una identificación única que identifica el dispositivo de un usuario que vuelve. La identificación se utiliza para los anuncios específicos.	HTTP	adnxs.com
bcookie	Regista um ID único que identifica o dispositivo de um utilizador de retorno. A identificação é usada para anúncios específicos.	HTTP	linkedin.com
bscookie	Utilizado pelo serviço de redes sociais LinkedIn para acompanhar a utilização de serviços embutidos	HTTP	linkedin.com
cs	Esta cookie se utiliza para mejorar la relevancia de anuncios por medio de recoger datos del visitante en múltiples sitios web. Este intercambio de datos de visitante lo ofrece habitualmente un in tercambio de anuncios o centro de datos de terceros.	Pixel	pixel-geo.prfct.co
d/px	Este cookie é usado para melhorar a relevância dos anúncios, recolhendo dados de visitantes em vários sites. Esta troca de dados de visitantes é geralmente oferecida por uma troca de anúncios ou por um centro de dados de terceiros.	Pixel	adsymptotic.com
fr	Usado pelo Facebook para fornecer uma série de produtos publicitários, como licitação em tempo real de anunciantes de terceiros.	HTTP	facebook.com
getuid	O gestor de audiências configura este cookie para determinar a hora e a frequência de nenhum tempo de dados do visitante. Sincronizar o cookie de dados é usado para sincronizar e recolher dados de visitantes de vários websites.	Pixel	adnxs.com
i	O gestor de audiências configura este cookie para determinar a hora e a frequência de nenhum tempo de dados do visitante. Sincronizar o cookie de dados é usado para sincronizar e recolher dados de visitantes de vários websites. ...	HTTP	openx.net
i/adsct	Regista dados anónimos de utilizadores, tais como o seu endereço IP, localização geográfica, websites visitados e quais anúncios o utilizador clicou, de forma a otimizar a exibição de anúncios com base no movimento do utilizador em websites que utilizam a mesma rede de anúncios. ...	Pixel	twitter.com
IDE	Utilizada por Google DoubleClick para registrar e informar sobre las acciones del usuario en el sitio web tras visualizar o hacer clic en uno de los anuncios del anunciante con el propósito de medir la eficacia de un anuncio y presentar anuncios específicos para el usuario.	HTTP	doubleclick.net
koitk	Utilizado pelo Google DoubleClick para gravar e reportar ações de utilizador no site após visualizar ou clicar num dos anúncios do anunciante com o propósito de medir a eficácia de um anúncio e apresentar anúncios específicos do utilizador.	HTTP	marketingautomation.services
lang	Definido pelo LinkedIn quando uma página web contém um painel incorporado Siga-nos.	HTTP	linkedin.com
lidc	Utilizado pelo serviço de redes sociais LinkedIn para acompanhar o uso de serviços incorporados.	HTTP	linkedin.com
lissc	Utilizado pelo serviço de redes sociais LinkedIn para acompanhar o uso de serviços incorporados.	HTTP	linkedin.com
na_id	Costumava reconhecer o visitante na sua reentrada. Isto permite que o site registem o comportamento do visitante e facilitem a funcionalidade de partilha de redes sociais fornecida por Addthis.com.	HTTP	addthis.com
ouid	Define uma cadeia de identificação para um visitante específico. Isto é usado para reconhecer o visitante na sua reentrada. Além disso, permite ao site registar o comportamento do visitante e facilita a função de partilha nas redes sociais fornecidas por Addthis.com.	HTTP	addthis.com
pa_#_ts	Usado em sites que usam a mesma rede de anúncios para mostrar anúncios a outros para nunciants de rede.	HTTP	prfct.co
pa_uid	Utilizada en sitios web que utilizan la misma red publicitaria para mostrar anuncios a los otros anunciantes de la red.	HTTP	prfct.co
test_cookie	Usado em sites que usam a mesma rede de anúncios para mostrar anúncios a outros anunciantes na rede.	HTTP	doubleclick.net
tr	Usado pelo Facebook para fornecer uma série de produtos publicitários, como licitação em tempo real de anunciantes de terceiros.	Pixel	facebook.com
uid	Cria um ID de utilizador único gerado por uma máquina. AddThis, que é um anúncio da Clearspring Technologies, utiliza a identificação do utilizador para permitir que o utilizador partilhe conteúdos em várias redes sociais, fornecendo estatísticas detalhadas a vários fornecedores.	HTTP	addthis.com
usermap	Utilizada para presentar al visitante contenido y publicidad relevante - El servicio está provisto por grupos de proveedores de publicidad externos, que facilitan ofertas en tiempo real a los anunciantes.	Pixel	pixel-geo.prfct.co
UserMatchHistory	Utilizado para apresentar ao visitante conteúdo e publicidade relevantes - O serviço é fornecido por grupos de fornecedores de publicidade de terceiros, que fornecem ofertas em tempo real aos anunciantes.	HTTP	linkedin.com
uuid2	Regista um ID único que identifica o dispositivo de um utilizador de retorno. A identificação é usada para anúncios específicos.	HTTP	adnxs.com
VISITOR_INFO1_LIVE	Tente calcular a largura de banda do utilizador em páginas com vídeos incorporados no YouTube.	HTTP	youtube.com
w/1.0/sd	Registem dados de visitantes como o seu endereço IP, localização geográfica e envolvimento publicitário. Esta informação é usada para otimizar a publicidade em sites que utilizam OpenX.net.	Pixel	openx.net
YSC	Grave um ID único para manter as estatísticas dos vídeos do YouTube que o utilizador viu.	HTTP	youtube.com
yt-remote-cast-installed	Grava as preferências dos jogadores de vídeo do utilizador ao ver vídeos incorporados no YouTube.	HTML	youtube.com
yt-remote-connected-devices	Grava as preferências dos jogadores de vídeo do utilizador ao ver vídeos incorporados no YouTube.	HTML	youtube.com
yt-remote-device-id	Grava as preferências dos jogadores de vídeo do utilizador ao ver vídeos incorporados no YouTube.	HTML	youtube.com
yt-remote-fast-check-period	Grava as preferências dos jogadores de vídeo do utilizador ao ver vídeos incorporados no YouTube.	HTML	youtube.com
yt-remote-session-app	Grava as preferências dos jogadores de vídeo do utilizador ao ver vídeos incorporados no YouTube.	HTML	youtube.com
yt-remote-session-name	Registra las preferencias del reproductor de vídeo del usuario al ver vídeos incrustados de YouTube.	HTML	youtube.com
li_sugr	Grava as preferências dos jogadores de vídeo do utilizador ao ver vídeos incorporados no YouTube.	HTTP	linkedin.com