¿Hablamos?

Gema Parreño Senior Data Scientist

Publicado el día 19 de julio de 2023 .

Comunidad e Inteligencia Artificial en Google I/O Connect

En la vibrante ciudad de Ámsterdam, un evento ha reunido a más de 500 desarrolladores de todo el mundo para una experiencia inigualable: I/O Connect. Este evento, que ha capturado la atención de la industria tecnológica, se centra en uno de los temas más emocionantes y vanguardistas de nuestro tiempo: la inteligencia artificial. I/O Connect ha sido el escenario perfecto para que las mentes de la tecnología intercambien conocimientos, establezcan conexiones valiosas y descubran las últimas tendencias que impulsarán el futuro de la innovación.

Si quiere ver video debe aceptar las cookies de marketing

Hemos tenido la oportunidad de explorar cómo esta tecnología está transformando las empresas y la sociedad en general. Desde algoritmos de aprendizaje automático hasta el procesamiento del lenguaje natural, hemos descubierto las herramientas más novedosas y emocionantes de la Inteligencia Artificial por parte de Google. Además, nos han dado acceso a demostraciones en vivo e interactuamos con las últimas creaciones tecnológicas.

¿Por qué LLMs?

Nos centramos hoy en los LLMs - acrónimo en inglés que hace referencia a Large Language Models - por dos motivos: la gran cantidad de desafíos sobre los que tiene impacto y la importancia de comenzar a dar los primeros pasos hacia el control técnico y el pasar de las Demos a Productos robustos.

LLMs son modelos de aprendizaje profundo - Deep Learning- entrenados en datasets con cantidades ingentes de datos con formato de texto: pueden abarcar gran cantidad de desafíos, tales como la agrupación de contenidos, traducción, generación de texto y código, y hasta complementar los motores de búsqueda y de recomendación.

Trayendo a su vez la realidad, hablamos de PaLM y su exploración con respecto a los parámetros que controlan su API en uno de sus workshops, para ofrecer el primer paso para pasar de una Demo a un mínimo producto viable a través del control de sus parámetros usando la SDK de Python para llamar a la Vertex AI PaLM API. Además, exploramos los principios de Responsible AI que esta API pone a su disposición para evitar posibles alucinaciones y generaciones ofensivas.

El objetivo es entender bien las posibilidades que ofrece para que sea más adaptable a los casos de uso que tratemos.

Además, cada descripción incluye lo siguiente:

Modelos de Vertex AI PaLM API

La API ofrece 6 modelos de lenguaje distintos con dos primeros bloques separados en criterios funcionales: si son orientados a lenguaje u orientados a código. Los orientados a lenguaje son:

Text-bison: Es el que está asociado a gran cantidad de funciones relacionadas a tareas de procesamiento natural del lenguaje, además soporta más de 8000 input tokens lo que le permite asociar un contexto decente, y los datos de entrenamiento se encuentran actualizados a fecha de Feb de 2023 - las limitaciones de ChatGPT enuncian que su más usada versión se encuentra con respecto a 2021. Este modelo soporta fine-tunning, o reentrenamiento.
Chat-bison: modelo reentrenado sobre Text-bison que soporta menos contexto inicial, con una generación similar a la de su análogo.
Textembedding-gecko: Los embeddings son transformaciones de texto a representación numérica que se utilizan como paso previo a entrenamiento en modelos de lenguaje.

Para una primera aproximación a PaLM, cargamos el modelo, pasamos un prompt y generamos una respuesta.

PALM 2

Figura 1. “Hello PaLM2”. Las tres partes esenciales de uso de la API: cargamos un modelo, generamos un prompt y una respuesta. Cabe destacar que el método de carga del modelo tiene la misma semántica que la libreria de Huggin Face de Transformers.

Parámetros de control de la API

Los parámetros de control inicial se declaran en la respuesta como argumento. El modelo text-bison ofrece cuatro parámetros, que han de explorarse dependiendo del caso de uso del que se trata

Temperature (rango de (0,1), por defecto 0): se usa para un sampleado durante la generación de respuesta y controla el nivel de estocasticidad en la selección de tokens. Si este parámetro está cercano a 0, funciona para las indicaciones que requieren respuestas más determinantes y menos abiertas. En comparación, si está más cercano a 1 pueden llevar a resultados más "creativos" o diversos. Una temperatura de 0 es determinante: siempre se selecciona la respuesta con la probabilidad más alta. Para la mayoría de los casos de uso, se recomienda comenzar con un valor de 0.2.

ResponsibleAI tip: Cabe tener en cuenta que aunque los resultado pueden ser más creativos, también pueden general texto sin sentido o inapropiado.

Max_output_tokens (rango:1-1024, por defecto 128): es el número máximo de tokens que se pueden generar en la respuesta. Especifica un valor más bajo para respuestas más cortas y un valor más alto para respuestas más largas. Un token puede ser más pequeño que una palabra. Un token tiene aproximadamente cuatro caracteres. 100 tokens corresponden aproximadamente a 60-80 palabras. Es esencial tener en cuenta el tamaño de los tokens, ya que los modelos tienen un límite en el número de tokens de entrada y salida.
Top_p (rango de 0 a 1, por defecto 0.95): El parametro top_p se utiliza para controlar la diversidad del texto generado y a bajo nivel cambia como el modelo selecciona tokens para el output. Un valor más alto del parámetro top_p produce resultados más "diversos" e "interesantes", ya que se permite que el modelo elija de un conjunto más amplio de posibilidades. En contraste, un valor más bajo del parámetro top_p resulta en salidas más predecibles, ya que el modelo se limita a un conjunto más pequeño de tokens posibles. Especifica un valor más bajo para evitar aleatoriedad.
Top_k (rango 0 a 40, por defecto 40): top_k cambia la forma en que el modelo selecciona los tokens para la salida. Un top_k de 1 significa que el token seleccionado es el más probable entre todos los tokens en el vocabulario del modelo (también conocido como decodificación codiciosa). En contraste, un top_k de 3 significa que el siguiente token se selecciona entre los 3 tokens más probables (usando temperatura). En cada paso de selección de token, se muestrean los top_k tokens con las probabilidades más altas. Luego, los tokens se filtran aún más según top_p, y el tokenfinal se selecciona mediante muestreo de temperatura.

Inteligencia artificial generativa

Figura 2. Respuesta cargada con los parámetros con la vocación de generar la respuesta a la pregunta: ¿Fue Frodo quién destruyó el anillo? La documentación sobre los parámetros puede encontrarse aquí.

Notebook de ejemplo aquí.

Conclusiones : Hasta el momento hemos cargado un modelo y hemos aprendido más acerca de los parámetros que nos ayudan a controlar el modelo. Para saber más sobre estos parámetros puedes consultar la documentación aquí. Nos adentramos ahora en el diseño de las entradas o prompt, con una serie de buenas prácticas recomendadas por el equipo de Google Cloud para el mejor dominio de la API.

Caso de uso: Generación de respuestas con Vertex AI dentro del escenario Pregunta-Respuesta

Como hemos citado anteriormente, existen múltiples casos de uso que el modelo pre-entrenado puede llegar a resolver. Basándonos en los diferentes ejemplos del repositorio, nos enfocamos en los problemas funcionales de pregunta-respuesta.
Estos modelos pueden resolver problemas asociados a atención al cliente, chats en websites, foros, etc.

Sin embargo, además del modelo, tener en cuenta el dar al modelo el promtp óptimo puede influir notablemente en los resultados. Por ello, se presentan una serie de buenas prácticas. Como los dos primeros conceptos clave, encontramos que el prompt debe de ser específico, conciso y rico en contexto, además de estar exento de errores gramaticales y hacer solo una pregunta en cada prompt. Clasificamos entonces el tipo de pregunta dependiendo del dominio:

Dominio Abierto: Todas las preguntas cuyas respuestas están disponibles en línea. Pueden pertenecer a cualquier categoría, como historia, geografía, países, política, química, etc,. Estas incluyen preguntas de trivial o conocimiento general, como: P: ¿Quién ganó la medalla de oro olímpica en natación? P: ¿Quién es el presidente de [país determinado]? P: ¿Quién escribió [libro específico]? Ten en cuenta el límite de entrenamiento de los modelos generativos, ya que las preguntas que involucran información más reciente que la fecha en que el modelo fue entrenado podrían dar respuestas incorrectas o imaginativas.
Dominio cerrado: preguntas específicas, que corresponden a una base de conocimientos interna no disponible en Internet público. Si se indica correctamente, es más probable que el modelo responda desde el contexto proporcionado y menos probable que dé respuestas más allá de lo que se encuentra en Internet abierto. Si, por ejemplo, queremos construir un bit de preguntas y respuestas basado en la documentación completa de un producto, puedes pasar la documentación completa al modelo y solicitarle que responda sólo en función de eso.

Tanto en los dominios abiertos como en los dominios cerrados podemos utilizar una o varias preguntas dependiendo de la especificidad del dominio. En el caso de los dominios cerrados, añadimos además un string a modo de contexto.

respuesta IA historia

Figura 3. Dentro del contexto de Dominio abierto, podemos pasar una serie de preguntas para dar contexto al modelo. En este caso, preguntas de geografía e historia.

Existen muchas particularidades que puedes explorar en el repositorio de código abierto que el equipo de Google Cloud pone a su disposición.

Además de aprender, ha sido una experiencia única que nos ha dado la oportunidad de conectar con la comunidad. ¡Enhorabuena al equipo organizador y a todos los asistentes por su amabilidad y energía!

Blog

< Volver

Nodo: portalesizertis-webapp-6896d4b56c-9mdpz:8080

Nombre	Descripción	Tipo	Proveedor
COOKIE_SUPPORT	Esta cookie determina si el navegador acepta cookies.	HTTP	izertis.com
INGRESSCOOKIE	Registra que grupo de servidores está sirviendo al visitante. Esto se utiliza en relación con el equilibrio de carga para optimizar la experien cia del usuario.	HTTP	izertis.com
JSESSIONID	Conserva los estados de los usuarios en todas las peticiones de la página.	HTTP	izertis.com
LFR_SESSION_STATE_20103	Cookie utilizada por el portal web para el control de tiempo de sesión.	HTTP	izertis.com

Nombre	Descripción	Tipo	Proveedor	Vigencia
GUEST_LANGUAGE_ID	Determina el idioma preferido por el visitante. Permite a la web establecer el idioma preferido en el reingreso del visitante.	HTTP	izertis.com
lang	Recuerda el idioma seleccionado por un usuario con el que visualizar una página web	HTTP	ads.linkedin.com

Nombre	Descripción	Tipo	Proveedor
_ga	Registra una identificación única que se utiliza para generar datos estadísticos acerca de cómo utiliza el visitan te el sitio web.	HTTP	izertis.com
_gat	Utilizado por Google Analytics para controlar la tasa de peticiones	HTTP	izertis.com
_gid	Registra una identificación única que se utiliza para generar datos estadísticos acerca de cómo utiliza el visitante el sitio web .	HTTP	izertis.com
bounce	Determina si un visitante abandona la web inmediatamente - Esta información se utiliza para estadísticas y análisis internos por el operador de la web.	Pixel	adnxs.com
cb	Recoge información de la dirección de IP del visitante, localización geográfica y navegación. Esta información se utiliza para la optimización interna y estadísticas para el operador de la web.	Pixel	pixel.prfct.co
cb	Recoge información de la dirección de IP del visitante, localización geográfica y navegación. Esta información se utiliza para la optimización interna y estadísticas para el operador de la web.	Pixel	pixel-geo.prfct.co
personalization_id	Establecida por Twitter - La cookie permite al visitante compartir contenido de la web en su perfil de Twitter.	HTTP	twitter.com
seg	Registra datos estadísticos del comportamiento del visitante en la web. Esto se utiliza para análisis internos por el operador de la web.	Pixel	adnxs.com
seg	Registra datos estadísticos del comportamiento del visitante en la web. Esto se utiliza para análisis internos por el operador de la web.	Pixel	pixel-geo.prfct.co

Nombre	Descripción	Tipo	Proveedor
__ss	Recoge información del comportamiento del visitante en múltiples webs - Esta información se utiliza dentro de la web para optimizar la relevancia de la publicidad. La cookie también ayuda a determinar cómo el visitante accede a la web	HTTP	izertis.com
__ss_referrer	Recoge información del comportamiento del visitante en múltiples webs - Esta información se utiliza dentro de la web para optimizar la relevancia de la publicidad. La cookie también ayuda a determinar cómo el visitante accede a la web	HTTP	izertis.com
__ss_tk	Recoge información del comportamiento del visitante en múltiples webs - Esta información se utiliza dentro de la web para optimizar la relevancia de la publicidad. La cookie también ayuda a determinar cómo el visitante accede a la web	HTTP	izertis.com
_fbp	Utilizada por Facebook para proporcionar una serie de productos publicitarios como pujas en tiempo real de terceros anunciantes.	HTTP	izertis.com
A3	Recoge información del comportamiento del visitante en múltiples webs - Esta información se utiliza dentro de la web para optimizar la relevancia de la publicidad.	HTTP	yahoo.com
ads/ga-audiences	Utilizada por Google AdWords para reconectar con visitantes que tienen posibilidades de convertirse en clientes, se basa en el comportamiento online del cliente a través de las webs.	Pixel	google.com
anj	Registra una identificación única que identifica el dispositivo de un usuario que vuelve. La identificación se utiliza para los anuncios específicos.	HTTP	adnxs.com
bcookie	Utilizada por el servicio de networking social LinkedIn para rastrear el uso de servicios incrustados	HTTP	linkedin.com
bscookie	Utilizada por el servicio de networking social LinkedIn para rastrear el uso de servicios incrustados	HTTP	linkedin.com
cs	Esta cookie se utiliza para mejorar la relevancia de anuncios por medio de recoger datos del visitante en múltiples sitios web. Este intercambio de datos de visitante lo ofrece habitualmente un in tercambio de anuncios o centro de datos de terceros.	Pixel	pixel-geo.prfct.co
d/px	Recoge datos de las preferencias y el comportamiento del usuario en la web - Esta información se utiliza para producir contenidos y publicidad más relevantes para un usuario concreto.	Pixel	adsymptotic.com
fr	Utilizada por Facebook para proporcionar una serie de productos publicitarios como pujas en tiempo real de terceros anunciantes.	HTTP	facebook.com
getuid	El administrador de audiencias configura esta cookie para determinar la hora y frecuencia de sin cronización de datos del visitante. La sincronización de la cookie de datos sirve para sincronizar y reunir datos del visitante de diversos sitios web.	Pixel	adnxs.com
i	Registra datos anónimos del usuario, como su dirección IP, ubicación geográfica, sitios web visitados y en qué anuncios ha hecho clic el usuario, con el propósito de optimizar la visualización de anuncios según el movimiento del usuario en sitios web que utilizan la misma red publicitaria.	HTTP	openx.net
i/adsct	La cookie se utiliza por Twitter.com para determinar el número de visitantes que acceden a la we b a través del contenido publicitario de Twitter.	Pixel	twitter.com
IDE	Utilizada por Google DoubleClick para registrar e informar sobre las acciones del usuario en el sitio web tras visualizar o hacer clic en uno de los anuncios del anunciante con el propósito de medir la eficacia de un anuncio y presentar anuncios específicos para el usuario.	HTTP	doubleclick.net
koitk	Recoge datos sobre el comportamiento y la interacción de los visitantes - Esto se utiliza para opti mizar la web y hacer más relevante la publicidad en la misma.	HTTP	marketingautomation.services
lang	Establecida por LinkedIn cuando una página web contiene un panel “Síganos” incrustado.	HTTP	linkedin.com
lidc	Utilizada por el servicio de networking social LinkedIn para rastrear el uso de servicios incrustados.	HTTP	linkedin.com
lissc	Utilizada por el servicio de networking social LinkedIn para rastrear el uso de servicios incrustados.	HTTP	linkedin.com
na_id	Utilizada para reconocer al visitante en su reingreso. Esto permite que la web registre el comport amiento del visitante y facilite la función de compartir en las redes sociales provista por Addthis.com.	HTTP	addthis.com
ouid	Establece una cadena de identificación para un visitante específico. Esto se utiliza para reconocer al visitante en su reingreso. Además, permite a la web registrar el comportamiento del visitante y facilita la función de compartir en las redes sociales provista por Addthis.com.	HTTP	addthis.com
pa_#_ts	Utilizada en sitios web que utilizan la misma red publicitaria para mostrar anuncios a los otros a nunciantes de la red.	HTTP	prfct.co
pa_uid	Utilizada en sitios web que utilizan la misma red publicitaria para mostrar anuncios a los otros anunciantes de la red.	HTTP	prfct.co
test_cookie	Utilizada para comprobar si el navegador del usuario admite cookies.	HTTP	doubleclick.net
tr	Utilizada por Facebook para proporcionar una serie de productos publicitarios como pujas en tiempo real de terceros anunciantes.	Pixel	facebook.com
uid	Crea una identificación del usuario única y generada por una máquina. AddThis, que es propied ad de Clearspring Technologies, utiliza la identificación del usuario para hacer posible que el usuario comparta contenido en diversas r edes sociales proporciona estadísticas detalladas a varios proveedores.	HTTP	addthis.com
usermap	Utilizada para presentar al visitante contenido y publicidad relevante - El servicio está provisto por grupos de proveedores de publicidad externos, que facilitan ofertas en tiempo real a los anunciantes.	Pixel	pixel-geo.prfct.co
UserMatchHistory	Utilizada para rastrear a los visitantes en las múltiples webs para presentar publicidad relevante basada en las preferencias del visitante.	HTTP	linkedin.com
uuid2	Registra una identificación única que identifica el dispositivo de un usuario que vuelve. La identificación se utiliza para los anuncios específicos.	HTTP	adnxs.com
VISITOR_INFO1_LIVE	Intenta calcular el ancho de banda del usuario en páginas con vídeos de YouTube integrados.	HTTP	youtube.com
w/1.0/sd	Registra datos de visitantes como su dirección IP, la localización geográfica, y la interacción publicitaria. Esta información se utiliza para optimizar la publicidad en las webs que usan los servicios de OpenX.net.	Pixel	openx.net
YSC	Registra una identificación única para mantener estadísticas de qué vídeos de YouTube ha visto el usuario.	HTTP	youtube.com
yt-remote-cast-installed	Registra las preferencias del reproductor de vídeo del usuario al ver vídeos incrustados de YouTube.	HTML	youtube.com
yt-remote-connected-devices	Registra las preferencias del reproductor de vídeo del usuario al ver vídeos incrustados de YouTube.	HTML	youtube.com
yt-remote-device-id	Registra las preferencias del reproductor de vídeo del usuario al ver vídeos incrustados de YouTube.	HTML	youtube.com
yt-remote-fast-check-period	Registra las preferencias del reproductor de vídeo del usuario al ver vídeos incrustados de YouTube.	HTML	youtube.com
yt-remote-session-app	Registra las preferencias del reproductor de vídeo del usuario al ver vídeos incrustados de YouTube.	HTML	youtube.com
yt-remote-session-name	Registra las preferencias del reproductor de vídeo del usuario al ver vídeos incrustados de YouTube.	HTML	youtube.com
li_sugr	Utilizada por LinkedIn para rastrear el uso de servicios embebidos. El objetivo principal de esta cookie es: Targeting/Publicidad.	HTTP	linkedin.com