No es ningún secreto que el robot de chat con inteligencia artificial Gemini, el buque insignia de Google, ha tenido algunos problemas. producción de imágenes históricamente inexactas obligó alphabet padre de Google a suspender temporalmente el producto a principios de este año.
Pero Google está intentando pasar página sobre sus primeros contratiempos en materia de IA. Oradores principales en la reunión anual del gigante tecnológico Google Cloud Próxima conferencia en Las Vegas El martes mostró las nuevas características de Gemini Pro 1.5, la última versión de su chatbot que ahora está disponible públicamente. Los espectadores observaron mientras los manifestantes murmuraron para sí mismos y escribieron indicaciones en el chatbot de IA renovado para resaltar sus nuevas herramientas, tal vez la más importante de las cuales es su capacidad de “conectar a tierra” las consultas. “Conectar a tierra” significa que las respuestas en Gemini Pro 1.5 están vinculadas a “fuentes de información verificables”. la empresa dijo el martes.
Los anuncios sobre Gemini 1.5 Pro incluyeron una serie de actualizaciones para el chatbot como parte del impulso de Google para vender sus productos de IA a clientes corporativos. Gemini ahora incluye capacidades adicionales para algo llamado “comprensión de contexto prolongado”, que básicamente significa que puede procesar mucha más información. Y tiene capacidades multimodales, o la capacidad de procesar no solo texto, sino también audio, video y otros formatos para generar respuestas. .
“Con estos dos avances, las empresas pueden hacer hoy cosas que antes no eran posibles con la IA”, dijo el director ejecutivo de Google, Sundar Pichai, durante la presentación.
Las empresas ya han estado probando el producto.Goldman Sachs, Mercedes y Uber se encuentran entre los primeros clientes de Gemini 1.5 Pro, dijo Google. El director ejecutivo de Goldman Sachs, David Solomon, una aparición en vídeo en Google Next justo después de Pichai. El director ejecutivo de Mercedes-Benz, Ola Källenius, también habló sobre la asociación del fabricante de automóvil alemán con Google y el uso de sus productos de IA .
Google dijo que Gemini 1.5 Pro permite a los clientes “procesar grandes cantidades de información en una sola secuencia”, incluida 1 hora de video, 11 horas de audio, o más 700.000 palabras.
“Por ejemplo”, añadió la empresa, “una empresa de juegos podría proporcionar un análisis en vídeo del rendimiento de un jugador, junto con consejos para mejorarlo. O una compañía de seguros podría combinar videos, imágenes y texto para crear un informe de incidente, facilitando el proceso de reclamos”.
Google también tenía otros anuncios de IA, cuya lista completa se puede encontrar en el sitio web de la conferencia Google Next 2024.
Vídeos de Google
Google lanza una aplicación de creación de vídeos impulsada por IA Vídeos de Google. La aplicación fue realizada por Aparna Pappu, vicepresidenta de Google Workspace el martes.
“Gemini sugiere un esquema narrativo para la historia que podría personalizar y editar fácilmente”, basándose en un mensaje en Google Docs, dijo. Pappu.
Generación de imágenes de texto a vivo
La última versión de Google de su generador de IA, Imagen 2.0, que funciona con Gemini, tiene la capacidad de crear imágenes en vivo a partir de mensajes de texto. .Aún está en modo “vista previa”, pero los oradores principales en Las Vegas mostraron la función.
“Los equipos creativos y de marketing pueden generar imágenes animadas a partir de un mensaje de texto, incluidas imágenes de productos, anuncios, GIF y guiones gráficos”, dijo Pappu. Otro manifestante señaló que la herramienta crea imágenes en vivo que de otro modo tomarían “días o semanas de exploración y filmación”.
Pappu también anunció que las imágenes generadas por IA de Google tendrán la capacidad de tener marcas de agua utilizando SynthID de Google DeepMind.
Este contenido ha sido traducido automáticamente del material original. Debido a los matices de la traducción automática, pueden existir ligeras diferencias. Para la versión original, haga clic aquí.