El año 2023 será recordado como un punto de inflexión en la historia de la inteligencia artificial, donde la competencia entre gigantes y startups terminó con la llegada de Google Gemini.
La verdad es que en 2023 esta gran compañía se ha quedado un poco atrás en este sentido a pesar del gran lanzamiento de Google Bird, pero parece que por fin se guardaba una última sorpresa.
– La Prensa – Venezuela –
Gemini se presenta como una familia de modelos que promete superar incluso al famoso GPT-4 en varios aspectos, especialmente en integración multimodal. Puede crear y procesar texto, imágenes y otros tipos de datos como gráficos y mapas.
Sin embargo, por muy impresionantes que puedan parecer estas herramientas hoy en día, Google cree que están lejos de maximizar todo el potencial de la tecnología. Por eso, en este artículo analizaremos qué quiere lograr el gigante de las búsquedas con Gemini, cómo funciona y por qué indican que será el futuro de la IA, informó el portal Computer Hoy.
¿Qué es Google Géminis?
Géminis es Un nuevo y potente modelo de inteligencia artificial de Google, al estilo GPT-4 al que, así, no se puede acceder directamente. Más bien, sirve como base que Google y, eventualmente, otros desarrolladores pueden utilizar para crear productos sobre ella. Por ejemplo, GPT-4 trabajó para crear un ChatGPT más sólido. Con Géminis ocurre lo mismo.
– La Prensa – Venezuela –
Según Dennis Hassabis, director general y cofundador de Google DeepMind, “fue creado desde cero para ser multimodal, lo que significa que puede comprender, gestionar e integrar diferentes tipos de información de una manera sencilla y fluida, incluidos texto, código , audio, imágenes y vídeo”.
Puede comprender no sólo texto sino también imágenes, vídeo y audio. Como modelo multimodal, se describe que Gemini es capaz de comprender y crear código de alta calidad en múltiples lenguajes de programación, además de completar tareas complejas en matemáticas, física y otros campos.
Si bien esto por sí solo no es algo que llame mucho la atención, con modelos similares disponibles actualmente, la versatilidad de Gemini es un factor clave, ya que es más que un solo modelo y puede ejecutarse en todo, desde centros de datos hasta dispositivos móviles.
Se lanzó el 6 de diciembre con demostraciones que muestran cómo escribir código, explicar problemas matemáticos, encontrar similitudes entre dos imágenes, convertir imágenes en código, comprender emojis y más, aunque admitió que hubo controversia sobre cuán falsificadas eran estas pruebas.
Estará disponible en tres modelos.
Google describe a Géminis Un modelo flexible capaz de ejecutarse en todo, desde centros de datos de Google hasta dispositivos móviles. Para lograr esta escalabilidad, Gemini se lanza en tres formas: Géminis Nano, Géminis Pro y Géminis Ultra.
1. Gemini Nano: El tamaño del modelo Gemini Nano está diseñado para funcionar en teléfonos inteligentes, específicamente el Google Pixel 8. Está diseñado para realizar tareas en dispositivos que requieren un procesamiento eficiente de IA sin conectarse a un servidor externo, como sugerir respuestas dentro del chat de aplicaciones. O resumir el texto.
La ventaja de tener todo en tu teléfono y no acudir a un servidor externo es la privacidad y seguridad de la que muchos hablan cuando se refieren a estas herramientas de IA. Eso sí, no esperes la misma velocidad de respuesta y es cierto que consumen mucha batería y espacio de almacenamiento.
- Gemini Pro: Gemini Pro, que se ejecuta en los centros de datos de Google, está diseñado para impulsar la última versión de Bird, el chatbot de inteligencia artificial de la compañía. Es capaz de proporcionar un tiempo de respuesta rápido y comprender consultas complejas. En este caso el modelo anterior, que era el PaLM 2, ha sido abandonado para dar la bienvenida al Gemini Pro
- Gemini Ultra: Aunque aún no está disponible para su uso generalizado, Google describe al Gemini Ultra como su modelo más capaz, “El modelo de lenguaje grande (LLM) supera los resultados actuales de última generación en 30 de 32 puntos de referencia académicos ampliamente utilizados en investigación y desarrollo”. Está diseñado para tareas altamente complejas y se lanzará después de completar su fase de prueba actual.Se espera que comience este 2024
– La Prensa – Venezuela –