¿Recuerdan al iPhone 4s? Fue una de las actualizaciones más tenues del iPhone en sus —sintámonos viejos— 16 años de historia. Apenas cambiaba nada importante respecto al 4… salvo que incluía, en exclusividad, a Siri.
Visto con perspectiva, fue una puesta a punto bastante pírrica, pero en aquel momento, Siri nos obnubiló. Sus vídeos demostrativos, la mayor especialidad de Apple, inducían a pensar que el futuro pasaba por algo así: asistentes virtuales basados en la voz. Como el que Google no tardó en presentar o como el que Amazon decidió usar como piedra angular de su ecosistema digital.
En mi caso, recuerdo pensar “...y esto en 2011, a saber cómo estamos dentro de otros diez años”. No han pasado diez, sino doce, y lo que suena es un acorde triste de trompeta: Siri no ha evolucionado al mismo nivel, ni de lejos, que el resto de productos de Apple, ni de lo que lo ha hecho la industria tecnológica en general.
Su competencia tampoco está mucho mejor. Sobre todo, por agravio comparativo.
Están ahí, pero ni crecen demasiado ni emocionan a nadie
No es que Siri, Alexa o Google —o bueno, sobre todo Siri— no hayan evolucionado en estos años. Es que no resulta fiable recurrir a un asistente así en demasiadas circunstancias ni tiene profundidad real. Cuántas veces hemos zanjado una interacción tras escuchar “Esto es lo que he encontrado en Internet sobre…”.
Microsoft también presentó Cortana para cambiarlo todo integrándola en Windows, tanto para ordenadores como para móviles, con escasa trayectoria y nula relevancia. Murió en 2021.
Ahora suena prosaico pensar que Microsoft no va a incorporar parte de la tecnología de GPT-4 y sucesivos a una interfaz conversacional en su ecosistema, no solo de generación y síntesis de texto escrito. Podíamos dudar de Ballmer, pero de la visión estratégica de Nadella no duda nadie. Lo mismo que pensar que Google no va a hacer lo propio con Bard tras su anuncio de una IA generativa integrada en Workspace.
El problema para los asistentes de voz es que hace 10 años estábamos alucinados, hace 5 ya andábamos algo desencantados, pero con la esperanza de los altavoces inteligentes que estaban a punto de llegar; y ahora nadie habla de ellos, porque OpenAI, Microsoft, Google y unos pocos más monopolizan esa conversación. Están ahí, se usan, cumplen un papel, pero ni crecen demasiado ni emocionan a nadie. El impacto del asistente de voz no está muy lejos del de contar con un conector algo más rápido.
De Amazon sabemos que una buena parte de los despidos que anunció recientemente van a recaer sobre la plantilla que se encarga de Alexa, que más allá del entusiasmo inicial ha acabado siendo usada mayoritariamente para poner temporizadores y pedirle algo de música. Y no para usos más avanzados que no pudiéramos hacer hace una década.
Ni hablemos de para acostumbrarnos a comprar compulsivamente con la voz, algo que hubiese rentabilizado mejor su enorme apuesta por esta tecnología. El hardware, habitualmente vendido a precios irrisorios, tampoco suena a un gran negocio por sí mismo. Ha sido muy habitual encontrar Echo Dot por 20 euros. Si a 20 euros le quitamos el IVA, el envío, el embalado, los materiales, el ensamblado… ¿Qué le queda a Amazon?
La suerte de los ingenieros de Google encargados de sus sistemas operativos para entornos domésticos no ha sido mucho mejor. Según The New York Times, un 16% de ellos han caído en la lista de despidos, que solo afectó al 6% de su plantilla.
En la acera de enfrente, OpenAI ha conseguido que su interfaz conversacional cale desde el primer día, ayudando a multitud de profesiones a hacer su trabajo más eficiente y rápido, desde programadores hasta periodistas pasando por abogados o creativos. Midjourney o Stable Diffusion han logrado lo propio en la creación visual como un producto de resultados inmediatos.
Los asistentes de voz coparon titulares hablando sobre sus posibilidades futuras y se fueron deshinchando con el paso del tiempo hasta limitarse a unos usos básicos que han evolucionado poco. La nueva oleada de herramientas basadas en IA logra que se hable de ellas por sus posibilidades del presente, no del futuro.
Un año es un mundo para lo que puede evolucionar ChatGPT o Midjourney, pero una década ha servido para que Siri, Alexa o el asistente de Google evolucionen poco.
En Xataka | "Nos equivocamos": la IA de OpenAI era demasiado abierta, así que en GPT-4 impera el secretismo absoluto
Imagen destacada | Omid Armin en Unsplash.
Ver 26 comentarios
26 comentarios
linuxok
Es lo que pasa cuando se introducen cosas que cambian el modelo mental del usuario y le quieren forzar a hacer las cosas de una forma distinta a como está acostumbrado a hacerlas. Si a eso le sumas dudas razonables en cuanto a privacidad, pues tienes el resultado: la gente no lo usa.
JuanAR
Sí que es verdad de que hay reticencia a lo nuevo, pero si te facilita las cosas lo adoptas rápido. Por ejemplo, lo de poner música o la alarma, que es raro que falle y más cómodo que hacerlo manualmente.
En cambio, si te cuesta más trabajo y al final lo tienes que acabar haciendo manualmente o no te fías del resultado, pues ya no lo usas.
informatico_loco
El uso que le doy al altavoz de Google es para consultar de vez en cuando el tiempo y alguna orden esporádica para que mi Home Assistant encienda o apague alguna luz. Y poco más. Hasta el día que me canse y lo quite. Lo compré con mucha ilusión pero desde 2018 no ha avanzado prácticamente nada, aun espero la función de poder enviar un whastapp. Desde luego nunca se me ocurriría comprar algo a través del altavoz, demasiadas cosas podrían salir mal. Para comprar, mejor ver.
pedrosalguera
"Ahora suena prosaico pensar que Microsoft no va a incorporar parte de la tecnología de GPT-4 y sucesivos a una interfaz conversacional en su ecosistema, no solo de generación y síntesis de texto escrito. "
Esto. Decirle a tu dispositivo que cambie el fondo de pantalla, que cuando estés volviendo a casa encienda la calefacción, que te cambie los widgets a la pantalla secundaria, que por las noches active el modo no molestar a una hora concreta excepto los findes, que la ponga más tarde, que ahora solo deje pasar mensajes de tu madre y tu hijo y de nadie más, que te cree un e-mail con un contenido x y se lo envíe a un número determinado de personas, que te busque fotos de cuando estuviste en la playa con un amigo entre 2010 y 2015... Y no hablo ya de "coge esta foto, recorta la cara de x y pégala en otra que tenga un fondo de pantalla de una playa junto a Justin Bieber y pon un cartel que diga "así te veremos estas vacaciones", o "la foto de la portada de este texto cámbiala por otra con estas características, dame 10 opciones diferentes, y en la contraportada recorta la imagen del perro y quítale el fondo"
Todo esto y mil millones de cosas más sin tener que estar buscando las apps o las opciones de configuración, solo con decírselo
asdfer
Para lo unico bueno que sirven es para decirle que llamen a alguien en el coche
ynos78
Totalmente de acuerdo. A menudo, cuando se introduce una nueva tecnología o un nuevo producto que requiere que los usuarios cambien su forma de hacer las cosas, puede haber una resistencia natural al cambio. Esto se debe a que los seres humanos tienden a ser criaturas de hábito y les resulta difícil salir de su zona de confort.
Además, cuando se introducen nuevas tecnologías que involucran el manejo de datos personales, es comprensible que los usuarios tengan preocupaciones sobre su privacidad y seguridad. Si los usuarios no confían en que sus datos están siendo protegidos adecuadamente, es poco probable que se sientan cómodos usando la tecnología.
En resumen, para fomentar la adopción de nuevas tecnologías, es importante que los desarrolladores consideren cuidadosamente cómo el producto cambiará la forma en que los usuarios hacen las cosas y cómo pueden abordar las preocupaciones de privacidad y seguridad de los usuarios.
Rawl Draw
Pues no veo por qué no le tienen que poner voz a GPT o algún pariente, yo lo veo la evolución lógica. La tecnología ya está inventada.
nullusdomine
Yo aquí el fracaso que les veo es que son bastante inútiles en el momento en que compliques un poco la pregunta (cosas tan complicadas como si va a llover mañana pueden recibir respuestas de lo más surrealistas)
Al final, para encender luces, poner temporizadores y otras cosas simples vale, para algo más sofisticado va como el culo.
Y ojo, que yo no he sido capaz que se entere que significa "Abrir persianas" He tenido que decir "activar persianas"
rafaello76
a ver si revienta la burbuja de la IA
maoleon
Yo hace unas semanas integre Chat gpt a SIRI y el cambio es brutal,ahora si es un asistente de verdad, ya le puedes preguntar lo que sea,resumenes de algun articulo que estes buscando,te da las mejores respuestas y consejos es impresionante lo que puede hacer (ya no es la tipica respuesta °Encontre esto en internet°).
Usuario desactivado
El problema es la vía seguida por estas empresas para crear sus llamadas IA: entrenamiento en reconocer patrones con miles de millones de datos de ejemplo. Pura estadística. Pero no son sistemas que razonen, no son sistemas que aprendan luego de entrenados y no pueden explicar como obtienen sus respuestas. En algún momento el usuario se da cuenta que esta hablando con un loro.
reyang
Creo que en esta web últimamente algo parecen tener en contra de los asistentes de voz especialmente Alexa, el de Amazon y en todos los artículos mencionan que la mayoría de la gente lo usa solo para poner temporizadores o contar chistes, eso evidencia que el que escribe solamente lo usa para eso y asume que los demás también lo hacen.
Los asistentes de voz tienen mucho potencial, pero que la gente no los aproveche ya es un tema muy diferente. Para mi si son utiles, pero si coincido que en el caso de Siri, el de Apple, si se quedo muy limitado.