Contents

Apple puede traer un asistente de transcripción de IA a iOS 18

Se espera que el inminente lanzamiento de iOS 18 y iPadOS 18 en la próxima Conferencia Mundial de Desarrolladores (WWDC) introduzca emocionantes mejoras de inteligencia artificial tanto para el iPhone como para el iPad, que se han convertido en dispositivos casi indispensables en el acelerado mundo actual.

A pesar de que ha habido una discusión considerable sobre las aspiraciones de Inteligencia Artificial de Apple durante bastante tiempo, estas discusiones se han mantenido en gran medida algo ambiguas con respecto a los detalles específicos de sus planes, lo que hace que sea difícil discernir la veracidad de tales afirmaciones y determinar exactamente cuál es el objetivo. la empresa pretende lograr en este sentido.

Apple es conocida por ser reservada sobre sus planes, lo que dificulta determinar el alcance de su participación en la IA generativa. Sin embargo, dada la amplia gama de aplicaciones de dicha tecnología, incluida la manipulación de fotografías, la toma de notas y las capacidades de asistente virtual, es posible que les haya llevado algún tiempo evaluar sus habilidades y determinar la mejor manera de utilizar estas tecnologías.

De hecho, uno puede anticipar con confianza una mejora en las capacidades de Siri, dado que su desempeño está por detrás del de sus competidores. Además, se ha informado que Apple ha estado desarrollando diligentemente avances para Siri desde al menos 2019, poco después de conseguir los servicios del exjefe de IA de Google para encabezar estos esfuerzos. El reciente silencio sobre el progreso de Siri se puede atribuir a que Apple adoptó un enfoque estratégico y paciente para lograr sus objetivos.

La consideración relativa al alcance de las operaciones que se pueden ejecutar de forma nativa en los dispositivos de Apple utilizando sus potentes procesadores de las series A y M es un factor que vale la pena examinar. Este enfoque se alinea con la preferencia de Apple por mejorar la privacidad y exhibir la potencia de sus circuitos integrados. Sin embargo, se hace evidente la necesidad de delegar ciertos procesos complejos a servidores remotos, como lo demuestra el desarrollo de servidores de IA especializados equipados con componentes M2 Ultra para gestionar estos requisitos.

Transcripción de IA

De hecho, parece que Apple tiene preparadas más mejoras para su asistente virtual, Siri. Según informes recientes, la empresa está desarrollando una función que proporciona servicios de resumen y transcripción de audio en tiempo real como parte de sus ofertas principales de sistemas. Este desarrollo se alinea con la funcionalidad que actualmente proporciona Siri Dictation y sugiere que Apple está comprometida a mejorar continuamente las capacidades de su asistente digital.

Fuentes confiables informan que Apple ha estado desarrollando capacidades avanzadas de transcripción de audio y generación de resúmenes impulsadas por inteligencia artificial para sus próximos sistemas operativos. Se prevé que estas características innovadoras darán como resultado mejoras sustanciales en la productividad para las personas que utilizan aplicaciones populares como Notas y Notas de Voz. Marko Zivkovic, un estimado editor de nuestra publicación, ha compartido sus ideas sobre este tema.

Una versión avanzada de la aplicación Notas de voz de Apple, que se rumorea que está en evaluación, presenta una funcionalidad que permite a los usuarios ver una representación textual continua de sus conversaciones grabadas en lugar del patrón de oscilación visual tradicional que se muestra en la plataforma iOS 17 actual.

Se ha sugerido que en un futuro próximo estará disponible la posibilidad de transferir transcripciones de audio en vivo directamente a la aplicación de notas de Apple. Esta noticia fue reportada previamente por nuestro sitio web el mes pasado y se cree que la aplicación ya incluye una función de nota de voz incorporada.

La funcionalidad exhibida por estas aplicaciones parece alinearse con la tecnología Live Voicemail implementada inicialmente por Apple en su versión iOS 17. Parecería ser una extensión orgánica de esta capacidad para convertir los mensajes de voz en formato de texto. Sin embargo, lo que sigue siendo incierto es si este proceso se llevará a cabo íntegramente dentro del propio dispositivo o requerirá la participación de servidores de inteligencia artificial basados ​​en la nube.

Live Voicemail muestra una competencia razonable en la comprensión de mensajes hablados destinados a ser mensajes de voz; sin embargo, su rendimiento no cumple con las expectativas cuando se le asigna la tarea de producir transcripciones precisas. De manera similar, la función de dictado de Siri demuestra inconsistencias a pesar de estar integrada en el dispositivo desde el lanzamiento de iOS 15. A pesar de esta mejora, la aplicación sigue siendo subóptima para tareas de transcripción extendidas.

Por otro lado, Apple introdujo transcripciones dentro de su aplicación Podcasts a principios de este año, que exhiben una precisión excepcional debido a que no implican ningún cálculo realizado localmente. Estas transcripciones son producidas por los servidores de Apple poco después de que se haya subido el podcast. Si bien este enfoque ofrece varias ventajas, como mantener la privacidad, dado que los podcasts no contienen detalles confidenciales de los que preocuparse, y conservar energía al evitar esfuerzos de procesamiento duplicados en millones de iPhones, también presenta algunas consideraciones prácticas.

Las capacidades potenciales de este innovador asistente de IA se extienden más allá de la simple transcripción y abarcan la generación de resúmenes concisos que enfatizan los aspectos clave de una conferencia determinada u otra forma de comunicación. Al utilizar algoritmos avanzados y técnicas de procesamiento del lenguaje natural, el asistente de IA puede analizar y resumir de manera efectiva información compleja en resúmenes fácilmente digeribles, brindando así a los usuarios una herramienta valiosa para comprender y retener contenido esencial de manera eficiente.

Si bien ha habido informes que sugieren que Apple está experimentando actualmente con varias funcionalidades avanzadas para su próximo lanzamiento de sistema operativo móvil, iOS 18, sigue siendo incierto si estas características particulares realmente harán su debut junto con las versiones beta iniciales para desarrolladores que se implementarán dentro de las próximas semanas. Es posible que sea necesario algún tipo de procesamiento backend para que estas características funcionen de manera óptima, y ​​si dicho procesamiento realmente es necesario, entonces es posible que Apple opte por retrasar su implementación completa hasta que el soporte de infraestructura requerido esté completamente implementado. A la luz de esta posibilidad, es plausible que la compañía opte por anunciar estas características como"programadas para su lanzamiento en una fecha posterior", una táctica que ha empleado en numerosas ocasiones en relación con nuevas capacidades importantes de iOS.

Es importante señalar que la información presentada aquí aún no ha sido verificada oficialmente por Apple y, por lo tanto, sigue sujeta a conjeturas. Si bien los datos proporcionados pueden tener cierta validez, no se puede garantizar que sean completamente exactos. Como tal, es aconsejable abordar todas y cada una de las afirmaciones, ya sean tecnológicas o de otro tipo, con una buena dosis de escepticismo.

*️⃣ Enlace fuente: