Whisper, la herramienta de inteligencia artificial de OpenAI para convertir archivos de audio a texto Los creadores de ChatGPT y DALL-E 2 también tienen una herramienta que simplificará tu vida cuando necesites convertir grabaciones de audio a texto.

whisper.ai

Quienes trabajamos en el mundo editorial sabemos lo engorroso que puede resultar transcribir una entrevista. A veces, la parte fácil del proceso es realizar la entrevista en sí misma; lo complicado es transcribirla en un intento por recuperar las palabras y el tono exacto en que el entrevistado habló.

Aunque a lo largo de los años han aparecido diversas aplicaciones para convertir archivos de audio de voz en texto, solían presentar algunas fallas (sobre todo con la puntuación) y se trataba de aplicaciones de paga en las que, además, había que subir los archivos a su plataforma. El proceso seguía teniendo un su grado de complejidad y tedio.

Ahora ha aparecido en el mercado una nueva herramienta impulsada por la inteligencia artificial capaz de comprender y transcribir a la perfección voces hasta en 90 idiomas. Su nombre es Whisper (susurro en español) y es una creación de OpenAI, la organización que ha tomado por asalto este 2023 y que ya está transformando el modo en el que trabajamos con el modelo de lenguaje autorregresivo, GPT-3, y DALL-E 2, esa herramienta capaz de generar increíbles imágenes y diseño a partir de una entrada de texto.

¿Qué es Whisper?

Según se explica en la página oficial del proyecto, Whisper "es un sistema de reconocimiento automático de voz (ASR) entrenado con más de 680,000 horas de datos supervisados multilingües y multitarea recopilados de la web".

El programa no solo es capaz de convertir a texto lo que escucha, sino que también de traducirlo al inglés en tiempo (por ahora) con resultados sorprendentes. La herramienta es muy precisa, reconoce la puntuación y es capaz de entender hasta las voces veloces y complejas. He aquí un ejemplo:

¿Cómo usar Whisper?

El problema con Whisper es que (todavía) no es fácil de utilizar. Como un gran número de aplicaciones de inteligencia artificial, es necesario utilizar un programa como Google Colab que permite a los usuarios "escribir y ejecutar código abierto de Python en el navegador". Aunque este proceso no es tan complejo como suena (y existen cantidad de tutoriales en YouTube que te ayudarían a hacerlo), sigue siendo engorroso sobre todo para quienes no somos desarrolladores.

Pero gracias a que Whisper es un desarrollo de código abierto, varios programadores han comenzado a crear aplicaciones más amigables impulsadas por Whisper que, una vez instaladas, te permiten probar las mieles de la transcripción de texto asistida por la inteligencia artificial.

Si te interesa saber más al respecto y quieres probar instalara en tu computadora te recomendamos ver este tutorial en el que Dot CSV te explica cómo hacerlo:

Eduardo Scheffler Zawadzki

BIZ Experiences Staff

Iniciar un negocio

63 ideas de pequeños negocios para iniciar en 2025

Hemos elaborado una lista con las mejores y más rentables ideas de pequeños negocios para que los emprendedores las consideren en 2025.

Noticias

14 maneras fáciles de ganar dinero extra en casa

Un ingreso adicional se siente como ser rico si ya tienes un trabajo diario para cubrir las deudas.

Finanzas

10 movimientos financieros que todo emprendedor debería hacer para construir riqueza

Sin una estrategia intencional para generar riqueza personal, podrías tener un negocio exitoso y aun así no tener nada que mostrar.

Emprendedores

10 grandes frases sobre el poder de las metas

Establecer metas es el primer paso para lograr algo significativo.

Emprendedores

La Generación Z está perdiendo la fe en el título universitario — aquí tienes 3 razones por las que sigue siendo importante para ellos

Un título universitario puede no ser esencial para el éxito, pero aquí hay tres razones cruciales por las que deberías animar a tus hijos de la Generación Z a obtener uno.

Noticias

Ecuador, ante desafíos y oportunidades tras la creciente demanda de talento digital en América Latina

Datos reflejan una participación minoritaria de Ecuador para suplir los roles más demandados, evidenciando un ecosistema digital en desarrollo pero con oportunidades crecientes.