04 marzo 2021

Otter.ai ofrece transcripciones de texto casi perfectas gracias a la IA

Otter.ai es una herramienta de conversión o transcripción de texto muy avanzada.

Es fácil de usar y la transcripción que se obtiene es notablemente precisa.

Incluso a veces puede captar los diálogos de un vídeo de YouTube con mayor acierto que la propia herramienta de la plataforma de Google.

La tecnología principal de central de Otter.ai fue desarrollada por un equipo de Google, Yahoo, Facebook, MIT, Stanford, Duke y Cambridge. La base está en la optimización de las  conversaciones con inteligencia artificial. Puede distinguir entre hablantes utilizando una técnica llamada “diarización”, generando una huella única para la voz de cada persona.

Las transcripciones se procesan en la nube y están disponibles desde la web, en Dropbox o en la app móvil de Otter.ai. Luego se pueden buscar, copiar y pegar, editar o compartir con una nube de palabras en la parte superior de cada grabación que rastrea los términos más utilizados.

La alta precisión de Otter es el resultado de los algoritmos que permiten que la app “aprenda”  tanto como incluso para distinguir diferentes acentos del inglés dentro de los Estados Unidos y fuera de él.

Otter Pro ofrece un servicio de suscripción por unos 9 euros al mes, pero también ofrece un plan gratuito con 600 minutos de transcripción por mes y almacenamiento en la nube ilimitado.

Tiempo después de su modelo base agregó otras funcionalidades que han sido muy propicias, sobre todo con la llegada de los confinamientos y la necesidad de dar clase o trabajar desde casa.

Una de ellas es la integración con Zoom para proporcionar notas de vídeo de reuniones en vivo, es decir, la capacidad de grabar y ver una transcripción interactiva en vivo directamente desde una videoconferencia. Del mismo modo, lleva su servicio a los más de 100 millones de usuarios de Google Meet.

Otter también ha entrado en el mercado de la educación con Otter for Education, que permite a los profesores controlar el acceso a las transcripciones grabadas y complementa los servicios de discapacidad de los estudiantes con tecnologías de accesibilidad.

También ofrece Otter for Events, un servicio que utiliza la tecnología de procesamiento del lenguaje natural para capturar conversaciones de eventos y convertirlas en transcripciones en tiempo real.

La función también está diseñada para funcionar incluso si el participante de la reunión está usando auriculares o audífonos, dice la compañía.

La startup ha anunciado que ha recaudado 50 millones de dólares en una última ronde de financiación.

La compañía planea triplicar su plantilla durante el próximo año a medida que contrate a más equipos de inteligencia artificial, aprendizaje profundo, procesamiento de lenguaje natural, etc.

Leave a Reply