Intron, una startup de IA con sede en Lagos, ha lanzado oficialmente Sahara-v2, su modelo insignia de IA de voz de segunda generación, elevando efectivamente el estándar del reconocimiento de voz global. El modelo admite 24 nuevos idiomas africanos y domina más de 500 acentos distintos del inglés africano, llevando la cobertura total de idiomas de la compañía a un nivel sin precedentes de 57.
Durante años, interactuar con asistentes de voz globales como Siri, Alexa o motores estándar de texto a voz ha sido como hablar con una pared que fundamentalmente no habla tu idioma. Todos hemos estado allí, intentando usar un comando de voz solo para que una frase local como "No worry, e go better" se transcriba al sinsentido "No war eagle butter". Es gracioso al principio, pero cuando "Wanjiru" se digitaliza como "One zero" y "Chukwuebuka" inexplicablemente se convierte en "Check wheelchair baker", la gracia se desvanece rápidamente.
Estos repetidos fallos de transcripción son más que simples errores técnicos; son una forma activa de exclusión digital. Construidos predominantemente sobre conjuntos de datos occidentales, los principales modelos globales de IA fallan completamente aquí. No están diseñados para la riqueza tonal de nuestro habla, donde una sola palabra puede significar seis cosas diferentes según la pronunciación. Tropiezan con nuestro cambio de código rítmico natural y no pueden comprender que una sola oficina pueda emplear personal con diez acentos completamente diferentes. Cuando los asistentes de voz malinterpretan palabras y nombres básicos, excluyen a millones de usuarios de los atajos digitales que hacen la vida moderna más fácil.
Intron
Sahara-v2 cierra esta brecha crítica porque no se construyó sobre suposiciones ni se entrenó en un estudio silencioso y estéril. Intron construyó este modelo saliendo a las calles y escuchando. El conjunto de datos es masivo e hiperlocal: más de 14 millones de clips de audio, que totalizan más de 50 000 horas de habla, obtenidos de más de 40 000 hablantes. Estas voces representan 64 idiomas africanos y de la diáspora en más de 30 países. Crucialmente, fueron grabados donde la IA realmente necesita funcionar: en clínicas abarrotadas, mercados ruidosos, centros de llamadas bulliciosos y tribunales.
Este enfoque del mundo real desde cero ha permitido a Sahara-v2 superar a los nombres más grandes de la tecnología global. Cuando se compara con pesos pesados de la industria como Gemini-3, GPT-4, Whisper, ElevenLabs, AWS y Azure, el modelo de Intron ofrece ventajas dominantes.
Registra una tasa de precisión un 68,6% mejor en nombres africanos, organizaciones y ubicaciones, y es un 55,6% más preciso al transcribir números, fracciones y monedas. Además, cuenta con una resistencia un 36,5% mayor a las alucinaciones de IA causadas por ruido de fondo y hablantes superpuestos, junto con un aumento de rendimiento del 46,7% en sectores especializados como atención médica, derecho, telecomunicaciones y finanzas.
Más allá de los impresionantes puntos de referencia, Sahara-v2 es un motor de productividad serio diseñado para la implementación empresarial en el mundo real. Respaldado por APIs robustas que pueden implementarse en tan solo cinco minutos, la infraestructura ya está impulsando activamente la banca por voz, procesos automatizados de KYC y sistemas de autocompletado para todo, desde datos de salud hasta formularios de apertura de cuentas. Los primeros adoptantes empresariales informan que la tecnología está reduciendo los tiempos de procesamiento administrativo hasta 4,4 veces.
Para abordar las realidades lingüísticas únicas del continente, Intron ha lanzado características regionales altamente especializadas. En colaboración con Penda Health de Kenia, introdujeron el primer modelo bilingüe de Reconocimiento Automático de Voz (ASR) swahili-inglés del mundo, capturando perfectamente cómo las personas cambian naturalmente entre idiomas a mitad de oración.
Para el mercado aquí, han lanzado un modelo nativo de texto a voz (TTS) en hausa, permitiendo bots de voz 24/7 de baja latencia. Y para gobiernos y empresas que navegan preocupaciones de privacidad de datos, el lanzamiento de Sahara-v2 incluye nuevo soporte sin conexión, permitiendo que los datos permanezcan seguros y locales para el cumplimiento de IA soberana.
Sahara-v2 de Intron
Empresas y clientes gubernamentales en seis países ya están utilizando el sistema. Ayo Oluleye, Jefe de Datos e Insights en ARM Investments, señaló: "Usando los modelos de IA de Intron, hemos visto una mejora significativa en las transcripciones y resúmenes en comparación con los modelos que exploramos anteriormente. Sus sistemas capturan mejor el contexto y los matices, lo que lleva a resultados más precisos". Sarah Morris, CPO en Audere, se hizo eco de esto, reportando tasas de éxito de API superiores al 99% y una excelente precisión en acentos del sur de África.
Junto con el lanzamiento de Sahara-v2, Intron también publicó su informe inaugural 2026 Africa Voice AI Report. La publicación ofrece una mirada completa y primera de su tipo al ecosistema, detallando las lecciones aprendidas al implementar IA de voz en entornos complejos para guiar a startups, inversores y responsables de políticas.
Lea también: Google entrenará IA en 21 idiomas africanos, incluidos yoruba, hausa e igbo
Los idiomas más recientes incluyen francés africano, afrikáans, akan, amhárico, árabe, bemba, fulani, ga, hausa, igbo, kinyarwanda, luganda, oromo, pedi y pidgin. Otros son sesotho, shona, swahili, tswana, twi, wolof, xhosa, yoruba y zulú. Con estas adiciones, la puerta al mundo digital finalmente se está abriendo de par en par.
Como dijo el CEO de Intron, Tobi Olatunji: "Sahara-v2 demuestra que cuando la tecnología se construye con una comprensión cultural y lingüística profunda, pueden suceder cosas increíbles, y apenas estamos comenzando".
La publicación Intron lanza Sahara-v2, un modelo de IA de voz que admite 24 nuevos idiomas africanos apareció primero en Technext.

