Intron, стартап в сфере ИИ из Лагоса, официально запустил Sahara-v2, свою флагманскую голосовую модель ИИ второго поколения, эффективно поднимая планку глобального распознавания речи. Модель поддерживает 24 новых африканских языка и освоила более 500 различных африканских английских акцентов, доведя общее языковое покрытие компании до беспрецедентных 57.
На протяжении многих лет взаимодействие с глобальными голосовыми помощниками, такими как Siri, Alexa или стандартными движками преобразования текста в речь, ощущалось как разговор со стеной, которая принципиально не говорит на вашем языке. Мы все через это проходили, пытаясь использовать голосовую команду, только чтобы локализованная фраза вроде "No worry, e go better" была транскрибирована в бессмысленное "No war eagle butter". Поначалу это забавно, но когда "Wanjiru" оцифровывается в "One zero", а "Chukwuebuka" необъяснимо превращается в "Check wheelchair baker", шутка быстро надоедает.
Эти повторяющиеся ошибки транскрипции - это больше, чем просто технические промахи; это активная форма цифрового исключения. Построенные преимущественно на западных датасетах, ведущие глобальные модели ИИ полностью промахиваются здесь. Они не настроены на тональное богатство нашей речи, где одно слово может означать шесть разных вещей в зависимости от произношения. Они спотыкаются о наше естественное ритмичное переключение кодов и не могут понять, что в одном офисе может работать персонал с десятью совершенно разными акцентами. Когда голосовые помощники неправильно понимают базовые слова и имена, они блокируют миллионы пользователей от цифровых коротких путей, которые делают современную жизнь проще.
Intron
Sahara-v2 устраняет этот критический разрыв, потому что он не был построен на предположениях или обучен в тихой, стерильной студии. Intron построил эту модель, выходя на улицы и слушая. Датасет массивный и гиперлокализованный: более 14 миллионов аудиоклипов общей продолжительностью более 50 000 часов речи от более чем 40 000 носителей. Эти голоса представляют 64 африканских языка и языка диаспоры из более чем 30 стран. Решающим является то, что они были записаны там, где ИИ действительно нужно функционировать: в переполненных клиниках, шумных рынках, оживленных колл-центрах и судах.
Этот подход снизу вверх, основанный на реальном мире, позволил Sahara-v2 обогнать крупнейшие имена в глобальной технологической отрасли. При сравнении с тяжеловесами индустрии, такими как Gemini-3, GPT-4, Whisper, ElevenLabs, AWS и Azure, модель Intron демонстрирует убедительное лидерство.
Она демонстрирует на 68,6% более высокую точность по африканским именам, организациям и местоположениям, и на 55,6% точнее при транскрибировании чисел, дробей и валют. Кроме того, она обладает на 36,5% большей устойчивостью к галлюцинациям ИИ, вызванным фоновым шумом и перекрывающимися говорящими, наряду с повышением производительности на 46,7% в специализированных вертикалях, таких как здравоохранение, право, телекоммуникации и финансы.
Помимо впечатляющих показателей, Sahara-v2 является серьезным двигателем производительности, разработанным для реального корпоративного развертывания. Поддерживаемая надежными API, которые могут быть развернуты всего за пять минут, инфраструктура уже активно обеспечивает голосовой банкинг, автоматизированные процессы KYC и системы автозаполнения для всего, от медицинских данных до форм открытия счетов. Ранние корпоративные пользователи сообщают, что технология сокращает время административной обработки до 4,4 раз.
Для решения уникальных лингвистических реалий континента Intron развернул высокоспециализированные региональные функции. В сотрудничестве с кенийской Penda Health они представили первую в мире двуязычную модель автоматического распознавания речи (ASR) на суахили и английском языках, идеально улавливающую, как люди естественно переключаются между языками в середине предложения.
Для местного рынка они запустили нативную модель преобразования текста в речь (TTS) на хауса, обеспечивающую низкую задержку и круглосуточных голосовых ботов. А для правительств и предприятий, решающих вопросы конфиденциальности данных, развертывание Sahara-v2 включает новую автономную поддержку, позволяющую данным оставаться защищенными и локальными для соблюдения суверенного ИИ.
Sahara-v2 от Intron
Корпоративные и правительственные клиенты в шести странах уже используют систему. Айо Олулейе, глава отдела данных и аналитики в ARM Investments, отметил: "Используя модели ИИ Intron, мы увидели значительное улучшение в транскрипциях и резюме по сравнению с моделями, которые мы исследовали ранее. Их системы лучше улавливают контекст и нюансы, что приводит к более точным результатам". Сара Моррис, директор по продукту в Audere, подтвердила это, сообщив о более чем 99% успешности API и отличной точности на южноафриканских акцентах.
Наряду с запуском Sahara-v2, Intron также выпустил свой первый отчет Africa Voice AI Report 2026. Публикация предлагает всесторонний, первый в своем роде взгляд на экосистему, детализируя уроки, извлеченные из развертывания голосового ИИ в сложных средах, чтобы направлять стартапы, инвесторов и политиков.
Также читайте: Google обучит ИИ на 21 африканском языке, включая йоруба, хауса и игбо
Новейшие языки включают африканский французский, африкаанс, акан, амхарский, арабский, бемба, фулани, га, хауса, игбо, киньяруанда, луганда, оромо, педи и пиджин. Другие - сесото, шона, суахили, тсвана, тви, волоф, коса, йоруба и зулу. С этими дополнениями дверь в цифровой мир наконец-то широко распахивается.
Как выразился генеральный директор Intron Тоби Олатунджи: "Sahara-v2 доказывает, что когда технология создается с глубоким культурным и лингвистическим пониманием, могут произойти удивительные вещи, и мы только начинаем".
Пост Intron запускает Sahara-v2, голосовую модель ИИ, поддерживающую 24 новых африканских языка, впервые появился на Technext.


