ElevenLabs از مرحله بتا خارج میشود با مدل صوتی هوش مصنوعی ۲۸ زبانه پس از ارزشگذاری ۱۱ میلیارد دلاری
Darius Baruo ۱۴۰۵/۱۲/۱۵ ۱۲:۲۷
ElevenLabs نسخه Eleven Multilingual v2 را با پشتیبانی از ۲۸ زبان راهاندازی کرد و به طور رسمی هفتهها پس از تامین ۵۰۰ میلیون دلار سری D با ارزشگذاری ۱۱ میلیارد دلاری از مرحله بتا خارج شد.
ElevenLabs به طور رسمی از مرحله بتا خارج شده و Eleven Multilingual v2، یک مدل گفتار هوش مصنوعی بنیادی با پشتیبانی از ۲۸ زبان را راهاندازی کرده است. این انتشار تنها چند هفته پس از اینکه شرکت دور تامین مالی سری D به ارزش ۵۰۰ میلیون دلار را با ارزشگذاری ۱۱ میلیارد دلاری به پایان رساند، صورت گرفت.
مدل جدید به طور خودکار متن نوشته شده را در نزدیک به ۳۰ زبان شناسایی میکند و آنچه شرکت آن را گفتار "غنی از احساسات" توصیف میکند، تولید میکند. مهمتر از آن برای تولیدکنندگان محتوا، ویژگیهای صوتی - از جمله لهجههای اصلی - در تمام زبانهای پشتیبانی شده ثابت میمانند. یک صدای شبیهسازی شده میتواند اکنون محتوا را به زبانهای چینی، ژاپنی، عربی، کرهای و ۲۴ زبان دیگر بدون از دست دادن ویژگیهای متمایز خود تولید کند.
۱۸ ماه تحقیق نتیجه داد
ElevenLabs یک سال و نیم را صرف ساختن مکانیسمهای جدید برای درک متن و انتقال احساسات در گفتار سنتز شده کرد. این زمانبندی تصادفی نیست. با ۳۳۰ میلیون دلار درآمد تکرارشونده سالانه گزارش شده برای سال ۲۰۲۵ و بیش از ۱ میلیون کاربر در پلتفرم، شرکت به زیرساختی نیاز داشت که بتواند در سطح جهانی مقیاسپذیر باشد.
این مقیاسپذیری ماه گذشته هنگامی که ElevenLabs مشارکت خود با Google Cloud را گسترش داد و دسترسی به GPU های NVIDIA Blackwell را برای مدیریت تقاضای افزایش یافته به دست آورد، تقویت شد.
فهرست زبانها اکنون شامل چینی، کرهای، ژاپنی، ترکی، اندونزیایی، فیلیپینی، اوکراینی، یونانی، چکی، فنلاندی، رومانیایی، دانمارکی، بلغاری، مالایی، اسلواکی، کرواتی، عربی کلاسیک و تامیل است. این زبانها به هشت زبان اصلی میپیوندند: انگلیسی، لهستانی، آلمانی، اسپانیایی، فرانسوی، ایتالیایی، هندی و پرتغالی.
چه کسانی بیشترین بهره را میبرند
توسعهدهندگان و ناشران بازی به طور قابل توجهی سود خواهند برد. استودیوهای مستقل اکنون میتوانند محتوای صوتی را برای مخاطبان بینالمللی بومیسازی کنند بدون اینکه بازیگران صداپیشه برای هر بازار استخدام کنند. Embark Studios و Paradox Interactive در حال حاضر از این پلتفرم استفاده میکنند.
مؤسسات آموزشی تولید فوری محتوای صوتی را به زبانهای هدف دریافت میکنند - که برای برنامههای یادگیری زبان و پذیرش دانشجویان بینالمللی مفید است. ناشران کتاب صوتی مانند Storytel که قبلاً شریک ElevenLabs هستند، میتوانند کاتالوگهای خود را سریعتر به بازارهای جدید گسترش دهند.
جنبه دسترسیپذیری نیز اهمیت دارد. محتوای بصری اکنون میتواند با گفتار چندزبانه برای کاربران دارای اختلالات بینایی تکمیل شود، بدون هزینه ضبط مسیرهای صوتی جداگانه برای هر زبان.
مرحله بعدی چیست
ElevenLabs قصد دارد مکانیزم اشتراکگذاری صوتی را معرفی کند که به کاربران اجازه میدهد از صداهای شبیهسازی شده خود زمانی که دیگران از آنها برای تولید محتوا استفاده میکنند، درآمدزایی کنند. مدیرعامل Mati Staniszewski آن را به عنوان "همکاری انسان-AI Agent" چارچوببندی کرد - اگرچه جزئیات تقسیم درآمد هنوز مشخص نیست.
مسیر شرکت از ارزشگذاری ۱۰۰ میلیون دلاری در ژوئن ۲۰۲۳ تا ۱۱ میلیارد دلار در فوریه ۲۰۲۶ منعکسکننده اشتهای گسترده بازار برای فناوری صوتی هوش مصنوعی است. با ۷۸۱ میلیون دلار تامین مالی کل در پنج دور، ElevenLabs باند فرود را برای پیگیری هدف اعلام شده خود دارد: دسترسی به محتوا به هر زبانی، با هر صدایی.
منبع تصویر: Shutterstock- elevenlabs
- صدای ai
- متن به گفتار
- هوش مصنوعی چندزبانه
- سری d


