ElevenLabs از مرحله بتا خارج می‌شود با مدل صوتی هوش مصنوعی ۲۸ زبانه پس از ارزش‌گذاری ۱۱ میلیارد دلاری

Darius Baruo ۱۴۰۵/۱۲/۱۵ ۱۲:۲۷

ElevenLabs نسخه Eleven Multilingual v2 را با پشتیبانی از ۲۸ زبان راه‌اندازی کرد و به طور رسمی هفته‌ها پس از تامین ۵۰۰ میلیون دلار سری D با ارزش‌گذاری ۱۱ میلیارد دلاری از مرحله بتا خارج شد.

ElevenLabs از مرحله بتا خارج می‌شود با مدل صوتی هوش مصنوعی ۲۸ زبانه پس از ارزش‌گذاری ۱۱ میلیارد دلاری

ElevenLabs به طور رسمی از مرحله بتا خارج شده و Eleven Multilingual v2، یک مدل گفتار هوش مصنوعی بنیادی با پشتیبانی از ۲۸ زبان را راه‌اندازی کرده است. این انتشار تنها چند هفته پس از اینکه شرکت دور تامین مالی سری D به ارزش ۵۰۰ میلیون دلار را با ارزش‌گذاری ۱۱ میلیارد دلاری به پایان رساند، صورت گرفت.

مدل جدید به طور خودکار متن نوشته شده را در نزدیک به ۳۰ زبان شناسایی می‌کند و آنچه شرکت آن را گفتار "غنی از احساسات" توصیف می‌کند، تولید می‌کند. مهم‌تر از آن برای تولیدکنندگان محتوا، ویژگی‌های صوتی - از جمله لهجه‌های اصلی - در تمام زبان‌های پشتیبانی شده ثابت می‌مانند. یک صدای شبیه‌سازی شده می‌تواند اکنون محتوا را به زبان‌های چینی، ژاپنی، عربی، کره‌ای و ۲۴ زبان دیگر بدون از دست دادن ویژگی‌های متمایز خود تولید کند.

۱۸ ماه تحقیق نتیجه داد

ElevenLabs یک سال و نیم را صرف ساختن مکانیسم‌های جدید برای درک متن و انتقال احساسات در گفتار سنتز شده کرد. این زمان‌بندی تصادفی نیست. با ۳۳۰ میلیون دلار درآمد تکرارشونده سالانه گزارش شده برای سال ۲۰۲۵ و بیش از ۱ میلیون کاربر در پلتفرم، شرکت به زیرساختی نیاز داشت که بتواند در سطح جهانی مقیاس‌پذیر باشد.

این مقیاس‌پذیری ماه گذشته هنگامی که ElevenLabs مشارکت خود با Google Cloud را گسترش داد و دسترسی به GPU های NVIDIA Blackwell را برای مدیریت تقاضای افزایش یافته به دست آورد، تقویت شد.

فهرست زبان‌ها اکنون شامل چینی، کره‌ای، ژاپنی، ترکی، اندونزیایی، فیلیپینی، اوکراینی، یونانی، چکی، فنلاندی، رومانیایی، دانمارکی، بلغاری، مالایی، اسلواکی، کرواتی، عربی کلاسیک و تامیل است. این زبان‌ها به هشت زبان اصلی می‌پیوندند: انگلیسی، لهستانی، آلمانی، اسپانیایی، فرانسوی، ایتالیایی، هندی و پرتغالی.

چه کسانی بیشترین بهره را می‌برند

توسعه‌دهندگان و ناشران بازی به طور قابل توجهی سود خواهند برد. استودیوهای مستقل اکنون می‌توانند محتوای صوتی را برای مخاطبان بین‌المللی بومی‌سازی کنند بدون اینکه بازیگران صداپیشه برای هر بازار استخدام کنند. Embark Studios و Paradox Interactive در حال حاضر از این پلتفرم استفاده می‌کنند.

مؤسسات آموزشی تولید فوری محتوای صوتی را به زبان‌های هدف دریافت می‌کنند - که برای برنامه‌های یادگیری زبان و پذیرش دانشجویان بین‌المللی مفید است. ناشران کتاب صوتی مانند Storytel که قبلاً شریک ElevenLabs هستند، می‌توانند کاتالوگ‌های خود را سریع‌تر به بازارهای جدید گسترش دهند.

جنبه دسترسی‌پذیری نیز اهمیت دارد. محتوای بصری اکنون می‌تواند با گفتار چندزبانه برای کاربران دارای اختلالات بینایی تکمیل شود، بدون هزینه ضبط مسیرهای صوتی جداگانه برای هر زبان.

مرحله بعدی چیست

ElevenLabs قصد دارد مکانیزم اشتراک‌گذاری صوتی را معرفی کند که به کاربران اجازه می‌دهد از صداهای شبیه‌سازی شده خود زمانی که دیگران از آن‌ها برای تولید محتوا استفاده می‌کنند، درآمدزایی کنند. مدیرعامل Mati Staniszewski آن را به عنوان "همکاری انسان-AI Agent" چارچوب‌بندی کرد - اگرچه جزئیات تقسیم درآمد هنوز مشخص نیست.

مسیر شرکت از ارزش‌گذاری ۱۰۰ میلیون دلاری در ژوئن ۲۰۲۳ تا ۱۱ میلیارد دلار در فوریه ۲۰۲۶ منعکس‌کننده اشتهای گسترده بازار برای فناوری صوتی هوش مصنوعی است. با ۷۸۱ میلیون دلار تامین مالی کل در پنج دور، ElevenLabs باند فرود را برای پیگیری هدف اعلام شده خود دارد: دسترسی به محتوا به هر زبانی، با هر صدایی.

منبع تصویر: Shutterstock