مطلب Character.ai تکنیک‌های کارآمد برای پیش‌آموزش در مقیاس بزرگ را رونمایی می‌کند در BitcoinEthereumNews.com منتشر شد. تونی کیم 1404/10/02 21:56 Character.aiمطلب Character.ai تکنیک‌های کارآمد برای پیش‌آموزش در مقیاس بزرگ را رونمایی می‌کند در BitcoinEthereumNews.com منتشر شد. تونی کیم 1404/10/02 21:56 Character.ai

Character.ai تکنیک‌های کارآمد برای پیش‌آموزش در مقیاس بزرگ را رونمایی می‌کند

2025/12/24 14:41
مدت مطالعه: 3 دقیقه
برای ارائه بازخورد یا طرح هرگونه نگرانی درباره این محتوا، لطفاً با ما از طریق crypto.news@mexc.com تماس بگیرید.


Tony Kim
1404/10/02 21:56

Character.ai روش‌های نوآورانه برای بهینه‌سازی پیش‌آموزش در مقیاس بزرگ را آشکار می‌کند و بر تکنیک‌هایی مانند Squinch، محدودسازی پویا و Gumbel Softmax تمرکز دارد تا کارایی در آموزش مدل‌های مبتنی بر هوش مصنوعی را افزایش دهد.

Character.ai، یک بازیگر برجسته در فضای هوش مصنوعی، اخیراً بینش‌هایی را در مورد تلاش‌های اولیه خود برای بهینه‌سازی آموزش ترانسفورمر در مقیاس بزرگ به اشتراک گذاشته است. این شرکت که از آن زمان تمرکز خود را به پایه‌های مدل متن‌باز تغییر داده است، در ابتدا تکنیک‌های مختلفی را برای افزایش کارایی و سرعت آموزش بررسی کرد، بر اساس وبلاگ Character.AI.

فشرده‌سازی گرادیان: Squinch

یکی از نوآوری‌های کلیدی که در تلاش‌های Character.ai برجسته شده است، الگوریتم فشرده‌سازی گرادیان به نام Squinch است. این تکنیک فشرده‌سازی 6 بیتی که توسط Noam Shazeer، بنیان‌گذار مشترک توسعه یافته است، برای کاهش قابل توجه پهنای باند ارتباطی در طول آموزش توزیع شده طراحی شده است، در حالی که دقت مدل را حفظ می‌کند. این الگوریتم به طور مؤثر گرادیان‌ها را به 6 بیت در هر عنصر فشرده می‌کند و استفاده از پهنای باند خوشه‌های آموزشی را بهینه می‌کند.

منظم‌سازی دقت: Attention Z-Reg

Character.ai همچنین Attention Z-Reg را توسعه داده است، یک روش منظم‌سازی که بر روی لاجیت‌های توجه اعمال می‌شود تا ثبات عددی را تضمین کند. این تکنیک به حفظ دقت نمایش‌های bfloat16 کمک می‌کند که برای بهینه‌سازی آموزش مدل‌های بزرگ حیاتی است.

ثبات کوانتیزاسیون: محدودسازی پویا

محدودسازی پویا تکنیک دیگری است که برای افزایش ثبات کوانتیزاسیون به کار گرفته می‌شود. این روش با محاسبه پویای محدوده محدودسازی بر اساس میانگین مربع ریشه وزن‌های ورودی، از فروپاشی مقادیر فعال‌سازی کوچک به صفر جلوگیری می‌کند. این روش با کاهش خطاهای کوانتیزاسیون، ثبات آموزش را بهبود می‌بخشد.

API توجه کارآمد: Visibility Mask

معرفی Visibility Mask، ابزاری برای نمایش روابط بین توکن‌ها در طول آموزش و استنتاج، کارایی سیستم‌های آموزشی را بهبود بخشیده است. این API به مدیریت محدوده‌های توجه در دسته‌ها کمک می‌کند و از روابط اسناد ساختار درختی و توجه دوطرفه پشتیبانی می‌کند.

بهینه‌سازی تقطیر: Gumbel Softmax

در قلمرو تقطیر مدل، Character.ai از تکنیک Gumbel Softmax برای کاهش هزینه‌های ذخیره‌سازی و پهنای باند استفاده کرده است، در حالی که وفاداری مدل‌های معلم را حفظ می‌کند. این رویکرد شامل نمونه‌برداری از زیرمجموعه‌های خروجی‌های مدل معلم است و مقادیر هدف نرم را برای آموزش کارآمدتر مدل دانش‌آموز حفظ می‌کند.

تلاش‌های Character.ai در بهینه‌سازی پیش‌آموزش راه را برای آموزش کارآمدتر مدل‌های هوش مصنوعی هموار کرده است، حتی زمانی که شرکت به سمت یادگیری تقویتی پس از آموزش برای مدل‌های متن‌باز حرکت می‌کند. این تکنیک‌ها، از جمله Squinch و Gumbel Softmax، تعهد شرکت را به پیشبرد کارایی و مقیاس‌پذیری هوش مصنوعی نشان می‌دهد.

منبع تصویر: Shutterstock

منبع: https://blockchain.news/news/character-ai-unveils-efficient-techniques-for-large-scale-pretraining

فرصت‌ های بازار
لوگو null
null قیمت لحظه ای(null)
--
----
USD
نمودار قیمت لحظه ای null (null)
سلب مسئولیت: مطالب بازنشرشده در این وب‌ سایت از منابع عمومی گردآوری شده‌ اند و صرفاً به‌ منظور اطلاع‌ رسانی ارائه می‌ شوند. این مطالب لزوماً بازتاب‌ دهنده دیدگاه‌ ها یا مواضع MEXC نیستند. کلیه حقوق مادی و معنوی آثار متعلق به نویسندگان اصلی است. در صورت مشاهده هرگونه محتوای ناقض حقوق اشخاص ثالث، لطفاً از طریق آدرس ایمیل crypto.news@mexc.com با ما تماس بگیرید تا مورد بررسی و حذف قرار گیرد.MEXC هیچ‌ گونه تضمینی نسبت به دقت، جامعیت یا به‌ روزبودن اطلاعات ارائه‌ شده ندارد و مسئولیتی در قبال هرگونه اقدام یا تصمیم‌ گیری مبتنی بر این اطلاعات نمی‌ پذیرد. همچنین، محتوای منتشرشده نباید به‌عنوان توصیه مالی، حقوقی یا حرفه‌ ای تلقی شود و به منزله پیشنهاد یا تأیید رسمی از سوی MEXC نیست.

محتوای پیشنهادی

پیش‌بینی قیمت دوج‌کوین: DOGE هدف شکست فراکتال 1.60 دلاری را دنبال می‌کند در حالی که Revolut برای دریافت مجوز بانکی آمریکا تلاش می‌کند اما Pepeto قرار است از همه آن‌ها بهتر عمل کند

پیش‌بینی قیمت دوج‌کوین: DOGE هدف شکست فراکتال 1.60 دلاری را دنبال می‌کند در حالی که Revolut برای دریافت مجوز بانکی آمریکا تلاش می‌کند اما Pepeto قرار است از همه آن‌ها بهتر عمل کند

Revolut درخواست خود را برای دریافت مجوز بانک ملی ایالات متحده از طریق OCC و FDIC ارسال کرد و Cetin Duransoy، پیشکسوت فین‌تک را به عنوان مدیرعامل ایالات متحده منصوب نمود و زمانی که
اشتراک
Captainaltcoin2026/03/07 23:00
جفری ویلکه، بنیان‌گذار اتریوم، مظنون به فروش نزدیک به 80,000 ETH به ارزش 157 میلیون دلار است.

جفری ویلکه، بنیان‌گذار اتریوم، مظنون به فروش نزدیک به 80,000 ETH به ارزش 157 میلیون دلار است.

PANews در تاریخ 1404/01/16 گزارش داد که، بر اساس تحلیلگر زنجیره‌ای Ai Yi، Jeffrey Wilcke، یکی از بنیان‌گذاران ETH مظنون به فروش 79,258.61 ETH به ارزش 157 میلیون دلار است. Its
اشتراک
PANews2026/03/07 23:39
پیش‌بینی قیمت XRP: ریپل حمایت را در میان ریسک‌های نزولی آزمایش می‌کند

پیش‌بینی قیمت XRP: ریپل حمایت را در میان ریسک‌های نزولی آزمایش می‌کند

نکات کلیدی: قیمت XRP در یک ناحیه حمایت شکننده معامله می‌شود. با این وجود، تحلیلگران بر این موضوع تمرکز دارند که آیا بازار می‌تواند بالای ۱.۲۸ دلار باقی بماند. نمودارهای اخیر نشان می‌دهند
اشتراک
Themarketperiodical2026/03/07 23:33