โพสต์ Character.ai เปิดเผยเทคนิคที่มีประสิทธิภาพสำหรับการเทรนขนาดใหญ่เบื้องต้น ปรากฏบน BitcoinEthereumNews.com. Tony Kim 23 ธ.ค. 2568 21:56 Character.aiโพสต์ Character.ai เปิดเผยเทคนิคที่มีประสิทธิภาพสำหรับการเทรนขนาดใหญ่เบื้องต้น ปรากฏบน BitcoinEthereumNews.com. Tony Kim 23 ธ.ค. 2568 21:56 Character.ai

Character.ai เปิดเผยเทคนิคที่มีประสิทธิภาพสำหรับการฝึกอบรมล่วงหน้าขนาดใหญ่

2025/12/24 14:41
1 นาทีในการอ่าน
หากมีข้อเสนอแนะหรือข้อกังวลเกี่ยวกับเนื้อหานี้ โปรดติดต่อเราได้ที่ crypto.news@mexc.com


Tony Kim
23 ธ.ค. 2568 21:56

Character.ai เปิดเผยวิธีการใหม่ในการเพิ่มประสิทธิภาพการฝึกอบรมขนาดใหญ่ โดยเน้นเทคนิคอย่าง Squinch, dynamic clamping และ Gumbel Softmax เพื่อเพิ่มประสิทธิภาพในการฝึกอบรมโมเดล AI

Character.ai ซึ่งเป็นผู้เล่นที่มีชื่อเสียงในพื้นที่ AI เพิ่งแบ่งปันข้อมูลเชิงลึกเกี่ยวกับความพยายามในช่วงแรกในการเพิ่มประสิทธิภาพการฝึกอบรม transformer ขนาดใหญ่ บริษัทซึ่งได้เปลี่ยนโฟกัสไปที่โมเดลโอเพนซอร์สในเวลาต่อมา เดิมได้สำรวจเทคนิคต่างๆ เพื่อเพิ่มประสิทธิภาพและความเร็วในการฝึกอบรม ตามที่ระบุไว้ใน Character.AI Blog

การบีบอัดแกรเดียนต์: Squinch

หนึ่งในนวัตกรรมหลักที่เน้นในความพยายามของ Character.ai คืออัลกอริทึมการบีบอัดแกรเดียนต์ที่เรียกว่า Squinch พัฒนาโดยผู้ร่วมก่อตั้ง Noam Shazeer เทคนิคการบีบอัด 6 บิตนี้ได้รับการออกแบบมาเพื่อลดแบนด์วิธการสื่อสารอย่างมากระหว่างการฝึกอบรมแบบกระจาย ในขณะเดียวกันก็รักษาความแม่นยำของโมเดล อัลกอริทึมบีบอัดแกรเดียนต์อย่างมีประสิทธิภาพเป็น 6 บิตต่อองค์ประกอบ เพิ่มประสิทธิภาพการใช้แบนด์วิธของคลัสเตอร์การฝึกอบรม

การปรับค่าความแม่นยำ: Attention Z-Reg

Character.ai ยังได้พัฒนา Attention Z-Reg ซึ่งเป็นวิธีการปรับค่าที่ใช้กับ attention logits เพื่อให้แน่ใจว่ามีเสถียรภาพเชิงตัวเลข เทคนิคนี้ช่วยรักษาความแม่นยำของการแสดง bfloat16 ซึ่งมีความสำคัญต่อการเพิ่มประสิทธิภาพการฝึกอบรมโมเดลขนาดใหญ่

เสถียรภาพการควอนไทซ์: Dynamic Clamping

Dynamic Clamping เป็นอีกหนึ่งเทคนิคที่ใช้เพื่อเพิ่มเสถียรภาพของการควอนไทซ์ มันป้องกันไม่ให้ค่าการกระตุ้นขนาดเล็กยุบลงเป็นศูนย์โดยการคำนวณช่วง clamping แบบไดนามิกตามค่ารากที่สองของค่าเฉลี่ยกำลังสองของน้ำหนักอินพุต วิธีนี้ปรับปรุงเสถียรภาพการฝึกอบรมโดยการลดข้อผิดพลาดในการควอนไทซ์

Attention API ที่มีประสิทธิภาพ: Visibility Mask

การแนะนำ Visibility Mask ซึ่งเป็นเครื่องมือสำหรับแสดงความสัมพันธ์ระหว่างโทเค็นระหว่างการฝึกอบรมและการอนุมาน ได้ปรับปรุงประสิทธิภาพของระบบการฝึกอบรม API นี้ช่วยจัดการช่วง attention ภายในแบตช์ รองรับความสัมพันธ์เอกสารแบบโครงสร้างต้นไม้และ bidirectional attention

การเพิ่มประสิทธิภาพการกลั่น: Gumbel Softmax

ในด้านการกลั่นโมเดล Character.ai ได้ใช้ประโยชน์จากเทคนิค Gumbel Softmax เพื่อลดต้นทุนการจัดเก็บและแบนด์วิธในขณะที่รักษาความถูกต้องของโมเดลครู แนวทางนี้เกี่ยวข้องกับการสุ่มตัวอย่างชุดย่อยของผลลัพธ์โมเดลครู โดยรักษาค่าเป้าหมายแบบนิ่มไว้เพื่อการฝึกอบรมโมเดลนักเรียนที่มีประสิทธิภาพมากขึ้น

ความพยายามของ Character.ai ในการเพิ่มประสิทธิภาพการฝึกอบรมล่วงหน้าได้ปูทางไปสู่การฝึกอบรมโมเดล AI ที่มีประสิทธิภาพมากขึ้น แม้ว่าบริษัทจะเปลี่ยนไปใช้การเรียนรู้เสริมแรงหลังการฝึกอบรมสำหรับโมเดลโอเพนซอร์ส เทคนิคเหล่านี้รวมถึง Squinch และ Gumbel Softmax เน้นย้ำถึงความมุ่งมั่นของบริษัทในการพัฒนาประสิทธิภาพและความสามารถในการขยายขนาดของ AI

แหล่งที่มาของภาพ: Shutterstock

แหล่งที่มา: https://blockchain.news/news/character-ai-unveils-efficient-techniques-for-large-scale-pretraining

โอกาสทางการตลาด
Sleepless AI โลโก้
ราคา Sleepless AI(SLEEPLESSAI)
$0.02843
$0.02843$0.02843
+3.41%
USD
Sleepless AI (SLEEPLESSAI) กราฟราคาสด
ข้อจำกัดความรับผิดชอบ: บทความที่โพสต์ซ้ำในไซต์นี้มาจากแพลตฟอร์มสาธารณะและมีไว้เพื่อจุดประสงค์ในการให้ข้อมูลเท่านั้น ซึ่งไม่ได้สะท้อนถึงมุมมองของ MEXC แต่อย่างใด ลิขสิทธิ์ทั้งหมดยังคงเป็นของผู้เขียนดั้งเดิม หากคุณเชื่อว่าเนื้อหาใดละเมิดสิทธิของบุคคลที่สาม โปรดติดต่อ crypto.news@mexc.com เพื่อลบออก MEXC ไม่รับประกันความถูกต้อง ความสมบูรณ์ หรือความทันเวลาของเนื้อหาใดๆ และไม่รับผิดชอบต่อการดำเนินการใดๆ ที่เกิดขึ้นตามข้อมูลที่ให้มา เนื้อหานี้ไม่ถือเป็นคำแนะนำทางการเงิน กฎหมาย หรือคำแนะนำจากผู้เชี่ยวชาญอื่นๆ และไม่ถือว่าเป็นคำแนะนำหรือการรับรองจาก MEXC

คุณอาจชอบเช่นกัน

ครอบครัวทรัมป์ซื้อหุ้น Coinbase และ Strategy ท่ามกลางความสูญเสียในตลาดคริปโต

ครอบครัวทรัมป์ซื้อหุ้น Coinbase และ Strategy ท่ามกลางความสูญเสียในตลาดคริปโต

โดนัลด์ ทรัมป์และครอบครัวได้ขยายการลงทุนในหุ้นที่เชื่อมโยงกับคริปโตในช่วงไตรมาสแรกของปี 2026 โดยเพิ่มสถานะใน Coinbase และ MARA Holdings
แชร์
Crypto.news2026/05/15 15:10
Signal เตือนอาจถอนตัวออกจากแคนาดาหากร่างกฎหมายการเข้าถึงข้อมูลโดยชอบด้วยกฎหมายผ่าน

Signal เตือนอาจถอนตัวออกจากแคนาดาหากร่างกฎหมายการเข้าถึงข้อมูลโดยชอบด้วยกฎหมายผ่าน

โพสต์ Signal เตือนอาจถอนตัวออกจากแคนาดาหากร่างกฎหมายการเข้าถึงข้อมูลโดยชอบด้วยกฎหมายผ่าน ปรากฏบน BitcoinEthereumNews.com Signal ได้เตือนว่าอาจถอนตัวออกจากแคนาดาหากประเทศ
แชร์
BitcoinEthereumNews2026/05/15 15:33
กฎระเบียบตลาดสินทรัพย์ดิจิทัลของวุฒิสภาสหรัฐฯ ใกล้ถึงเส้นชัยแล้ว

กฎระเบียบตลาดสินทรัพย์ดิจิทัลของวุฒิสภาสหรัฐฯ ใกล้ถึงเส้นชัยแล้ว

โพสต์ กฎระเบียบตลาดสินทรัพย์ดิจิทัลของวุฒิสภาสหรัฐฯ ใกล้ถึงเส้นชัยแล้ว ปรากฏบน BitcoinEthereumNews.com หน้าแรก > ข่าว > ธุรกิจ > สินทรัพย์ดิจิทัลของวุฒิสภาสหรัฐฯ
แชร์
BitcoinEthereumNews2026/05/15 15:07

ข่าวสดตลอด 24/7

มากกว่า

เปิดตัว KAIO ระดับโลก

เปิดตัว KAIO ระดับโลกเปิดตัว KAIO ระดับโลก

เทรด KAIO ค่าธรรมเนียม 0 และเกาะกระแส RWA ที่มาแรง