โพสต์ Character.ai เปิดเผยเทคนิคที่มีประสิทธิภาพสำหรับการเทรนขนาดใหญ่เบื้องต้น ปรากฏบน BitcoinEthereumNews.com. Tony Kim 23 ธ.ค. 2568 21:56 Character.aiโพสต์ Character.ai เปิดเผยเทคนิคที่มีประสิทธิภาพสำหรับการเทรนขนาดใหญ่เบื้องต้น ปรากฏบน BitcoinEthereumNews.com. Tony Kim 23 ธ.ค. 2568 21:56 Character.ai

Character.ai เปิดเผยเทคนิคที่มีประสิทธิภาพสำหรับการฝึกอบรมล่วงหน้าขนาดใหญ่

2025/12/24 14:41
1 นาทีในการอ่าน
หากมีข้อเสนอแนะหรือข้อกังวลเกี่ยวกับเนื้อหานี้ โปรดติดต่อเราได้ที่ crypto.news@mexc.com


Tony Kim
23 ธ.ค. 2568 21:56

Character.ai เปิดเผยวิธีการใหม่ในการเพิ่มประสิทธิภาพการฝึกอบรมขนาดใหญ่ โดยเน้นเทคนิคอย่าง Squinch, dynamic clamping และ Gumbel Softmax เพื่อเพิ่มประสิทธิภาพในการฝึกอบรมโมเดล AI

Character.ai ซึ่งเป็นผู้เล่นที่มีชื่อเสียงในพื้นที่ AI เพิ่งแบ่งปันข้อมูลเชิงลึกเกี่ยวกับความพยายามในช่วงแรกในการเพิ่มประสิทธิภาพการฝึกอบรม transformer ขนาดใหญ่ บริษัทซึ่งได้เปลี่ยนโฟกัสไปที่โมเดลโอเพนซอร์สในเวลาต่อมา เดิมได้สำรวจเทคนิคต่างๆ เพื่อเพิ่มประสิทธิภาพและความเร็วในการฝึกอบรม ตามที่ระบุไว้ใน Character.AI Blog

การบีบอัดแกรเดียนต์: Squinch

หนึ่งในนวัตกรรมหลักที่เน้นในความพยายามของ Character.ai คืออัลกอริทึมการบีบอัดแกรเดียนต์ที่เรียกว่า Squinch พัฒนาโดยผู้ร่วมก่อตั้ง Noam Shazeer เทคนิคการบีบอัด 6 บิตนี้ได้รับการออกแบบมาเพื่อลดแบนด์วิธการสื่อสารอย่างมากระหว่างการฝึกอบรมแบบกระจาย ในขณะเดียวกันก็รักษาความแม่นยำของโมเดล อัลกอริทึมบีบอัดแกรเดียนต์อย่างมีประสิทธิภาพเป็น 6 บิตต่อองค์ประกอบ เพิ่มประสิทธิภาพการใช้แบนด์วิธของคลัสเตอร์การฝึกอบรม

การปรับค่าความแม่นยำ: Attention Z-Reg

Character.ai ยังได้พัฒนา Attention Z-Reg ซึ่งเป็นวิธีการปรับค่าที่ใช้กับ attention logits เพื่อให้แน่ใจว่ามีเสถียรภาพเชิงตัวเลข เทคนิคนี้ช่วยรักษาความแม่นยำของการแสดง bfloat16 ซึ่งมีความสำคัญต่อการเพิ่มประสิทธิภาพการฝึกอบรมโมเดลขนาดใหญ่

เสถียรภาพการควอนไทซ์: Dynamic Clamping

Dynamic Clamping เป็นอีกหนึ่งเทคนิคที่ใช้เพื่อเพิ่มเสถียรภาพของการควอนไทซ์ มันป้องกันไม่ให้ค่าการกระตุ้นขนาดเล็กยุบลงเป็นศูนย์โดยการคำนวณช่วง clamping แบบไดนามิกตามค่ารากที่สองของค่าเฉลี่ยกำลังสองของน้ำหนักอินพุต วิธีนี้ปรับปรุงเสถียรภาพการฝึกอบรมโดยการลดข้อผิดพลาดในการควอนไทซ์

Attention API ที่มีประสิทธิภาพ: Visibility Mask

การแนะนำ Visibility Mask ซึ่งเป็นเครื่องมือสำหรับแสดงความสัมพันธ์ระหว่างโทเค็นระหว่างการฝึกอบรมและการอนุมาน ได้ปรับปรุงประสิทธิภาพของระบบการฝึกอบรม API นี้ช่วยจัดการช่วง attention ภายในแบตช์ รองรับความสัมพันธ์เอกสารแบบโครงสร้างต้นไม้และ bidirectional attention

การเพิ่มประสิทธิภาพการกลั่น: Gumbel Softmax

ในด้านการกลั่นโมเดล Character.ai ได้ใช้ประโยชน์จากเทคนิค Gumbel Softmax เพื่อลดต้นทุนการจัดเก็บและแบนด์วิธในขณะที่รักษาความถูกต้องของโมเดลครู แนวทางนี้เกี่ยวข้องกับการสุ่มตัวอย่างชุดย่อยของผลลัพธ์โมเดลครู โดยรักษาค่าเป้าหมายแบบนิ่มไว้เพื่อการฝึกอบรมโมเดลนักเรียนที่มีประสิทธิภาพมากขึ้น

ความพยายามของ Character.ai ในการเพิ่มประสิทธิภาพการฝึกอบรมล่วงหน้าได้ปูทางไปสู่การฝึกอบรมโมเดล AI ที่มีประสิทธิภาพมากขึ้น แม้ว่าบริษัทจะเปลี่ยนไปใช้การเรียนรู้เสริมแรงหลังการฝึกอบรมสำหรับโมเดลโอเพนซอร์ส เทคนิคเหล่านี้รวมถึง Squinch และ Gumbel Softmax เน้นย้ำถึงความมุ่งมั่นของบริษัทในการพัฒนาประสิทธิภาพและความสามารถในการขยายขนาดของ AI

แหล่งที่มาของภาพ: Shutterstock

แหล่งที่มา: https://blockchain.news/news/character-ai-unveils-efficient-techniques-for-large-scale-pretraining

ข้อจำกัดความรับผิดชอบ: บทความที่โพสต์ซ้ำในไซต์นี้มาจากแพลตฟอร์มสาธารณะและมีไว้เพื่อจุดประสงค์ในการให้ข้อมูลเท่านั้น ซึ่งไม่ได้สะท้อนถึงมุมมองของ MEXC แต่อย่างใด ลิขสิทธิ์ทั้งหมดยังคงเป็นของผู้เขียนดั้งเดิม หากคุณเชื่อว่าเนื้อหาใดละเมิดสิทธิของบุคคลที่สาม โปรดติดต่อ crypto.news@mexc.com เพื่อลบออก MEXC ไม่รับประกันความถูกต้อง ความสมบูรณ์ หรือความทันเวลาของเนื้อหาใดๆ และไม่รับผิดชอบต่อการดำเนินการใดๆ ที่เกิดขึ้นตามข้อมูลที่ให้มา เนื้อหานี้ไม่ถือเป็นคำแนะนำทางการเงิน กฎหมาย หรือคำแนะนำจากผู้เชี่ยวชาญอื่นๆ และไม่ถือว่าเป็นคำแนะนำหรือการรับรองจาก MEXC

คุณอาจชอบเช่นกัน

รีวิว Subaru Motors Finance 2026

รีวิว Subaru Motors Finance 2026

หากคุณอยู่ที่ศูนย์จำหน่าย Subaru และตั้งใจจะซื้อ Outback หรือ Forester ที่สมบูรณ์แบบ พนักงานขายถามว่า "คุณต้องการผ่อนชำระวันนี้ไหมครับ?" นั่นคือจุดที่
แชร์
Fintechzoom2026/03/08 10:55
วุฒิสมาชิกสหรัฐฯ เรียกร้องให้เพิ่มบทบัญญัติต่อต้านการทุจริตในร่างกฎหมายคริปโต

วุฒิสมาชิกสหรัฐฯ เรียกร้องให้เพิ่มบทบัญญัติต่อต้านการทุจริตในร่างกฎหมายคริปโต

วอชิงตัน ดี.ซี. — การตรวจสอบของสภาคองเกรสเกี่ยวกับการกำกับดูแลคริปโตรุนแรงขึ้นในสัปดาห์นี้ เนื่องจากวุฒิสมาชิกจากแมสซาชูเซตส์ Elizabeth Warren เพิ่มความรุนแรงในการวิพากษ์วิจารณ์สหรัฐฯ
แชร์
Crypto Breaking News2026/03/08 11:53
การคาดการณ์ราคา BlockchainFX มีความระมัดระวังในขณะที่ Pepeto ตั้งเป้าเพิ่มขึ้น 267 เท่าด้วยผลิตภัณฑ์แลกเปลี่ยนและระดมทุนได้ $7.4M

การคาดการณ์ราคา BlockchainFX มีความระมัดระวังในขณะที่ Pepeto ตั้งเป้าเพิ่มขึ้น 267 เท่าด้วยผลิตภัณฑ์แลกเปลี่ยนและระดมทุนได้ $7.4M

การคาดการณ์ราคา BlockchainFX ดูเหมือนจะค่อนข้างสมเหตุสมผล OCC อนุมัติใบอนุญาตธนาคารสำหรับ stablecoin Pepeto ตั้งเป้าเพิ่มมูลค่า 267 เท่า พร้อมระดมทุนได้ 7.4 ล้านดอลลาร์ และผลิตภัณฑ์แลกเปลี่ยนใกล้เปิดตัว
แชร์
Techbullion2026/03/08 12:05