Together AI ผสานโมเดลเสียง Rime เพื่อปรับปรุงโซลูชัน TTS

Darius Baruo
19 ธ.ค. 2568 02:12

Together AI ประกาศการผสานรวมโมเดล Rime Arcana v2 และ Mist v2 เพื่อปรับปรุงความสามารถด้านการแปลงข้อความเป็นเสียงพูด โดยนำเสนอการแสดงออกที่เพิ่มขึ้นและการควบคุมการออกเสียงสำหรับแอปพลิเคชันระดับองค์กร

Together AI ได้นำเสนอโมเดลการแปลงข้อความเป็นเสียงพูด (TTS) ขั้นสูงของ Rime สองรุ่น ได้แก่ Arcana v2 และ Mist v2 เข้าสู่แพลตฟอร์มของตน ซึ่งช่วยเพิ่มประสิทธิภาพการให้บริการ AI Native Cloud โมเดลเหล่านี้ตามที่ Together AI รายงาน มุ่งเป้าไปที่การให้โซลูชันเสียงระดับองค์กรที่มีการแสดงออกและความแม่นยำในการออกเสียงที่ดีขึ้น

ความก้าวหน้าในเทคโนโลยี TTS

Arcana v2 และ Mist v2 ได้รับการออกแบบให้ผสานรวมได้อย่างราบรื่นกับโมเดลภาษาขนาดใหญ่ (LLM) และระบบการแปลงเสียงพูดเป็นข้อความ (STT) ที่มีอยู่ ช่วยให้ผู้ใช้สามารถจัดการโครงสร้างพื้นฐานด้านเทคโนโลยีเสียงได้อย่างมีประสิทธิภาพมากขึ้น โมเดลเหล่านี้ถูกโฮสต์บนโครงสร้างพื้นฐานคลาวด์เฉพาะของ Together AI เพื่อให้มั่นใจถึงความหน่วงต่ำและความน่าเชื่อถือสูงที่จำเป็นสำหรับแอปพลิเคชันระดับองค์กร

Arcana v2: การแสดงออกในการสนทนาที่เพิ่มขึ้น

Arcana v2 ได้รับการปรับแต่งสำหรับการแสดงออก โดยนำเสนอเสียงมากกว่า 40 เสียงในหลายภาษาและสำเนียง เพื่อรองรับสถานการณ์การบริการลูกค้าที่หลากหลาย มีประสิทธิภาพเป็นพิเศษในสภาพแวดล้อมที่ต้องการความสามารถในการสนทนาที่ละเอียดอ่อน เช่น การขายและการสนับสนุน ซึ่งแสดงให้เห็นถึงการปรับปรุงตัวชี้วัดต่างๆ เช่น อัตราการแปลงยอดขายและอัตราความสำเร็จของการโทร

Mist v2: ความแม่นยำในการออกเสียง

Mist v2 เน้นที่การออกเสียงที่แน่นอน ซึ่งจำเป็นสำหรับแอปพลิเคชันที่มีปริมาณการใช้งานสูงที่ความสม่ำเสมอมีความสำคัญอย่างยิ่ง โมเดลนี้ช่วยให้ผู้ใช้สามารถกำหนดการออกเสียงได้ครั้งเดียว เพื่อให้มั่นใจถึงความสม่ำเสมอในเสียงและแพลตฟอร์มต่างๆ ความแม่นยำดังกล่าวมีความสำคัญอย่างยิ่งในภาคส่วนต่างๆ เช่น การดูแลสุขภาพและการเงิน ซึ่งการสื่อสารที่ถูกต้องมีความสำคัญอย่างยิ่ง

ผลกระทบต่อแอปพลิเคชันระดับองค์กร

โมเดลทั้งสองได้รับการนำไปใช้แล้วในอุตสาหกรรมต่างๆ ตั้งแต่บริษัทใน Fortune 500 ไปจนถึงสตาร์ทอัพ ความสามารถของ Arcana v2 ในการเพิ่มประสิทธิภาพการโต้ตอบในการสนทนาได้นำไปสู่การปรับปรุงที่สำคัญในการมีส่วนร่วมของลูกค้า ในขณะเดียวกัน ความน่าเชื่อถือของ Mist v2 ในการควบคุมการออกเสียงรองรับสภาพแวดล้อมที่มีความสำคัญสูง เช่น การบริการลูกค้าและระบบตอบสนองด้วยเสียง (IVR)

โครงสร้างพื้นฐานและการปฏิบัติตามข้อกำหนด

Together AI ให้บริการโครงสร้างพื้นฐานที่แข็งแกร่งรองรับโมเดลเหล่านี้ พร้อมทรัพยากร GPU เฉพาะและการปฏิบัติตามมาตรฐาน SOC 2 Type II และ HIPAA การตั้งค่านี้ช่วยให้มั่นใจว่าองค์กรสามารถใช้งานโซลูชันเสียงที่ตอบสนองข้อกำหนดด้านกฎระเบียบที่เข้มงวดในขณะที่รักษาประสิทธิภาพสูงและเวลาการทำงานที่ดี

แนวโน้มในอนาคต

ด้วยการผสานรวมโมเดลเหล่านี้ Together AI ยังคงพัฒนาแพลตฟอร์มของตนต่อไป โดยนำเสนอชุดโซลูชันเสียงที่ครอบคลุมซึ่งตอบสนองความต้องการที่หลากหลายขององค์กร การพัฒนานี้ถือเป็นก้าวสำคัญไปข้างหน้าในวิวัฒนาการของเทคโนโลยีเสียงที่ขับเคลื่อนด้วย AI โดยสัญญาว่าจะมีการโต้ตอบที่เป็นธรรมชาติและมีประสิทธิภาพมากขึ้นในระบบอัตโนมัติ

ที่มาของภาพ: Shutterstock

ที่มา: https://blockchain.news/news/together-ai-integrates-rime-voice-models-enhanced-tts-solutions