MaGGIe โดดเด่นในการเรนเดอร์ผมและการแยกอินสแตนซ์บนภาพธรรมชาติ มีประสิทธิภาพเหนือกว่า MGM และ InstMatt ในสถานการณ์ที่ซับซ้อนและมีหลายอินสแตนซ์MaGGIe โดดเด่นในการเรนเดอร์ผมและการแยกอินสแตนซ์บนภาพธรรมชาติ มีประสิทธิภาพเหนือกว่า MGM และ InstMatt ในสถานการณ์ที่ซับซ้อนและมีหลายอินสแตนซ์

การแมตติ้งแบบใช้มาสก์นำทางที่แข็งแกร่ง: การจัดการกับข้อมูลนำเข้าที่มีสัญญาณรบกวนและความหลากหลายของวัตถุ

2025/12/21 02:00
1 นาทีในการอ่าน
หากมีข้อเสนอแนะหรือข้อกังวลเกี่ยวกับเนื้อหานี้ โปรดติดต่อเราได้ที่ crypto.news@mexc.com

บทคัดย่อและ 1. บทนำ

  1. งานวิจัยที่เกี่ยวข้อง

  2. MaGGIe

    3.1. Efficient Masked Guided Instance Matting

    3.2. Feature-Matte Temporal Consistency

  3. ชุดข้อมูล Instance Matting

    4.1. Image Instance Matting และ 4.2. Video Instance Matting

  4. การทดลอง

    5.1. การฝึกล่วงหน้าบนข้อมูลภาพ

    5.2. การฝึกบนข้อมูลวิดีโอ

  5. การอภิปรายและเอกสารอ้างอิง

\ เอกสารเพิ่มเติม

  1. รายละเอียดสถาปัตยกรรม

  2. Image matting

    8.1. การสร้างและเตรียมชุดข้อมูล

    8.2. รายละเอียดการฝึก

    8.3. รายละเอียดเชิงปริมาณ

    8.4. ผลลัพธ์เชิงคุณภาพเพิ่มเติมบนภาพธรรมชาติ

  3. Video matting

    9.1. การสร้างชุดข้อมูล

    9.2. รายละเอียดการฝึก

    9.3. รายละเอียดเชิงปริมาณ

    9.4. ผลลัพธ์เชิงคุณภาพเพิ่มเติม

8.4. ผลลัพธ์เชิงคุณภาพเพิ่มเติมบนภาพธรรมชาติ

รูปที่ 13 แสดงประสิทธิภาพของโมเดลของเราในสถานการณ์ที่ท้าทาย โดยเฉพาะในการแสดงผลบริเวณเส้นผมอย่างแม่นยำ เฟรมเวิร์กของเรามีประสิทธิภาพเหนือกว่า MGM⋆ อย่างสม่ำเสมอในการรักษารายละเอียด โดยเฉพาะในการโต้ตอบของ instance ที่ซับซ้อน เมื่อเปรียบเทียบกับ InstMatt โมเดลของเราแสดงความเหนือกว่าในการแยก instance และความแม่นยำของรายละเอียดในบริเวณที่คลุมเครือ

\ รูปที่ 14 และรูปที่ 15 แสดงประสิทธิภาพของโมเดลของเราและงานก่อนหน้าในกรณีสุดขีดที่เกี่ยวข้องกับหลาย instance ในขณะที่ MGM⋆ ประสบปัญหากับสัญญาณรบกวนและความแม่นยำในสถานการณ์ instance หนาแน่น โมเดลของเราคงความแม่นยำสูง InstMatt ที่ไม่มีข้อมูลการฝึกเพิ่มเติม แสดงข้อจำกัดในสถานการณ์ที่ซับซ้อนเหล่านี้

\ ความทนทานของแนวทางแบบ mask-guided ของเราได้รับการแสดงเพิ่มเติมในรูปที่ 16 ที่นี่เราเน้นถึงความท้าทายที่ตัวแปร MGM และ SparseMat เผชิญในการทำนายส่วนที่ขาดหายไปในอินพุต mask ซึ่งโมเดลของเราจัดการได้ อย่างไรก็ตาม สิ่งสำคัญคือต้องทราบว่าโมเดลของเราไม่ได้ออกแบบมาเป็นเครือข่ายการแบ่งส่วน instance ของมนุษย์ ดังที่แสดงในรูปที่ 17 เฟรมเวิร์กของเราปฏิบัติตามคำแนะนำอินพุต เพื่อให้แน่ใจว่าการทำนาย alpha matte แม่นยำแม้จะมีหลาย instance ใน mask เดียวกัน

\ ท้ายที่สุด รูปที่ 12 และรูปที่ 11 เน้นความสามารถในการทำงานทั่วไปของโมเดลของเรา โมเดลสกัดทั้งวัตถุมนุษย์และวัตถุอื่นๆ จากพื้นหลังได้อย่างแม่นยำ แสดงความหลากหลายในสถานการณ์และประเภทวัตถุต่างๆ

\ ตัวอย่างทั้งหมดเป็นภาพจากอินเทอร์เน็ตที่ไม่มีข้อมูลจริง และใช้ mask จาก r101fpn400e เป็นคำแนะนำ

\ รูปที่ 13. โมเดลของเราสร้าง alpha matte ที่มีรายละเอียดสูงบนภาพธรรมชาติ ผลลัพธ์ของเราแสดงให้เห็นว่ามีความแม่นยำและเทียบเคียงได้กับวิธีการแบบ instance-agnostic และ instance-awareness ก่อนหน้าโดยไม่มีต้นทุนการคำนวณที่สูง กรอบสีแดงขยายบริเวณรายละเอียดสำหรับแต่ละ instance (ดูดีที่สุดในสีและการซูมแบบดิจิทัล)

\ รูปที่ 14. เฟรมเวิร์กของเราแยก instance อย่างแม่นยำในกรณีสุดขีดที่มีหลาย instance ในขณะที่ MGM มักทำให้เกิดการทับซ้อนระหว่าง instance และ MGM⋆ มีสัญญาณรบกวน ของเราสร้างผลลัพธ์ที่เทียบเท่ากับ InstMatt ที่ฝึกบนชุดข้อมูลภายนอก ลูกศรสีแดงระบุข้อผิดพลาด (ดูดีที่สุดในสีและการซูมแบบดิจิทัล)

\ รูปที่ 15. เฟรมเวิร์กของเราแยก instance อย่างแม่นยำในการทำงานครั้งเดียว โซลูชันที่เสนอแสดงผลลัพธ์ที่เทียบเคียงได้กับ InstMatt และ MGM โดยไม่ต้องรันการทำนาย/การปรับแต่งห้าครั้ง ลูกศรสีแดงระบุข้อผิดพลาด (ดูดีที่สุดในสีและการซูมแบบดิจิทัล)

\ รูปที่ 16. ต่างจาก MGM และ SparseMat โมเดลของเรามีความทนทานต่อ mask คำแนะนำอินพุต ด้วย attention head โมเดลของเราสร้างผลลัพธ์ที่เสถียรมากขึ้นต่ออินพุต mask โดยไม่ต้องมีการปรับแต่งที่ซับซ้อนระหว่าง instance เช่น InstMatt ลูกศรสีแดงระบุข้อผิดพลาด (ดูดีที่สุดในสีและการซูมแบบดิจิทัล)

\ รูปที่ 17. โซลูชันของเราทำงานได้อย่างถูกต้องกับ mask คำแนะนำแบบหลาย instance เมื่อมีหลาย instance อยู่ใน mask คำแนะนำเดียว เรายังคงสร้าง union alpha matte ที่ถูกต้องสำหรับ instance เหล่านั้น ลูกศรสีแดงระบุข้อผิดพลาดหรือบริเวณการซูมในกรอบสีแดง (ดูดีที่สุดในสีและการซูมแบบดิจิทัล)

\ ตารางที่ 12. รายละเอียดของผลลัพธ์เชิงปริมาณบน HIM2K+M-HIM2K (ส่วนขยายของตารางที่ 5) สีเทาระบุค่าน้ำหนักสาธารณะโดยไม่มีการฝึกใหม่

\ ตารางที่ 12. รายละเอียดของผลลัพธ์เชิงปริมาณบน HIM2K+M-HIM2K (ส่วนขยายของตารางที่ 5) สีเทาระบุค่าน้ำหนักสาธารณะโดยไม่มีการฝึกใหม่ (ต่อ)

\ ตารางที่ 12. รายละเอียดของผลลัพธ์เชิงปริมาณบน HIM2K+M-HIM2K (ส่วนขยายของตารางที่ 5) สีเทาระบุค่าน้ำหนักสาธารณะโดยไม่มีการฝึกใหม่ (ต่อ)

\ ตารางที่ 12. รายละเอียดของผลลัพธ์เชิงปริมาณบน HIM2K+M-HIM2K (ส่วนขยายของตารางที่ 5) สีเทาระบุค่าน้ำหนักสาธารณะโดยไม่มีการฝึกใหม่ (ต่อ)

\ ตารางที่ 13. ประสิทธิผลของโมดูลความสม่ำเสมอชั่วคราวที่เสนอบน V-HIM60 (ส่วนขยายของตารางที่ 6) การรวมกันของ bi-directional Conv-GRU และ forward-backward fusion บรรลุประสิทธิภาพโดยรวมที่ดีที่สุดบนชุดทดสอบทั้งสาม ตัวหนาเน้นสิ่งที่ดีที่สุดสำหรับแต่ละระดับ

\

:::info ผู้แต่ง:

(1) Chuong Huynh, University of Maryland, College Park (chuonghm@cs.umd.edu);

(2) Seoung Wug Oh, Adobe Research (seoh,jolee@adobe.com);

(3) Abhinav Shrivastava, University of Maryland, College Park (abhinav@cs.umd.edu);

(4) Joon-Young Lee, Adobe Research (jolee@adobe.com).

:::


:::info บทความนี้ มีให้บน arxiv ภายใต้ใบอนุญาต CC by 4.0 Deed (Attribution 4.0 International)

:::

\

โอกาสทางการตลาด
Mask Network โลโก้
ราคา Mask Network(MASK)
$0.5266
$0.5266$0.5266
+5.48%
USD
Mask Network (MASK) กราฟราคาสด
ข้อจำกัดความรับผิดชอบ: บทความที่โพสต์ซ้ำในไซต์นี้มาจากแพลตฟอร์มสาธารณะและมีไว้เพื่อจุดประสงค์ในการให้ข้อมูลเท่านั้น ซึ่งไม่ได้สะท้อนถึงมุมมองของ MEXC แต่อย่างใด ลิขสิทธิ์ทั้งหมดยังคงเป็นของผู้เขียนดั้งเดิม หากคุณเชื่อว่าเนื้อหาใดละเมิดสิทธิของบุคคลที่สาม โปรดติดต่อ crypto.news@mexc.com เพื่อลบออก MEXC ไม่รับประกันความถูกต้อง ความสมบูรณ์ หรือความทันเวลาของเนื้อหาใดๆ และไม่รับผิดชอบต่อการดำเนินการใดๆ ที่เกิดขึ้นตามข้อมูลที่ให้มา เนื้อหานี้ไม่ถือเป็นคำแนะนำทางการเงิน กฎหมาย หรือคำแนะนำจากผู้เชี่ยวชาญอื่นๆ และไม่ถือว่าเป็นคำแนะนำหรือการรับรองจาก MEXC

คุณอาจชอบเช่นกัน

การคาดการณ์ราคาเงิน: XAG/USD ติดขัดที่ EMA 20 วัน ขณะที่เฟดส่งสัญญาณคงอัตราดอกเบี้ยยาวนานขึ้น

การคาดการณ์ราคาเงิน: XAG/USD ติดขัดที่ EMA 20 วัน ขณะที่เฟดส่งสัญญาณคงอัตราดอกเบี้ยยาวนานขึ้น

BitcoinWorld การคาดการณ์ราคาเงิน: XAG/USD ดิ้นรนที่ EMA 20 วัน ขณะที่เฟดส่งสัญญาณคงอัตราดอกเบี้ยต่อเนื่อง การคาดการณ์ราคาเงินสำหรับ XAG/USD เผยให้เห็นความตึงเครียด
แชร์
bitcoinworld2026/05/01 15:35
Lightspark และ Visa เปิดตัวบัตรเดบิตคริปโตทั่วโลก

Lightspark และ Visa เปิดตัวบัตรเดบิตคริปโตทั่วโลก

Lightspark ได้ร่วมมือกับ Visa เพื่อเปิดตัวบัตรเดบิตที่รองรับ stablecoin และ Bitcoin ในกว่า 100 ประเทศ โครงการนี้ได้รับการออกแบบมาเพื่อขยายการใช้งานจริง
แชร์
CoinTrust2026/05/01 14:15
การคาดการณ์ราคา US Dollar Index (DXY): ดีดตัวจากระดับ Fibo. 50% ท่ามกลางความตึงเครียดอิหร่านที่พุ่งสูงและ Fed แนวเหยี่ยว – กำลังจะเกิด Bullish Breakout หรือไม่?

การคาดการณ์ราคา US Dollar Index (DXY): ดีดตัวจากระดับ Fibo. 50% ท่ามกลางความตึงเครียดอิหร่านที่พุ่งสูงและ Fed แนวเหยี่ยว – กำลังจะเกิด Bullish Breakout หรือไม่?

BitcoinWorld ดัชนีดอลลาร์สหรัฐ (DXY) การคาดการณ์ราคา: เด้งกลับจากระดับ Fibo. 50% ท่ามกลางความตึงเครียดอิหร่านที่พุ่งสูงและ Fed แนวเหยี่ยว – กำลังจะเกิด Bullish Breakout หรือไม่? ดัชนีดอลลาร์สหรัฐ
แชร์
bitcoinworld2026/05/01 15:40

ข่าวสดตลอด 24/7

มากกว่า