เมื่อพูดถึงการสร้างแบบจำลอง uplift เมตริกซ์ประสิทธิภาพแบบดั้งเดิมที่ใช้กันทั่วไปสำหรับงาน machine learning อื่นๆ อาจไม่เพียงพอเมื่อพูดถึงการสร้างแบบจำลอง uplift เมตริกซ์ประสิทธิภาพแบบดั้งเดิมที่ใช้กันทั่วไปสำหรับงาน machine learning อื่นๆ อาจไม่เพียงพอ

ทำไม "ความแม่นยำ" ไม่เหมาะกับโมเดล Uplift (และควรใช้อะไรแทน)

2026/01/11 04:00
1 นาทีในการอ่าน
หากมีข้อเสนอแนะหรือข้อกังวลเกี่ยวกับเนื้อหานี้ โปรดติดต่อเราได้ที่ crypto.news@mexc.com

เมื่อพูดถึง uplift modeling เมตริกประสิทธิภาพแบบดั้งเดิมที่ใช้กันทั่วไปสำหรับงาน machine learning อื่นๆ อาจไม่เพียงพอ

อัลกอริทึม machine learning มาตรฐาน / กรณีศึกษาทางธุรกิจ จะเรียนรู้จากข้อมูลการฝึกอบรม ทำนายเป้าหมายจากข้อมูลทดสอบ และเปรียบเทียบกับข้อเท็จจริงพื้นฐาน

อย่างไรก็ตาม ใน uplift modeling แนวคิดของข้อเท็จจริงพื้นฐานกลายเป็นสิ่งที่เข้าใจยาก เนื่องจากเราไม่สามารถสังเกตผลกระทบของการได้รับการปฏิบัติและไม่ได้รับการปฏิบัติต่อบุคคลเดียวกันในเวลาเดียวกัน

จะเลือกชุดข้อมูลการตรวจสอบความถูกต้องได้อย่างไร?

การเลือกข้อมูลสำหรับการฝึกอบรมและทดสอบโมเดล uplift ขึ้นอยู่กับข้อมูลที่มีอยู่และบริบทเฉพาะ

โมเดล uplift มักใช้สำหรับแคมเปญการตลาด มาดูตัวอย่างว่าข้อมูลการตรวจสอบความถูกต้องถูกเลือกจากมุมมองนี้อย่างไร

หากเรามีแคมเปญเดียว เราสามารถแบ่งลูกค้าภายในแคมเปญนั้นออกเป็นชุดการฝึกอบรมและชุดการตรวจสอบความถูกต้อง

อย่างไรก็ตาม หากมีหลายแคมเปญที่พร้อมใช้งาน เราสามารถใช้แคมเปญบางส่วนสำหรับการฝึกอบรมโมเดล และสำรองแคมเปญอื่นๆ สำหรับการตรวจสอบความถูกต้อง กลยุทธ์นี้ช่วยให้โมเดลเรียนรู้จากสถานการณ์ที่หลากหลายมากขึ้น และอาจปรับปรุงความสามารถในการสรุปทั่วไปได้

หากไม่มีองค์ประกอบที่สำคัญเหล่านี้ การจับภาพ uplift อย่างแม่นยำจะกลายเป็นเรื่องที่ท้าทาย

แนวทางหลัก

มีสองวิธีหลักในการประเมินประสิทธิภาพของโมเดล uplift: Cumulative Gain และ Qini มาสำรวจกันเถอะ:

Cumulative Gain :

Cumulative gain แสดงให้เห็นอัตราการตอบสนองที่เพิ่มขึ้นหรือผลลัพธ์ที่ได้รับจากการกำหนดเป้าหมายเปอร์เซ็นต์เฉพาะของประชากร

ในการคำนวณ cumulative gain บุคคลจะถูกจัดอันดับตามคะแนน uplift และรายการที่จัดเรียงแล้วจะถูกแบ่งออกเป็นกลุ่มเดไซล์หรือกลุ่มเปอร์เซ็นไทล์ที่มีขนาดเท่ากัน จากนั้น cumulative gain จะถูกคำนวณโดยรวมผลลัพธ์หรือการตอบสนองของบุคคลภายในแต่ละกลุ่ม

N : จำนวนลูกค้าสำหรับกลุ่มควบคุม (C) และกลุ่มทดลอง (T) สำหรับ p% แรกของลูกค้า

Y : ผลรวมของ uplift ของเราในเมตริกที่เราเลือกสำหรับกลุ่มควบคุม (C) และกลุ่มทดลอง (T) สำหรับ p% แรกของลูกค้า

ตัวอย่างเช่น CG ที่ 20% ของประชากรที่กำหนดเป้าหมาย สอดคล้องกับผลตอบแทนที่เพิ่มขึ้นทั้งหมด หากเราปฏิบัติเฉพาะกรณีที่มี 20% แรกของ คะแนนสูงสุด

ในตัวอย่างที่ให้ไว้ด้านล่าง เราสังเกตว่าการกำหนดเป้าหมายลูกค้า 20% แรกที่มีคะแนนสูงสุดให้ผลตอบแทนสะสมที่ 0.019

เส้นโค้งที่สูงชันกว่าบ่งชี้ว่าเป็นโมเดลที่ดีกว่า เนื่องจากแสดงให้เห็นว่ามีสัดส่วนที่สูงขึ้นของบุคคลที่มี uplift ที่คาดการณ์ไว้สูงสุดกำลังถูกกำหนดเป้าหมาย

Qini Coefficient:

ค่าสัมประสิทธิ์ Qini ทำงานบนแนวคิดเดียวกับ Cumulative Gain โดยมีความแตกต่างที่สำคัญประการหนึ่ง

สูตรในการคำนวณ:


นั่นเยี่ยมมาก แต่เราจะเลือกระหว่างโมเดลต่างๆ ได้อย่างไร? การพึ่งพาเฉพาะเส้นโค้งเหล่านี้เพื่อเลือกระหว่างโมเดลต่างๆ อาจไม่ใช่แนวทางที่ขับเคลื่อนด้วยข้อมูลมากที่สุด

เมตริกคุณภาพ

มีเมตริกที่มีประโยชน์ที่สุดสามตัวที่สามารถช่วยเรา และทั้งหมดนี้ สามารถใช้ได้กับทั้งแนวทาง Qini และ Cumulative Gain

Area under Uplift (AUC-U):

คล้ายกับพื้นที่ใต้เส้นโค้ง ROC (AUC-ROC) ในการจำแนกประเภทแบบดั้งเดิม AUC-U วัดประสิทธิภาพโดยรวมของโมเดล uplift มันคำนวณพื้นที่ใต้เส้นโค้ง uplift / Qini ซึ่งแสดงถึง uplift สะสมตามบุคคลที่จัดเรียงตามการคาดการณ์ของโมเดล uplift

Uplift@K:

Uplift@K มุ่งเน้นไปที่การระบุ K% แรกของประชากรที่มี uplift ที่คาดการณ์ไว้สูงสุด มันวัดสัดส่วนของบุคคลที่ตอบสนองอย่างแท้จริงภายในกลุ่มที่เลือกนี้ ค่า uplift@K ที่สูงขึ้นบ่งชี้ว่าโมเดลดีกว่าในการกำหนดเป้าหมายบุคคลที่ถูกต้อง

ในตัวอย่างด้านล่าง Uplift@0.2 สำหรับโมเดลแรกอยู่ที่ประมาณ 0.16 และสำหรับโมเดลที่สองคือ 0.19 และการเลือกโมเดลที่ดีที่สุดนั้นชัดเจน

เมตริกนี้สามารถช่วยได้เมื่อใด?

Uplift max:

Uplift max หมายถึง uplift สูงสุดที่โมเดลบรรลุผล มันแสดงถึงความแตกต่างระหว่างกลุ่มทดลองและกลุ่มควบคุมที่มีคะแนน uplift สูงสุด

สรุป

เราได้เห็นแล้วว่าเมตริกการจำแนกประเภทและการถดถอยแบบดั้งเดิมอาจไม่วัดประสิทธิผลของโมเดล uplift ได้อย่างเพียงพอ

เพื่อเอาชนะสิ่งนี้ สองแนวทางหลัก CG และ Qini นำเสนอเมตริกที่มีค่าสำหรับการประเมินผล

เป็นสิ่งสำคัญที่จะต้องทดลองกับรูปแบบต่างๆ อย่างต่อเนื่อง และค้นหาเมตริกที่สอดคล้องกับวัตถุประสงค์ของคุณมากที่สุด ด้วยการสำรวจและปรับปรุงแนวทางของคุณ คุณสามารถวัดผลกระทบของโมเดล uplift ได้อย่างมีประสิทธิภาพและเพิ่มประสิทธิภาพของมัน

\n

\

SPACEX(PRE) Launchpad

SPACEX(PRE) LaunchpadSPACEX(PRE) Launchpad

สมัครสมาชิกเพื่อลุ้นรับสิทธิ์จับรางวัลฟรี

ข้อจำกัดความรับผิดชอบ: บทความที่โพสต์ซ้ำในไซต์นี้มาจากแพลตฟอร์มสาธารณะและมีไว้เพื่อจุดประสงค์ในการให้ข้อมูลเท่านั้น ซึ่งไม่ได้สะท้อนถึงมุมมองของ MEXC แต่อย่างใด ลิขสิทธิ์ทั้งหมดยังคงเป็นของผู้เขียนดั้งเดิม หากคุณเชื่อว่าเนื้อหาใดละเมิดสิทธิของบุคคลที่สาม โปรดติดต่อ crypto.news@mexc.com เพื่อลบออก MEXC ไม่รับประกันความถูกต้อง ความสมบูรณ์ หรือความทันเวลาของเนื้อหาใดๆ และไม่รับผิดชอบต่อการดำเนินการใดๆ ที่เกิดขึ้นตามข้อมูลที่ให้มา เนื้อหานี้ไม่ถือเป็นคำแนะนำทางการเงิน กฎหมาย หรือคำแนะนำจากผู้เชี่ยวชาญอื่นๆ และไม่ถือว่าเป็นคำแนะนำหรือการรับรองจาก MEXC

คุณอาจชอบเช่นกัน

ข้อเสนอใหม่ของ Solana มุ่งเพิ่มการเผา SOL Token

ข้อเสนอใหม่ของ Solana มุ่งเพิ่มการเผา SOL Token

โพสต์ New Solana Proposal Aims to Boost SOL Token Burns ปรากฏครั้งแรกบน Coinpedia Fintech News ข้อเสนอใหม่ของ Solana ที่ชื่อว่า SIMD 547 อาจเพิ่มขึ้นอย่างมีนัยสำคัญ
แชร์
CoinPedia2026/06/01 14:05
Kraken จับตา Bitcoin Perpetuals ที่กำกับโดย CFTC หลังคำตัดสิน Kalshi

Kraken จับตา Bitcoin Perpetuals ที่กำกับโดย CFTC หลังคำตัดสิน Kalshi

Kraken กำลังเตรียมสัญญา Bitcoin perpetuals ที่กำกับดูแลโดย CFTC หลังจาก CFTC อนุมัติสัญญา Kalshi ซึ่งเป็นสัญญาณถึงการเปลี่ยนแปลงที่อาจเกิดขึ้นสำหรับอนุพันธ์คริปโตในสหรัฐฯ
แชร์
coinlineup2026/06/01 14:39
ราคาทองคำในซาอุดีอาระเบีย: อัตราในวันที่ 1 มิถุนายน

ราคาทองคำในซาอุดีอาระเบีย: อัตราในวันที่ 1 มิถุนายน

โพสต์ราคาทองคำในซาอุดีอาระเบีย: อัตราเมื่อวันที่ 1 มิถุนายน ปรากฏบน BitcoinEthereumNews.com ราคาทองคำร่วงลงในซาอุดีอาระเบียเมื่อวันจันทร์ ตามข้อมูลที่รวบรวม
แชร์
BitcoinEthereumNews2026/06/01 14:05

หุ้น (Beta) เปิดให้ใช้งานแล้ว

หุ้น (Beta) เปิดให้ใช้งานแล้วหุ้น (Beta) เปิดให้ใช้งานแล้ว

เทรดหุ้นสหรัฐจริงผ่านโบรกเกอร์ที่ได้รับการกำกับดูแล