یکی از محافظهکارانهترین جنبههای امور مالی، تصمیم به اعتبار دهی به شخصی، در حال تحول توسط امتیازدهی اعتباری مبتنی بر هوش مصنوعی است. این یک تغییر تدریجی برای افرادی است که سابقه اعتباری غنی دارند و مدت طولانی با بانکها همکاری داشتهاند. با این حال، میتواند برای وامگیرندگانی که پرونده نازکی دارند و کسانی که در اقتصاد غیررسمی هستند، زندگی را تغییر دهد. آنها بالاخره میتوانند شناسایی شوند، برخلاف اینکه برای سیستم نامرئی باشند. این مقاله به کاربرد دادههای جایگزین برای ایجاد امتیازات اعتباری مبتنی بر هوش مصنوعی برای افراد و مشاغل کوچکی که فاقد سابقه اعتباری سنتی هستند، خطر ناعادلانه بودن و سوگیری زمانی که دادههای اداره اعتبارسنجی در دسترس نیست، و تلاش نظارتی برای ایجاد هوش مصنوعی قابل توضیح در تضمین جمعیتهای کمبانک میپردازد.
رتبهبندیهای اعتباری متعارف نوعی وجود مالی را پیشفرض میگیرند. آنها فرض میکنند که یک فرد حساب بانکی، محصولات مالی رسمی دارد و قبلاً وام گرفته یا از کارت اعتباری استفاده کرده است. آنها پیشفرض میگیرند که کارفرمایان حقوق را به صورت رسمی عمل میکنند و بازرگانان در بخش قابل مشاهده اقتصاد - بخش مستند شده - کار میکنند. عملاً، بخش عظیمی از جهان چنین نیست. بزرگسالان جوان اغلب هیچ وام یا کارتی ندارند. مهاجران میتوانند سوابق اعتباری خوبی در کشورهای مبدا خود داشته باشند و هیچ چیز در کشورهای جدید خود نداشته باشند. بیشتر تراکنشهای آنها به صورت نقدی یا در پلتفرمهای دیجیتالی که به ادارات گزارش نمیدهند انجام میشود: کارگران موقت، فروشندگان خیابانی، مغازهداران غیررسمی، و تعداد زیادی از خرده کارآفرینان. جایی که ادارات وجود دارند، حتی پوشش آنها ممکن است سطحی یا جانبدار جمعیت شهری و شاغلین رسمی باشد. پرونده اداره چنین متقاضیانی برای وامدهندگان خالی یا تقریباً خالی به نظر میرسد. از آنجایی که تیمهای ریسک آموزش دیدهاند که به دادههای اداره اعتماد کنند، آنها به نفع احتیاط اشتباه میکنند. نتیجه قابل پیشبینی است: افزایش رد، محدودیتهای باریکتر، قیمتهای افزایش یافته، یا حذف کامل.
این وامگیرندگان لزوماً پرریسکتر نیستند؛ فقط سیستم نسبت به سیگنالهایی که واقعاً زندگی مالی آنها را مشخص میکند، ناشنوا و نابینا است. مفهوم اساسی کاربرد هوش مصنوعی در امتیازدهی اعتباری در اینجا ساده است. جایی که آمار اداره کم است یا بسیار کم، جای دیگری را جستجو کنید. ردپاهای دیجیتال متعددی در زندگی مدرن وجود دارد. زمانی که چنین ردپاهایی به روشی مسئولانه با رضایت جمعآوری و به سیگنالهای سازمانیافتهتر تبدیل میشوند، میتوانند درباره ثبات یک شخص، پتانسیل درآمد او و شانس بازپرداخت او بسیار چیزها بگویند. یکی از اولین و ارزشمندترین منابع اغلب دادههای مخابراتی است. اپراتورهای تلفن همراه درک میکنند که چگونه کسی موجودی پیشپرداخت را به طور منظم پر میکند، آیا سالها از یک شماره استفاده میکند یا به طور مکرر تغییر میدهد، آیا در فعالیت خود پایدار است یا تصادفی، و آیا بستههای داده با اندازه یکسان خریداری میکند. فردی که با گذشت زمان یک شماره را حفظ میکند، شماره را دوباره پر میکند، و الگوهای ثابت استفاده را نشان میدهد، به طور کلی عمیقتر در یک جامعه جای گرفته و در رفتار خود ثابتتر است در مقایسه با کسی که در استفاده کاهش یا نوسان دارد. اینکه آیا ثبات وجود دارد با کاهش ریسک اعتباری همراه است.
منبع قدرت دیگر تجارت الکترونیک و دادههای پلتفرمهای دیجیتال است. چیز کمی میتواند در پرونده اداره یک راننده تاکسی آنلاین موجود باشد، اما یک پلتفرم میتواند به تعداد سفرها، درآمد هر هفته، دادههای لغو، نظرات مشتریان و مدت زمان راننده دسترسی داشته باشد. یک خرده بازرگان به عنوان فروشنده در یک بازار تاریخچهای از سفارشات تکمیل شده، بازپرداختهای انجام شده، شکایات مطرح شده، کمبود موجودی و الگوهای رشد به جا میگذارد. در مورد مشاغل غیررسمی، دادههای پلتفرم میتوانند به عنوان نزدیکترین معادل صورتهای مالی رسمی استفاده شوند. بعدی، حساب بانکی، کیف پول دیجیتال و دادههای جریان نقدی API بانکداری باز است. اگرچه یک وامگیرنده ممکن است فاقد سابقه اعتباری طولانی باشد، او همچنین تمایل دارد حسابی داشته باشد که در آن حقوق، درآمد موقت، حوالهها یا درآمد تجاری واریز میشود. از طریق تحلیل جریانهای ورودی و خروجی مبتنی بر زمان، وامدهندگان میتوانند درآمد مشترک، تغییرپذیری آن، اینکه آیا بافرها دارد یا نه، و چه بخشی از درآمد قبلاً به هزینههای تکرارشونده مانند اجاره، آب و برق و بدهیهای موجود اختصاص یافته است را تخمین بزنند. در مورد وامگیرنده کمبانک، تضمین جریان نقدی اغلب قابل اعتمادتر از کارت امتیازی سنتی است که بسیار به وامهای گذشته متکی است. یک لایه دیگر توسط APIهای حقوق و استخدام ارائه میشود.
در شرایطی که کارفرمایان به خدمات حقوق متصل هستند، وامدهندگان قادر به تأیید استخدام، درآمد ماهانه، مدت زمان استخدام و تغییرات جبران خسارت هستند. برای کسانی که چندین شغل پارهوقت دارند، این تصویر ترکیبی بسیار آموزندهتر از یک فیش حقوقی خواهد بود. در نهایت، با استفاده صحیح، دادههای رفتاری و سطح دستگاه میتواند برای کمک به تخمین کلاهبرداری و ریسک استفاده شود. مدت زمانی که یک فرد از یک دستگاه یکسان استفاده میکند، منظم بودن مکانهای ورود آنها، نحوه استفاده از برنامه در طول ماهها، و همچنین زمان روز که معمولاً تراکنشها را انجام میدهند، ممکن است شاخصهایی از اصالت و ثبات را ارائه دهند. این سیگنالها باید با دقت مدیریت شوند تا از تبعیض نیابتی جلوگیری شود، اگرچه میتوانند پشتیبانی مفیدی باشند. همه این منابع با این واقعیت مرتبط هستند که درباره زندگی واقعی یک شخص و اینکه چگونه زندگی میکند، چگونه کسب درآمد میکند و پرداخت میکند حتی زمانی که واضح است که او هرگز انگشت خود را روی کارت اعتباری در زندگی خود نگذاشته است، میگویند.
\
این منابع دیگر داده متراکم و بدون ساختار هستند. ساختار لاگهای مخابراتی، رویدادهای پلتفرم، تراکنشهای بانکی و تلهمتری دستگاه مانند گزارش سنتی اداره نیست. آنها پرسروصدا، چند بعدی و پر از الگوهای خاص هستند. در این نقطه، هوش مصنوعی، به ویژه یادگیری ماشینی مدرن، ضروری است. چرخه عمر مشترک با جمعآوری دادهها شروع میشود. وامدهندگان به شرکای مخابراتی، فیدهای بانکداری باز، APIهای حقوق و شرکای پلتفرم به شرط قوانین حفاظت از دادهها و رضایت مستقیم مشتریان دسترسی دارند.
آنها دادههای خام را در محیطهای امن جذب و نرمال میکنند. فعالیتهای شارژ کردن تلفن، اعتبار کیف پول و سفارشات تجارت الکترونیک به سریهای زمانی که فرمتهای منظم دارند تبدیل میشوند. ناهنجاریهای غیرضروری و تکراریها حذف و مقادیر از دست رفته پردازش میشوند. از این، ویژگیها توسط دانشمندان داده ساخته میشوند. آنها متغیرهای خلاصه ایجاد میکنند نه صرفاً تغذیه همه تراکنشهای خام به یک مدل: میانگین جریان نقدی خالص ماهانه؛ سهم ماههایی که پساندازها مثبت است؛ طولانیترین دوره متوالی عدم پرداخت به طلبکاران؛ ماههای کمدرآمدی؛ رشد یا افول درآمد پلتفرم؛ تغییرپذیری ساعات کاری؛ دوام مکان هفته به هفته.
این ویژگیها سعی میکنند زندگی اقتصادی یک فرد را به اعدادی که مدل میتواند هضم کند فشرده کنند. درختان تقویت گرادیان، جنگلهای تصادفی و شبکههای عصبی سپس الگوریتمهای یادگیری ماشینی هستند که بر روی دادههای تاریخی که نتیجه آن از قبل شناخته شده است آموزش داده میشوند. در مورد امتیازدهی اعتباری، نتیجه معمولاً نکول وامگیرنده در یک دوره زمانی مشخص، مثلاً شش یا دوازده ماه است. مدل ترکیبهای ویژگیهایی را که ریسک بیشتر یا کمتر را نشان میدهند، میشناسد. الگوهای یافت شده در میان تضمینکنندگان انسانی توسط تشخیص انسانی شناسایی نمیشدند، مانند تعاملات جزئی بین نوسانات جریانهای نقدی و مدت زمان پلتفرم. اعتبارسنجی حیاتی است. مدل بر روی دادههایی که روی آن آموزش داده نشده است اعمال میشود تا عملکرد آن واقعی باشد و نتیجه برازش بیش از حد نباشد.
معیارهایی مانند AUC، ضریب جینی و آمار کولموگوروف-اسمیرنوف برای اندازهگیری قدرت تمایز استفاده میشوند، در حالی که نمودارهای کالیبراسیون نشان میدهند که آیا احتمالات پیشبینی شده با نرخ نکول واقعی یکسان است یا خیر. علاوه بر ارقام سرفصل، وامدهندگان باید به عملکرد بر اساس بخش نگاه کنند: وامگیرندگان جدید در برابر وامگیرندگان با تجربه، مشاغل مختلف، مناطق و باندهای درآمدی. پس از استقرار، مدل سپس متقاضیان جدید را به سرعت امتیازدهی خواهد کرد و پاسخی طی چند ثانیه ارائه میشود. فرآیند نمیتواند در آنجا پایان یابد. آمار با گذشت زمان تغییر میکند، پلتفرمها سیاستهای خود را تکامل میدهند و اقتصاد کلان تکامل مییابد.
\
:::tip این داستان به عنوان یک انتشار توسط سانیا کاپور تحت برنامه وبلاگ نویسی تجاری HackerNoon توزیع شد.
:::
\



