Unul dintre cele mai conservatoare aspecte ale finanțelor, decizia de a acorda credit cuiva, este transformată de scoring-ul de credit bazat pe AI. Aceasta este o schimbare gradual ă pentru persoanele al căror istoric de credit este bogat și care au fost cu băncile pe o perioadă lungă de timp. Ar putea fi totuși o schimbare care le transformă viața pentru împrumutații cu dosare subțiri și pentru cei care se află în economia informală. Aceștia pot fi în sfârșit detectați, spre deosebire de a fi invizibili pentru sistem. Acest articol discută aplicarea datelor alternative pentru a crea scoruri de credit bazate pe AI pentru persoane fizice și întreprinderi mici care nu au un istoric de credit tradițional, riscul de nedreptate și prejudecată atunci când datele biroului nu sunt disponibile și impulsul de reglementare de a crea AI explicabil în subscrierea populațiilor subbancarizate.
Ratingurile de credit convenționale presupun un fel de existență financiară. Ele presupun că o persoană are un cont bancar, produse financiare formale și a contractat un împrumut sau a folosit un card de credit anterior. Ele presupun că angajatorii operează salariile într-un mod formal și că comercianții lucrează în partea vizibilă a economiei — partea documentată. Practic, o proporție colosală din lume nu este așa. Adulții tineri au adesea nici un împrumut sau card. Migranții pot avea antecedente de credit bune în țările lor de origine și nimic în cele noi. Majoritatea tranzacțiilor lor sunt efectuate în numerar sau pe platforme digitale care nu raportează la birouri: lucrători gig, vânzători ambulanți, comercianți informali și un număr mare de micro-antreprenori. Unde există birouri, chiar și acoperirea lor poate fi superficială sau părtinitoare către populațiile urbane, angajate formal. Dosarul de birou al unor astfel de solicitanți apare gol sau aproape gol pentru creditori. Deoarece echipele de risc sunt instruite să aibă încredere în datele biroului, fac greșeli în favoarea precauției. Rezultatul este previzibil: creșterea respingerilor, limitări restrânse, prețuri crescute sau excludere totală.
Acești împrumutați nu sunt neapărat mai riscanti; este doar că sistemul este surd și orb la semnalele care caracterizează de fapt viețile lor financiare. Conceptul de bază al aplicării AI la scoring-ul de credit aici este simplu. Unde statisticile biroului lipsesc sau sunt prea rare, căutați în altă parte. Există numeroase amprente digitale în viața modernă. Atunci când astfel de amprente sunt colectate într-un mod responsabil cu consimțământ și convertite în semnale mai organizate, pot spune multe despre stabilitatea unei persoane, potențialul lor de câștig și șansele lor de rambursare. Una dintre primele și cele mai valoroase surse este adesea datele telecom. Operatorii mobili înțeleg cum cineva completează soldurile preplătite în mod regulat, dacă folosesc același număr de-a lungul anilor sau schimbă frecvent, dacă sunt stabili sau haotici în activitatea lor și dacă achiziționează pachete de date de aceeași dimensiune. O persoană care păstrează un număr de-a lungul timpului, reîncarcă numărul și prezintă modele consistente de utilizare este în general mai profund înrădăcinată într-o comunitate și mai consistentă în comportamentul lor comparativ cu cineva care abandonează sau oscilează în utilizare. Dacă există stabilitate este asociată cu risc de credit redus.
O altă sursă de putere este comerțul electronic și datele de pe platformele digitale. Puține pot fi conținute în dosarul biroului unui șofer de ridesharing, dar o platformă poate accesa numărul de călătorii, venitul pe săptămână, datele de anulare, recenziile clienților și durata șoferului. Un micro-comerciant ca vânzător într-o piață lasă în urmă un istoric de comenzi finalizate, rambursări efectuate, plângeri ridicate, lipsuri de stoc și modele de creștere. În cazul afacerilor informale, datele platformei pot fi folosite ca echivalentul cel mai apropiat al situațiilor financiare oficiale. În continuare, există datele de flux de numerar din contul bancar, portofelul digital și API-ul de open banking. Deși un împrumutat poate să nu aibă un istoric de credit lung, el sau ea tinde, de asemenea, să aibă un cont unde salariul, venitul din gig, remitențele sau veniturile din afaceri sunt depuse. Prin analiza intrărilor și ieșirilor bazate pe timp, creditorii pot estima venitul comun, variabilitatea sa, dacă are buffere sau nu și ce porțiune din venit a fost deja alocată cheltuielilor recurente precum chiria, utilitățile și datoriile existente. În cazul împrumutatului subbancarizat, subscrierea fluxului de numerar este adesea mai fiabilă decât scorecard-ul tradițional, care se bazează atât de mult pe împrumuturile anterioare. Un alt nivel este furnizat de API-urile de salarizare și angajare.
În situațiile în care angajatorii sunt conectați la serviciile de salarizare, creditorii sunt capabili să confirme angajarea, câștigurile lunare, durata angajării și modificările de compensare. Pentru cei cu mai multe locuri de muncă cu normă parțială, această imagine compozită va fi mult mai informativă decât un singur fluturași de salariu. În cele din urmă, cu utilizarea corespunzătoare, datele comportamentale și la nivel de dispozitiv pot fi folosite pentru a asista atât în fraudă, cât și în estimarea riscului. Durata de timp în care o persoană a folosit același dispozitiv, regularitatea locațiilor lor de autentificare, cum folosesc aplicația de-a lungul lunilor, precum și ora din zi în care fac de obicei tranzacțiile, pot furniza indicatori de autenticitate și stabilitate. Aceste semnale ar trebui gestionate cu grijă pentru a preveni discriminarea prin proxy, deși pot fi un sprijin util. Toate aceste surse sunt conectate prin faptul că povestesc despre viața reală a unei persoane și cum trăiește, cum câștigă și plătește chiar și atunci când este clar că nu a pus niciodată degetul pe un card de credit în viața sa.
\
Aceste alte surse de date sunt dens populate și nestructurate. Structura jurnalelor telecom, evenimentelor platformei, tranzacțiilor bancare și telemetriei dispozitivului nu este aceea a unui raport de birou tradițional. Sunt zgomotoase, dimensionale și pline de modele de idiosincrazie. În acest punct, AI, în special învățarea automată modernă, este necesară. Ciclul de viață comun începe cu agregarea datelor. Creditorii au acces la parteneri telecom, fluxuri de open banking, API-uri de salarizare și parteneri de platformă cu condiția legilor de protecție a datelor și consimțământul direct al clienților.
Ei absorb datele brute în medii sigure și le normalizează. Activitățile de reîncărcare telefonică, creditul portofelului și comenzile de comerț electronic sunt convertite în serii temporale care au formate regulate. Anomaliile și duplicatele inutile sunt eliminate și valorile lipsă sunt procesate. Din aceasta, caracteristicile sunt construite de oamenii de știință ai datelor. Ei creează variabile sumare mai degrabă decât să hrănească pur și simplu toate tranzacțiile brute într-un model: fluxul mediu lunar net de numerar; cota lunilor în care economiile sunt pozitive; cea mai lungă perioadă consecutivă fără plăți către creditori; lunile de sub-câștiguri; creșterea sau decăderea câștigurilor platformei; variabilitatea orelor de lucru; permanența locației săptămână de săptămână.
Aceste atribute încearcă să comprime viața economică a unei persoane în numere care pot fi digerate de model. Arborii de gradient boosting, pădurile aleatoare și rețelele neuronale sunt apoi algoritmi de învățare automată care sunt instruiți pe date istorice unde rezultatul este deja cunoscut. În cazul scoring-ului de credit, rezultatul este de obicei o neplată a împrumutatului pe o perioadă specificată de timp, să zicem șase sau douăsprezece luni. Modelul ajunge să cunoască combinații de caracteristici care indică mai mult sau mai puțin risc. Modele găsite printre subscriitorii umani nu ar fi fost identificate prin discernământul uman, cum ar fi interacțiunile minore între volatilitățile fluxurilor de numerar și durata platformei. Validarea este critică. Modelul este aplicat la date pe care nu a fost instruit, astfel încât performanța sa este reală și nu un rezultat al supraajustării.
Măsuri precum AUC, coeficientul Gini și statisticile Kolmogorov–Smirnov sunt folosite pentru a măsura puterea de discriminare, în timp ce graficele de calibrare indică dacă probabilitățile prezise sunt identice cu ratele efective de neplată. Pe lângă cifrele principale, creditorii trebuie să examineze performanța pe bază de segment: împrumutați noi la credit versus împrumutați experimentați, diverse ocupații, regiuni și benzi de venit. La implementare, modelul va evalua apoi noii solicitanți în timp real și un răspuns va fi furnizat în câteva secunde. Procesul nu se poate termina acolo. Statisticile se schimbă în timp, platformele își evoluează politicile și macroeconomia evoluează.
\
:::tip Această poveste a fost distribuită ca o lansare de Sanya Kapoor în cadrul Programului de Business Blogging al HackerNoon.
:::
\


