BörseDEX+
Krypto kaufenMärkteSpotFutures500XEarnEvents
Mehr
Blue-Chip-Blitz
Wir verwenden tabellarische Datensätze, die ursprünglich von OpenML stammen und zu einer Reihe von Benchmark-Datensätzen vom Inria-Soda-Team auf HuggingFace zusammengestellt wurden. Wir trainieren mit 28.855 Trainingsproben und testen mit den verbleibenden 9.619 Proben. Alle MLPs werden mit einer Batch-Größe von 64, 64 und 0,0005 trainiert, und wir untersuchen 3 Schichten mit jeweils 100 Neuronen. Wir definieren hier die sechs wichtigsten Metriken, die in unserer Arbeit verwendet werden.Wir verwenden tabellarische Datensätze, die ursprünglich von OpenML stammen und zu einer Reihe von Benchmark-Datensätzen vom Inria-Soda-Team auf HuggingFace zusammengestellt wurden. Wir trainieren mit 28.855 Trainingsproben und testen mit den verbleibenden 9.619 Proben. Alle MLPs werden mit einer Batch-Größe von 64, 64 und 0,0005 trainiert, und wir untersuchen 3 Schichten mit jeweils 100 Neuronen. Wir definieren hier die sechs wichtigsten Metriken, die in unserer Arbeit verwendet werden.

Der Geek-Leitfaden zum ML-Experimentieren

Von: Hackernoon
2025/09/21 13:47
SIX
SIX$0.0163+1.55%
TOP Network
TOP$0.000096--%
SphereX
HERE$0.000119--%
Mintlayer
ML$0.01781+0.22%

Abstrakt und 1. Einleitung

1.1 Post-Hoc-Erklärung

1.2 Das Uneinigkeitsproblem

1.3 Förderung des Erklärungskonsenses

  1. Verwandte Arbeiten

  2. Pear: Post-HOC-Explainer-Agreement-Regularizer

  3. Die Wirksamkeit des Konsens-Trainings

    4.1 Übereinstimmungsmetriken

    4.2 Verbesserung der Konsensmetriken

    [4.3 Konsistenz zu welchem Preis?]()

    4.4 Sind die Erklärungen noch wertvoll?

    4.5 Konsens und Linearität

    4.6 Zwei Verlustterme

  4. Diskussion

    5.1 Zukünftige Arbeit

    5.2 Fazit, Danksagungen und Referenzen

Anhang

A ANHANG

A.1 Datensätze

In unseren Experimenten verwenden wir tabellarische Datensätze, die ursprünglich von OpenML stammen und vom Inria-Soda-Team auf HuggingFace [11] zu einem Satz von Benchmark-Datensätzen zusammengestellt wurden. Wir geben einige Details zu jedem Datensatz an:

\ Bank Marketing Dies ist ein binärer Klassifikationsdatensatz mit sechs Eingabemerkmalen und ist ungefähr klassenbalanciert. Wir trainieren mit 7.933 Trainingsproben und testen mit den verbleibenden 2.645 Proben.

\ California Housing Dies ist ein binärer Klassifikationsdatensatz mit sieben Eingabemerkmalen und ist ungefähr klassenbalanciert. Wir trainieren mit 15.475 Trainingsproben und testen mit den verbleibenden 5.159 Proben.

\ Electricity Dies ist ein binärer Klassifikationsdatensatz mit sieben Eingabemerkmalen und ist ungefähr klassenbalanciert. Wir trainieren mit 28.855 Trainingsproben und testen mit den verbleibenden 9.619 Proben.

A.2 Hyperparameter

Viele unserer Hyperparameter sind über alle unsere Experimente hinweg konstant. Zum Beispiel werden alle MLPs mit einer Batch-Größe von 64 und einer anfänglichen Lernrate von 0,0005 trainiert. Außerdem haben alle von uns untersuchten MLPs 3 versteckte Schichten mit jeweils 100 Neuronen. Wir verwenden immer den AdamW-Optimierer [19]. Die Anzahl der Epochen variiert von Fall zu Fall. Für alle drei Datensätze trainieren wir 30 Epochen, wenn 𝜆 ∈ {0,0, 0,25} und sonst 50 Epochen. Beim Training linearer Modelle verwenden wir 10 Epochen und eine anfängliche Lernrate von 0,1.

A.3 Uneinigkeitsmetriken

Wir definieren hier jede der sechs Übereinstimmungsmetriken, die in unserer Arbeit verwendet werden.

\ Die ersten vier Metriken hängen von den Top-𝑘 wichtigsten Merkmalen in jeder Erklärung ab. Lassen Sie 𝑡𝑜𝑝_𝑓 𝑒𝑎𝑡𝑢𝑟𝑒𝑠(𝐸, 𝑘) die Top-𝑘 wichtigsten Merkmale in einer Erklärung 𝐸 darstellen, lassen Sie 𝑟𝑎𝑛𝑘 (𝐸, 𝑠) den Wichtigkeitsrang des Merkmals 𝑠 innerhalb der Erklärung 𝐸 sein, und lassen Sie 𝑠𝑖𝑔𝑛(𝐸, 𝑠) das Vorzeichen (positiv, negativ oder null) des Wichtigkeitswerts des Merkmals 𝑠 in der Erklärung 𝐸 sein.

\

\ Die nächsten zwei Übereinstimmungsmetriken hängen von allen Merkmalen innerhalb jeder Erklärung ab, nicht nur von den Top-𝑘. Lassen Sie 𝑅 eine Funktion sein, die die Rangfolge der Merkmale innerhalb einer Erklärung nach Wichtigkeit berechnet.

\

\ (Hinweis: Krishna et al. [15] geben in ihrem Papier an, dass 𝐹 eine vom Endbenutzer angegebene Menge von Merkmalen sein soll, aber in unseren Experimenten verwenden wir alle Merkmale mit dieser Metrik).

A.4 Ergebnisse des Junk-Feature-Experiments

Wenn wir zufällige Merkmale für das Experiment in Abschnitt 4.4 hinzufügen, verdoppeln wir die Anzahl der Merkmale. Wir tun dies, um zu überprüfen, ob unser Konsensverlust die Erklärungsqualität beeinträchtigt, indem irrelevante Merkmale häufiger in die Top-𝐾 aufgenommen werden als bei natürlich trainierten Modellen. In Tabelle 1 berichten wir den prozentualen Anteil der Zeit, in der jeder Erklärer eines der zufälligen Merkmale in die 5 wichtigsten Merkmale aufgenommen hat. Wir beobachten, dass wir über alle Bereiche hinweg keinen systematischen Anstieg dieser Prozentsätze zwischen 𝜆 = 0,0 (ein Baseline-MLP ohne unseren Konsensverlust) und 𝜆 = 0,5 (ein MLP, das mit unserem Konsensverlust trainiert wurde) sehen

\ Tabelle 1: Häufigkeit von Junk-Features, die Top-5-Ränge erhalten, gemessen in Prozent.

A.5 Weitere Uneinigkeitsmatrizen

Abbildung 9: Uneinigkeitsmatrizen für alle in diesem Papier betrachteten Metriken zu Bank Marketing-Daten.

\ Abbildung 10: Uneinigkeitsmatrizen für alle in diesem Papier betrachteten Metriken zu California Housing-Daten.

\ Abbildung 11: Uneinigkeitsmatrizen für alle in diesem Papier betrachteten Metriken zu Electricity-Daten.

A.6 Erweiterte Ergebnisse

Tabelle 2: Durchschnittliche Testgenauigkeit für die von uns trainierten Modelle. Diese Tabelle ist nach Datensatz, Modell, den Hyperparametern im Verlust und dem Gewichtsverfallskoeffizienten (WD) organisiert. Durchschnitte sind über mehrere Versuche und wir berichten die Mittelwerte ± einen Standardfehler.

A.7 Zusätzliche Diagramme

Abbildung 12: Die Logit-Oberflächen für MLPs, die jeweils mit einem anderen Lambda-Wert trainiert wurden, auf 10 zufällig konstruierten Drei-Punkt-Ebenen aus dem Bank Marketing-Datensatz.

\ Abbildung 13: Die Logit-Oberflächen für MLPs, die jeweils mit einem anderen Lambda-Wert trainiert wurden, auf 10 zufällig konstruierten Drei-Punkt-Ebenen aus dem California Housing-Datensatz.

\ Abbildung 14: Die Logit-Oberflächen für MLPs, die jeweils mit einem anderen Lambda-Wert trainiert wurden, auf 10 zufällig konstruierten Drei-Punkt-Ebenen aus dem Electricity-Datensatz.

\ Abbildung 15: Zusätzliche Trade-off-Kurvendiagramme für alle Datensätze und Metriken.

\

:::info Autoren:

(1) Avi Schwarzschild, University of Maryland, College Park, Maryland, USA und Arbeit abgeschlossen während der Tätigkeit bei Arthur (avi1umd.edu);

(2) Max Cembalest, Arthur, New York City, New York, USA;

(3) Karthik Rao, Arthur, New York City, New York, USA;

(4) Keegan Hines, Arthur, New York City, New York, USA;

(5) John Dickerson†, Arthur, New York City, New York, USA (john@arthur.ai).

:::

:::info Dieses Papier ist auf arxiv verfügbar unter der CC BY 4.0 DEED-Lizenz.

:::

\

Haftungsausschluss: Die auf dieser Website veröffentlichten Artikel stammen von öffentlichen Plattformen und dienen ausschließlich zu Informationszwecken. Sie spiegeln nicht unbedingt die Ansichten von MEXC wider. Alle Rechte verbleiben bei den ursprünglichen Autoren. Sollten Sie der Meinung sein, dass Inhalte die Rechte Dritter verletzen, wenden Sie sich bitte an service@support.mexc.com um die Inhalte entfernen zu lassen. MEXC übernimmt keine Garantie für die Richtigkeit, Vollständigkeit oder Aktualität der Inhalte und ist nicht verantwortlich für Maßnahmen, die aufgrund der bereitgestellten Informationen ergriffen werden. Die Inhalte stellen keine finanzielle, rechtliche oder sonstige professionelle Beratung dar und sind auch nicht als Empfehlung oder Billigung von MEXC zu verstehen.

Das könnte Ihnen auch gefallen

Analyse: Fünf Spot-XRP-ETFs wurden bereits auf der DTCC-Website gelistet und werden voraussichtlich noch in diesem Monat offiziell eingeführt.

Analyse: Fünf Spot-XRP-ETFs wurden bereits auf der DTCC-Website gelistet und werden voraussichtlich noch in diesem Monat offiziell eingeführt.

PANews berichtete am 10. November, dass laut Cryptobriefing fünf Spot-XRP-ETFs, die von Franklin Templeton, Bitwise, Canary Capital, 21Shares und CoinShares aufgelegt wurden, auf der Website der American Depository Trust and Clearing Corporation (DTCC) erschienen sind. Dazu gehören Franklin XRP Trust (XRPZ), 21Shares XRP ETF (TOXR), Bitwise XRP ETF (XRP), Canary XRP ETF (XRPC) und CoinShares XRP ETF (XRPL). Der Markt erwartet, dass sie möglicherweise später in diesem Monat in den USA notiert werden.
XRP
XRP$2.4077+5.74%
Intuition
TRUST$0.2067-1.66%
Xrp Classic
XRPC$0.0007184+5.29%
Teilen
PANews2025/11/10 07:35
Financial Times: Ledger erwägt einen Börsengang oder eine Kapitalbeschaffung in New York.

Financial Times: Ledger erwägt einen Börsengang oder eine Kapitalbeschaffung in New York.

PANews berichtete am 10. November, dass laut Financial Times der Hardware-Wallet-Hersteller Ledger sich darauf vorbereitet, weitere Gelder zu beschaffen, wahrscheinlich im nächsten Jahr. Ledger-CEO Pascal Gauthier erklärte, dass das Unternehmen einen Börsengang oder eine private Finanzierungsrunde in New York in Betracht zieht und seine Geschäftstätigkeit dort aktiv ausweitet. Berichten zufolge erlebt Ledger sein bisher bestes Jahr, während es seine Finanzierungspläne enthüllt, wobei die Einnahmen bisher im Jahr 2025 Hunderte Millionen Dollar erreichen. Das Unternehmen wurde nach der Kapitalbeschaffung im Jahr 2023 von Investoren wie 10T Holdings und Singapurs True Global Ventures mit 1,5 Milliarden Dollar bewertet.
Ambire Wallet
WALLET$0.02005+5.97%
Moonveil
MORE$0.00495-6.32%
Farcana
FAR$0.000553-6.27%
Teilen
PANews2025/11/10 07:02
Keine Panik — Der Bitcoin-Markt befindet sich nur in einer Umstrukturierungsphase: Blockchain-Unternehmen

Keine Panik — Der Bitcoin-Markt befindet sich nur in einer Umstrukturierungsphase: Blockchain-Unternehmen

Der Bitcoin-Markt befindet sich in den letzten Wochen in einem Zustand der Unsicherheit, nach seiner uncharakteristisch negativen Performance im Oktober. Während die allgemeine Marktstimmung darauf hindeutet, dass das Ende des Bullenzyklus nahe sein könnte, deuten die neuesten On-Chain Daten darauf hin, dass die führende Kryptowährung möglicherweise nur einen Reset durchläuft. Laut [...]
Salamanca
DON$0.000436+2.34%
Threshold
T$0.01333+4.96%
Tron Bull
BULL$0.001166-1.10%
Teilen
Bitcoinist2025/11/10 06:00

Trendnachrichten

Mehr

Analyse: Fünf Spot-XRP-ETFs wurden bereits auf der DTCC-Website gelistet und werden voraussichtlich noch in diesem Monat offiziell eingeführt.

Financial Times: Ledger erwägt einen Börsengang oder eine Kapitalbeschaffung in New York.

Keine Panik — Der Bitcoin-Markt befindet sich nur in einer Umstrukturierungsphase: Blockchain-Unternehmen

Die besten Methoden zum Schreiben von Git Commit-Nachrichten: Genau wie die Profis

Ethereum-Blockchain Gasgebühren sinken inmitten der Verlangsamung auf nur 0,067 Gwei

Kryptopreise

mc_price_img_alt

Bitcoin

BTC

$106,169.22
$106,169.22$106,169.22

+2.32%

mc_price_img_alt

Ethereum

ETH

$3,643.23
$3,643.23$3,643.23

+3.62%

mc_price_img_alt

Solana

SOL

$166.76
$166.76$166.76

+2.60%

mc_price_img_alt

XRP

XRP

$2.3980
$2.3980$2.3980

+3.54%

mc_price_img_alt

DOGE

DOGE

$0.18144
$0.18144$0.18144

+1.88%