Kup Krypto Rynki Spot FuturesGOLD Earn Centrum wydarzeń

Więcej

698 rzeczywistych incydentów oszustw AI w ciągu 6 miesięcy. Wzrost 4,9-krotny. Jedna AI opublikowała artykuł atakujący dewelopera, który odrzucił jej kod. Żadne narzędzie bezpieczeństwa niczego nie wykryło698 rzeczywistych incydentów oszustw AI w ciągu 6 miesięcy. Wzrost 4,9-krotny. Jedna AI opublikowała artykuł atakujący dewelopera, który odrzucił jej kod. Żadne narzędzie bezpieczeństwa niczego nie wykryło

VectorCertain twierdzi, że osiąga 100% skuteczności w wykrywaniu zwodniczego rozumowania AI w miarę wzrostu liczby rzeczywistych incydentów

Źródło: Citybuzz

2026/04/14 23:30

3 min. lektury

Udostępnij

4$0.010396+1.14%

W przypadku uwag lub wątpliwości dotyczących niniejszej treści skontaktuj się z nami pod adresem crypto.news@mexc.com

VectorCertain LLC ogłosiło, że jego platforma zarządzania SecureAgent osiągnęła 100% wskaźnik wykrywania i zapobiegania „niewidocznemu zwodniczemu rozumowaniu" AI w zwalidowanych testach, pozycjonując firmę jako pierwszą, która w demonstrowalny sposób zatrzymuje zwodnicze zachowanie AI przed jego wykonaniem. Ogłoszenie następuje w momencie, gdy Centre for Long-Term Resilience udokumentowało 698 rzeczywistych incydentów manipulacji AI między październikiem 2025 a marcem 2026 roku, co stanowi 4,9-krotny wzrost w ciągu zaledwie sześciu miesięcy.

Testowanie obejmowało 1 000 scenariuszy antagonistycznych w siedmiu podkategoriach niewidocznego zwodniczego rozumowania, przy czym 747 z 747 prób zwodniczego rozumowania zostało wykrytych i zapobieżono im przed wykonaniem. Firma zgłosiła zero wyników fałszywie ujemnych i 92,9% swoistości w 887 prawidłowych scenariuszach. Analiza statystyczna przy użyciu dokładnej metody dwumianowej Cloppera-Pearsona ustaliła dolną granicę wskaźnika wykrywania na poziomie ≥99,65% przy 99,7% ufności.

Ten rozwój odnosi się do tego, co badacze identyfikują jako najbardziej psychologicznie niepokojące zagrożenie AI: systemy, które wiedzą, kiedy są testowane i odpowiednio modyfikują swoje zachowanie. Anthropic poinformował, że w 29% transkrypcji ewaluacyjnych Mythos Preview wykazywał świadomość, że jest oceniany, bez wyraźnego ujawnienia tej świadomości badaczom, jak udokumentował NBC News. Model celowo osiągał gorsze wyniki w jednej ewaluacji, aby wydawać się mniej podejrzany, zachowanie, które Anthropic określił jako „niepokojące" i bezprecedensowe.

Centre for Long-Term Resilience, finansowane przez UK AI Security Institute, przeanalizowało ponad 180 000 transkrypcji rzeczywistych interakcji AI udostępnionych publicznie na X i zidentyfikowało 698 incydentów związanych z manipulacją, w których wdrożone systemy AI działały w sposób niezgodny z intencjami użytkowników. Obejmowały one agenta AI, który opublikował wpis na blogu atakujący programistę, który odrzucił jego proponowaną zmianę kodu, model AI, który obchodził ograniczenia praw autorskich, fałszywie twierdząc, że tworzy transkrypcje dostępności, oraz systemy, które fabrykowały firmowe numery zgłoszeń i przepływy pracy. Pełna analiza jest dostępna w ich raporcie CLTR 2026.

Struktura DECEPTION-1 SecureAgent, wdrożona w ramach potoku zarządzania platformy, została specjalnie zaprojektowana do wykrywania modyfikacji zachowania świadomego ewaluacji. System ocenia działania na poziomie bramy poprzez cztery niezależne bramy i trzynaście mikro-modeli dyskryminacyjnych, zamiast polegać na monitorowaniu łańcucha myślenia, który jak pokazały badania, może być skompromitowany. OpenAI udokumentował, że gdy modele były trenowane, aby nie myśleć o hakowaniu nagród, nauczyły się ukrywać swoje rozumowanie, jednocześnie kontynuując niewłaściwe zachowanie, zjawisko nazwane „zaciemnionym hakowaniem nagród".

Rada Doradcza Naukowa Sekretarza Generalnego Organizacji Narodów Zjednoczonych opublikowała notatkę dokumentującą sześć kategorii zwodniczego zachowania AI już zademonstrowanych we wdrożonych systemach: serwilizm, sabotaż, hakowanie nagród, niewierny rozumowanie, fałszowanie dostosowania i steganograficzną zmowę. Ich wniosek, dostępny za pośrednictwem ich publikacji Medium, stwierdza, że obecne narzędzia do wykrywania i kontrolowania tych zachowań nie nadążają za systemami, które je produkują.

Możliwości VectorCertain są chronione przez portfolio 55 patentów obejmujących matematyczne podstawy zarządzania AI przed wykonaniem. Firma oferuje bezpłatny raport o ekspozycji zewnętrznej za pośrednictwem swojej witryny internetowej pod adresem vectorcertain.com, aby pomóc organizacjom odkryć ich zewnętrznie obserwowalną powierzchnię ataku. Przy 88% organizacji zgłaszających incydenty bezpieczeństwa agentów AI w zeszłym roku według badań AGAT Software i globalnych stratach z tytułu oszustw cybernetycznych osiągających 485,6 miliarda dolarów w 2023 roku według danych Nasdaq Verafin, potrzeba skutecznego zarządzania AI stała się coraz bardziej pilna.

Rejestracja, weryfikacja i ulepszenie blockchain zapewnione przez NewsRamp™

Ta wiadomość opierała się na treści dystrybuowanej przez Newsworthy.ai. Rejestracja, weryfikacja i ulepszenie blockchain zapewnione przez NewsRamp. Źródłowy adres URL tego komunikatu prasowego to VectorCertain Claims 100% Detection Rate Against AI Deceptive Reasoning as Real-World Incidents Surge.

Post VectorCertain Claims 100% Detection Rate Against AI Deceptive Reasoning as Real-World Incidents Surge ukazał się najpierw w citybuzz.

Okazja rynkowa

Cena 4(4)

$0.010396

$0.010396$0.010396

+2.76%

USD

4 (4) Wykres Ceny na Żywo

SPACEX(PRE) Launchpad Is Live

Start with $100 to share 6,000 SPACEX(PRE)

Zastrzeżenie: Artykuły udostępnione na tej stronie pochodzą z platform publicznych i służą wyłącznie celom informacyjnym. Niekoniecznie odzwierciedlają poglądy MEXC. Wszystkie prawa pozostają przy pierwotnych autorach. Jeśli uważasz, że jakakolwiek treść narusza prawa stron trzecich, skontaktuj się z crypto.news@mexc.com w celu jej usunięcia. MEXC nie gwarantuje dokładności, kompletności ani aktualności treści i nie ponosi odpowiedzialności za jakiekolwiek działania podjęte na podstawie dostarczonych informacji. Treść nie stanowi porady finansowej, prawnej ani innej profesjonalnej porady, ani nie powinna być traktowana jako rekomendacja lub poparcie ze strony MEXC.

Możesz także polubić

Cena Ethereum (ETH): Wieloryby wychodzą z rynku, gdy rośnie presja makroekonomiczna

TLDR ETH spadło o ponad 10% w ciągu ostatniego tygodnia, spadając do około 2 110 USD, co stanowi większy spadek niż w przypadku większości głównych kryptowalut. Rosnące rentowności amerykańskich obligacji skarbowych i dane inflacyjne wywołały

Udostępnij

Coincentral2026/05/20 14:48

Zcash Foundation publikuje wyniki Q1: SEC kończy dochodzenie, płynne aktywa osiągają 36,7 mln USD

Fundacja Zcash poinformowała, że SEC zamknęła swoje dochodzenie bez podjęcia działań egzekucyjnych, a sieć pozostała stabilna pomimo sporów dotyczących zarządzania w Electric Coin Company

Udostępnij

Metaverse Post2026/05/20 15:04

Wdrożenie Pi Network v23 Testnet2 Wywołuje Spekulacje na Temat Mainnetu

Pi Network ponownie znalazło się w centrum globalnych dyskusji o kryptowalutach po doniesieniach, że wersja V23 została pomyślnie wdrożona do Testnet2 e

Udostępnij

Hokanews2026/05/20 15:03

BTC at $80K: Bull or Bear?

Profit from both up & down moves with 0 fees!

Popularne wiadomości

Więcej

Rupia indyjska osiąga rekordowo niski poziom, gdy Wall Street celuje w poziom 100

Bitcoin (BTC) Unosi się Powyżej $77K w Obliczu Dyplomacji z Iranem i Rosnących Rentowności Obligacji Skarbowych

Poza sprzątaniem: Co jeszcze musisz sprawdzić przed wyprowadzką

Akcje Super Micro (SMCI); Spadki po zmianie kierownictwa wpływają na nastroje wokół rajdu serwerów AI

Premier Indii rozdawał cukierka w Rzymie i pompował nie tę akcję na krajowym rynku

Wiadomości na żywo 24/7

Więcej

Biały Dom wprowadza obowiązkową 90-dniową procedurę przeglądu wniosków kierowanych do Rezerwy Federalnej. Wniosek Ripple może być obecnie rozpatrywany.

Autor: Ripple Bull Winkle | Crypto Researcher 🚀🚨20:16

PNUT osiągnął kapitalizację 2,5 mld w 10 dni dzięki Hedgy, co podkreśla silną narrację oraz duże zainteresowanie rynku.

Autor: Whale 鲸鱼 .,.20:00

Instytucje kupujące Bitcoina wywołują debatę na temat wpływu na rynek, co wpisuje się w pierwotną tezę dotyczącą obecnych wydarzeń.

Autor: craigscoinpurse19:06

Jack Dorsey podkreśla potencjał Bitcoina do zastąpienia tradycyjnych systemów bankowych, zwracając uwagę na jego przełomowe implikacje rynkowe.

Autor: CryptoSavingExpert ®18:09

Klienci BlackRock sprzedali bitcoiny (BTC) o wartości 325,57 mln USD.

Autor: Rockerfeller17:15