Tajny model AI już w sieci. Kto strzegł, ten nie miał?
Nowy model sztucznej inteligencji, new technology Claude Mythos od Anthropic, miał być trzymany pod kluczem — zbyt powerful , by trafić w ręce publiczności. Tymczasem zamiast w bezpiecznych laboratoriach, wylądował w sieci, na serwerze Discorda, gdzie nieupoważnieni użytkownicy mogą go access i testować. Obietnica ścisłej kontroli dostępności załamała się szybciej niż model zdążył oficjalnie ruszyć. Projekt Glasswing, mający gwarantować wyłączny dostęp dla wybranych partnerów jak Amazon czy Cisco, nagle wygląda na wyciekłą beczkę.
Według report Bloomberga, niewielka grupa osób uzyskała dostęp do modelu już w dniu jego ogłoszenia. W ich arsenału nie brakowało bynajmniej hakerskich tool — wykorzystano informacje z wycieków danych, między innymi z incydentu w firmie Mercor, oraz uprawnienia pracownika zewnętrznego kontraktora współpracującego z Anthropic. Łącząc te elementy, grupa odgadła lokalizację modelu w infrastrukturze online. To nie był atak z siłą, ale result precyzyjnej analizy i wytrwałości — dowód na to, jak public dane mogą stać się luką w security nawet najbardziej tajnych projektów.
Anthropic potwierdziło, że bada incydent, podkreślając, że nie ma dowodów na naruszenie głównych systemów. Jednak firma nie ujawniła, czy issue dotyczy tylko jednego przypadku. Co ciekawe, osoby z nieautoryzowanym dostępem nie próbują wykorzystywać zaawansowanych funkcji związanych z cyberbezpieczeństwem. Zamiast tego testują model przy prostych zadaniach, jak generowanie stron internetowych — strategia mająca reduce risk wykrycia. To decision taktyczna, która jednocześnie podkreśla, jak delikatna jest równowaga między możliwościami a wykrywalnością.
Incident podważa samą idea ekskluzywności w rozwoju AI. Jeśli model przeznaczony dla garstki zaufanych partnerów może trafić na zamknięty kanał internetowy w ciągu dni, jak wygląda rzeczywisty control ? Czy inne tajne modele są już w rękach trzecich? A może to dopiero początek? Anthropic nie podało szczegółów działań naprawczych, co wzmacnia concern , że nie wie, jak zamknąć tę gap . W świecie, gdzie update i response liczą się w godzinach, cisza to również komunikat.
A może to celowe wycieczka? Testują, kto do czego jest zdolny.
Gdy coś jest w chmurze, to już nie jest tajne. Tyle że niektórzy o tym zapominają.
Fajnie, że testują go do prostych rzeczy — mniej damage szkód jeśli coś pójdzie nie tak.
Czy to public publiczne narażenie nie podważa zaufania do całej branży?
Generowanie stron? To brzmi niewinnie, ale to też może być początek dużego problemu.
Serwer private prywatny na Discordzie to już standard w niszowych społecznościach AI.
Anthropic mówi o zewnętrznych dostawcach… czyli winę rzucą na kogoś trzeciego. Typowe.
Ktoś musi w końcu ustalić rule zasady dla dostępu do superinteligencji.