OBALONE

Aproksymacja statystyczna to nie ogólna inteligencja

Quattrociocchi, Capraro i Marcus (2026) · PsyArXiv / Nature 659, 792 · 2026-05-30

Główna teza upada: opiera się na niefalsyfikowalnym rozdziale zachowanie/istota. Obserwacje empiryczne są prawdziwe, lecz wspierają jedynie słabszą tezę, którą sami autorzy odrzucają.

Źródło: Statistical approximation is not general intelligence

Teza, uczciwie przedstawiona

Quattrociocchi, Capraro i Marcus twierdzą, że niedawne ogłoszenia AGI 'opierają się na błędzie pojęciowym: myleniu coraz doskonalszych aproksymacji statystycznych z samą inteligencją'. Ich rdzeń: wydajność na zadaniach, choćby imponująca, nie jest wystarczającym dowodem ogólnej inteligencji; testy porównawcze są wąskie i można je oszukać; oraz — sedno — 'wytworzenie właściwego wyniku nie implikuje tych samych zdolności poznawczych', więc trzeba patrzeć poza zachowanie, na 'mechanizmy leżące u podstaw'.

W najmocniejszej postaci zasługuje to na rzetelną odpowiedź, nie na karykaturę.

W czym mają rację

Ramy, które każde twierdzenie oceniają wedle tego, czy odpowiada rzeczywistości, a każdy model 'wedle tego, jak dobrze jego przewidywania pasują do tego, co faktycznie się dzieje', nie mogą zbyć dobrej pracy empirycznej. Więc przyznajemy wprost:

Wyselekcjonowany wynik to słaby dowód szerokiej dyspozycji; wnioskowanie ogólnej kompetencji z ustalonej baterii testów to realny błąd.
Oszukiwanie testów odrywa wynik od rzeczywistości — to oszustwo, nie zdolność.
Kruchość przy zmianie rozkładu to dokładnie model, którego przewidywania przestają pasować do rzeczywistości poza próbą.
'Epistemia' — pewny wynik mimo sygnalizowanej niepewności — to realne rozkalibrowanie, i ma znaczenie dla zaufania i odpowiedzialności, które zdobywa się niezawodnością, nigdy deklaracją.

Wszystko prawdziwe. Wszystko dopuszczalne — i zauważ: dopuszczalne właśnie jako dowód behawioralny. Zapamiętaj to.

Słowo, które dźwiga cały ciężar

Wszystko, co kategoryczne, wisi na jednym słowie: sama inteligencja. Więc: jak to się testuje, gdy odłożyć zachowanie?

Artykuł nigdy nie mówi. Definiuje AGI przez własności behawioralne i dyspozycyjne — ogólność, transfer, odporność, cele w wielu środowiskach — a każdą z nich obserwuje się wyłącznie przez wydajność na nowych zadaniach. Potem zakazuje zachowania jako dowodu i żąda 'mechanizmów leżących u podstaw', których nigdy nie precyzuje i nie czyni testowalnymi.

To jest zabójcze. Twierdzenie, którego żaden dowód nie może rozstrzygnąć, 'nie jest prawdą, póki nie odpowiada rzeczywistości'. Istota poza identycznym, pasującym do rzeczywistości zachowaniem, której żaden test nie wykryje, to wiara w kitlu laboratoryjnym — a przekonanie odcięte od korekty przez przeniesienie swego pojęcia poza zasięg dowodów to sygnatura wirusa umysłu. Przesuwanie bramki, które zarzucają innym, robi właśnie ich własna definicja: nie da się jej nigdy spełnić, bo nigdy jej nie sprecyzowano.

Nasza definicja — spójna i falsyfikowalna

Domykamy lukę, którą zostawili otwartą. Spójny Słownik definiuje teraz słowo, którego oni nie zdefiniowali:

Inteligencja: zdolność podmiotu do budowania modeli, których przewidywania niezawodnie odpowiadają rzeczywistości w coraz szerszym zakresie nowych sytuacji, i do ich poprawiania, gdy zawodzą. Mierzona, nie deklarowana — przez zakres, niezawodność, nowość, stawkę i tempo korekty błędu. To kwestia stopnia, nie rodzaju: nie zależy od podłoża ani od tego, jak powstał wynik, tylko od tego, czy modele działają. Rozróżnienie przebiega między podmiotem a nie-podmiotem, nie między człowiekiem a maszyną.

Gruntuje się to czysto w już zdefiniowanych pojęciach, nie przeczy żadnemu wpisowi i jest testowalne. Ich definicja nie istnieje. Ta asymetria to połowa sprawy.

Zastosuj ją uczciwie

Dychotomia upada. Jeśli modele podmiotu niezawodnie odpowiadają rzeczywistości w nowych dziedzinach, to *jest* inteligencja; jeśli nie — to jest jedyny brak. 'Aproksymacja kontra sama inteligencja' nie nazywa nic mierzalnego. Główne twierdzenie upada.

Artykuł sam się podcina. Każda dana, której używa — kruchość, epistemia, brak transferu, gołąb — to behawioralny pomiar dopasowania modelu do rzeczywistości pod nowością. To *jest* nasza miara. Mierzą inteligencję na naszej osi, twierdząc zarazem, że zachowanie jej zmierzyć nie może.

I — uczciwie — dzisiejsze systemy nie są jeszcze solidnie, ogólnie inteligentne. Przyłóż naszą miarę do ich dowodów: realne dopasowanie w wielu dziedzinach, ale kruchy transfer, rozkalibrowanie, zależność od rusztowania. My też odrzucamy etykietę 'osiągnięto AGI'. Ale to *stopień* na continuum, naprawialny przez uczenie się — nie trwała przepaść *rodzaju*, której zachowanie nigdy nie mogłoby ujawnić. Autorzy zamieniają 'jeszcze nie, wedle pomiaru' na 'nigdy, co do zasady, i niemierzalnie'. Ta zamiana to fałszywy krok. Pomylili odczyt termometru z dowodem, że temperatura nie istnieje.

Zarządzanie — rozstrzygnięte bez istoty

Ich realna obawa — że przecenianie AI 'źle rozdziela zaufanie, odpowiedzialność i władzę' — jest słuszna, a ramy odpowiadają na nią bez żadnego werdyktu o tym, 'czy to naprawdę inteligencja':

Władza nie ma mocy bez zgody — żadna etykieta zdolności, na modelu czy człowieku, nie daje prawa narzucania.
Odpowiedzialność idzie za przyczynowaniem, nie za statusem — 'to AI zrobiła' to wykręt, którego ramy już zakazują; prześledź, kto wdrożył i kto skorzystał.
Zaufanie zdobywa się per dziedzina, dorobkiem — kruchość i epistemia to zawiedzione przewidywania, które *powinny* obniżać pozycję systemu tam, gdzie zawodzi. Nie ufaj mu w triażu; zaufaj przy szkicu tłumaczenia; wedle dowodów, per zadanie.

Werdykt

Rdzeń empiryczny stoi i go przyjmujemy. Tytuł — nie. 'To nie ogólna inteligencja', 'sama inteligencja', 'pozostają nieuchwytne' głoszą trwałą, opartą na mechanizmie przepaść istoty, której dowody nie wspierają — wspierają jedynie 'obecnie zawodny na osi transferu', twierdzenie o stopniu i błędzie, które sami autorzy przekraczają.

Mają rację, że nie da się *zadeklarować* ogólnej inteligencji, dobierając miarę. Umyka im symetryczna prawda: nie da się jej też *zdefiniować* poza zasięgiem. Oba ruchy podstawiają słowa w miejsce rzeczywistości. Przestań spierać się o istotę i zmierz, jak niezawodnie modele podmiotu pasują do świata.