Detectarea timpurie a autismului din EEG-ul sugarilor cu deep learning

Un diagnostic clinic de autism nu este de obicei pus înainte ca un copil să împlinească trei ani sau mai mult — și totuși semnele comportamentale încep să apară în primul și al doilea an de viață, exact atunci când se crede că sprijinul ajută cel mai mult. Aproximativ unul din 160 de copii la nivel mondial este diagnosticat cu tulburare de spectru autist (ASD). Distanța dintre momentul în care afecțiunea începe să prindă contur și momentul în care este recunoscută este una dintre cele mai dificile probleme din neuroștiința dezvoltării. Această lucrare pune o întrebare prudentă: poate o înregistrare cu cost redus a activității cerebrale a unui sugar, citită de o rețea neuronală profundă, să prezică diagnosticul pe care copilul îl va primi ani mai târziu?

Problema

Tulburarea de spectru autist (ASD) este o gamă de afecțiuni caracterizate prin interacțiune socială redusă, comunicare deficitară și un domeniu restrâns de interese repetitive. Este definită comportamental, nu biologic — nu există nicio analiză de sânge, niciun scan care să rezolve întrebarea. Tocmai acest lucru face diagnosticul timpuriu atât de dificil: în primii ani de viață, când intervenția ar trebui să fie cea mai eficientă, tabloul comportamental este variabil și incert, iar formele mai ușoare sunt deosebit de greu de detectat. Chiar și un instrument care doar ar semnala o șansă crescută de ASD emergent ar fi valoros — ar putea declanșa evaluări comportamentale mai timpurii și mai sensibile, precum și intervenții adaptate copilului.

Pentru ca acest lucru să funcționeze în practică, ai nevoie de o măsurătoare care să fie simplă, cu cost redus și care ar putea fi implementată în mod plauzibil în cadrul controalelor de rutină. Electroencefalografia (EEG) este un candidat puternic. În timpul unui EEG, activitatea electrică generată de celulele cerebrale este înregistrată prin electrozi mici plasați pe scalp — neinvaziv, cu cost redus, chiar și atunci când subiectul este în repaus. A fost folosită de mult timp pentru a evalua funcția cerebrală atipică, ceea ce o face potrivită pentru căutarea semnăturilor timpurii ale ASD la sugari.

Dificultatea a constat în ce anume să faci cu semnalul. Cele mai multe lucrări anterioare de EEG din acest domeniu s-au concentrat pe biomarkeri unidimensionali — măsuri sintetice unice extrase din traseu. Aceștia au avut un anumit succes în prezicerea unei șanse crescute de autism, dar nu ating o acuratețe predictivă ridicată și contribuie puțin la identificarea subgrupurilor clinice. Iar analiza EEG standard aruncă ceva important: informația spațială. Fiecare electrod se află deasupra unei anumite regiuni a creierului, cu regiuni învecinate în jurul său, dar vectorii de caracteristici convenționali ignoră locul de pe scalp de unde a provenit fiecare semnal.

Înregistrările EEG ale sugarilor sunt transformate în imagini care păstrează topologia, pe care o rețea neuronală le poate citi.

Figura 1. De la EEG-ul de pe scalp la imagini pe care o rețea profundă le poate clasifica.

Ce am făcut

Ideea centrală este să nu mai tratăm EEG-ul ca pe o listă de numere și să începem să tratăm EEG-ul ca pe o imagine. Esențial, transformarea este concepută pentru a păstra locația spațială, topologică a electrozilor pe scalp — astfel încât rețeaua să poată învăța din locul unde se produce activitatea, nu doar din cantitatea acesteia.

Pipeline-ul funcționează după cum urmează. EEG-ul continuu a fost înregistrat cu o rețea de 128 de electrozi eșantionată la 500 Hz (116 electrozi după excluderea celor cel mai contaminați de artefacte). Semnalul curat a fost segmentat în ferestre de o secundă, iar o transformată Fourier rapidă (FFT) a fost calculată pentru fiecare fereastră pe trei benzi de frecvență asociate cu activitatea corticală — Theta, Alpha și Beta. Puterea din fiecare bandă este apoi proiectată pe o hartă plană a capului folosind o proiecție azimutală echidistantă (polară) împrumutată din cartografie, care păstrează intacte distanțele relative dintre electrozi, și interpolată într-o imagine netedă de 224×224. Cele trei benzi de frecvență devin cele trei canale de culoare ale unei singure imagini RGB. Rezultatul este o secvență de imagini multispectrale care păstrează topologia — în esență un scurt „film” al activității cerebrale a sugarului.

Aceste imagini sunt apoi furnizate către Residual Networks (ResNet) — rețele convoluționale profunde ale căror „skip connections” permit modelelor foarte profunde să se antreneze fără problema gradientului care dispare (vanishing gradient), care afectează rețelele profunde obișnuite. Echipa a folosit un ResNet cu 50 de straturi (ResNet-50), preantrenat pe setul de date de fotografii ImageNet și apoi reglat fin prin transfer learning, ceea ce a redus dramatic timpul de antrenare și a depășit performanța antrenării de la zero. Stratul de ieșire cu 1.000 de clase a fost înlocuit cu două ieșiri, transformând problema într-o clasificare binară de imagini: ASD versus NON-ASD. Acesta este deep learning end-to-end — rețeaua își învață propriile caracteristici direct din imagini, în loc să se bazeze pe biomarkeri construiți manual.

Datele au provenit din British Autism Study of Infant Siblings (BASIS), o cohortă longitudinală care urmărește sugari cu risc familial crescut de autism. 101 sugari au participat la momentul de 12–15 luni și au fost urmăriți până la vârsta de 36 de luni (53 cu risc familial ridicat, 48 cu risc scăzut). Sugarii au urmărit scurte clipuri video sociale și nesociale în timp ce le era înregistrat EEG-ul și — important — fiecare copil a primit un diagnostic clinic formal abia la 36 de luni. Acel diagnostic este adevărul de referință (ground truth) pe care modelul este pus să îl prezică. Deoarece EEG-ul sugarilor este excepțional de zgomotos (plâns, agitație, privirea în altă parte), respingerea strictă a artefactelor a lăsat un set de date relativ mic și dezechilibrat (aproximativ 81% NON-ASD față de 19% ASD), așa că echipa a folosit echilibrarea claselor în timpul eșantionării și early stopping pentru a se proteja împotriva supraînvățării (over-fitting).

Semnalele EEG devin imagini RGB care păstrează dispunerea electrozilor, apoi un ResNet prezice rezultatul ASD; 101 sugari urmăriți între 12 și 36 de luni.

Figura 2. EEG-ca-imagine + Residual Networks, pe o cohortă longitudinală de sugari.

Ce am descoperit

Rezultatul principal este acesta: modelul a putut prezice diagnosticul clinic de ASD sau non-ASD de la 36 de luni pornind de la EEG înregistrat încă de la vârsta de 12 luni. Cu alte cuvinte, structura latentă din aceste imagini ale activității cerebrale — și, probabil, procesarea cerebrală subiacentă pe care o reflectă — poartă un semnal despre un rezultat pe care clinicienii nu l-ar confirma decât peste încă doi ani.

În prima evaluare, în care ferestrele-imagine ale fiecărui sugar au fost împărțite 80% pentru antrenare și 20% pentru testare, ResNet-urile au atins o acuratețe de testare de aproximativ 78–82% pe cele trei stimuli video, early stopping adăugând doar o îmbunătățire marginală, iar modelele dovedind o bună rezistență la over-fitting. Echipa a rulat și un test mult mai strict — leave-one-participant-out, în care toate datele unui copil sunt lăsate deoparte, iar modelul trebuie să clasifice pe cineva pe care nu l-a văzut niciodată. Aici rolul early stopping a devenit decisiv: fără acesta, rețeaua pur și simplu învăța să prezică clasa majoritară și clasifica grav greșit cazurile ASD minoritare; cu early stopping, performanța pe acei participanți ASD s-a îmbunătățit dramatic, scorurile de testare per participant urcând cu mult peste pragul de 50% care marchează o predicție semnificativă în această problemă binară.

Avertismentul onest stă chiar lângă rezultat: aceasta este o cohortă mică, cu doar o mână de copii care au ajuns la un diagnostic de ASD, și un dezechilibru de clase pe care autorii îl abordează prin tehnică deliberată, mai degrabă decât prin mai multe date. Lucrarea prezintă concluziile ca dovezi promițătoare că deep learning end-to-end poate extrage biomarkeri digitali utili din EEG-ul sugarilor — nu ca pe un test finalizat și validat. Tratarea mai robustă a dezechilibrului de clase, îmbunătățirea generalizării și extinderea eșantionului de ASD sunt menționate explicit ca direcții de lucru viitoare.

Modelul a prezis rezultatul de autism de la 36 de luni pornind de la date încă de la vârsta de 12 luni.

Figura 3. Predicția timpurie a rezultatului clinic.

De ce contează

Promisiunea aici este un drum către biomarkeri digitali simpli, timpurii și de rutină. Dacă o înregistrare EEG scurtă, neinvazivă și cu cost redus — genul care ar putea într-o zi să încapă într-un control medical — poartă suficient semnal pentru a semnala o șansă crescută de autism emergent, ar putea contribui la apropierea momentului în care familiile obțin acces la evaluare și sprijin. Acest lucru este semnificativ tocmai pentru că actuala distanță diagnostică se măsoară în ani.

Există și o lecție metodologică. Prin transformarea unui semnal fiziologic într-o imagine care păstrează topologia și prin a lăsa o rețea profundă să învețe end-to-end, abordarea ocolește limitările biomarkerilor unidimensionali construiți manual și folosește informația spațială pe care analiza EEG standard o aruncă. Este o demonstrație clară că reprezentarea pe care o alegi pentru un semnal poate conta la fel de mult ca modelul pe care îl rulezi pe el.

Acesta este exact genul de muncă în jurul căruia este construită practica de AI-pentru-sănătate a stm.ai: modele ancorate în dovezi, în loc să fie lăsate să plutească liber, fundamentate pe măsurători fiziologice reale și pe o cohortă clinică longitudinală, cu un om păstrat în buclă prin design — aici, adevărul de referință este diagnosticul formal al unui clinician, iar rolul pe care orice astfel de model l-ar putea juca este de a sprijini evaluarea, nu de a o înlocui. Și trebuie citit cu aceeași grijă pe care au folosit-o autorii. Aceasta este cercetare în stadiu incipient pe o cohortă mică, orientată în direcția screeningului — o modalitate de a semnala cine ar putea beneficia de o atenție clinică mai atentă. Nu este un instrument de diagnostic implementat, iar un diagnostic de autism rămâne o judecată clinică. Într-un domeniu atât de sensibil, un rezultat onest și atent delimitat valorează mult mai mult decât unul exagerat.

C. Stamate, G.D. Magoulas, M.S.C. Thomas și BASIS Team — „Deep Learning Topology–Preserving EEG–Based Images for Autism Detection in Infants”, Proceedings of the 22nd Engineering Applications of Neural Networks Conference (EANN 2021), Springer (2021). Citește lucrarea.