En gruppe forskere fra Aalborg Universitet er eksperter i lyd. Den ekspertise kan bruges, når Parkinsonramte skal diagnosticeres ud fra en simpel stemmeprøve.
Af Henrik Bendix, videnskabsjournalist, Vidmere.dk
Stadig flere rammes af den invaliderende Parkinsons sygdom, der angriber centralnervesystemet og blandt andet giver sig udslag i langsomme og rystende bevægelser. Sygdommen er uhelbredelig, men symptomerne kan dæmpes, så den bliver meget lettere at leve med.
Parkinsons sygdom kommer snigende stille og roligt, og ofte når symptomerne at blive ret slemme, før den ramte kommer til lægen. Her er problemet, at sygdommen er svær at diagnosticere. Den kan ikke afsløres gennem en blodprøve, og den er meget svær at se på en hjernescanning.
Diagnosen stilles typisk ud fra de motoriske symptomer – stivhed i musklerne, langsomme bevægelser, rysten og problemer med balancen – der før eller siden bliver umiskendelige. Det kan tage år, fra sygdommen opstår, til den diagnosticeres, og i mellemtiden går patienterne glip af den symptomdæmpende behandling.
Men det vil en lille gruppe forskere, blandt andet fra Aalborg Universitet, lave om på. De vil sørge for, at Parkinsons sygdom kan diagnosticeres tidligt i sygdomsforløbet på en nem og billig måde, nemlig igennem en kort besked, der indtales på en telefonsvarer eller i en app.
»Vi forsker i, hvordan Parkinsons sygdom påvirker vores produktion af tale, og hvordan det kan måles, også når det rene talesignal er forstyrret af støj, rumklang og en dårlig telefonforbindelse,« fortæller Mads Græsbøll Christensen, der er professor i signalbehandling med særligt fokus på lyd.
Han står i spidsen for Audio Analysis Lab på Institut for Arkitektur og Medieteknologi (også kaldet Create) ved Aalborg Universitet, hvor forskerne har arbejdet på Parkinson-projektet siden 2015, godt hjulpet af en bevilling på 6,5 millioner kroner fra Danmarks Frie Forskningsfond.
»Parkinsons sygdom ændrer måden at tale på. Parkinsonramte får mere luft i stemmen, som bliver domineret af ustemte lyde, mens vokalerne bliver svagere. Desuden får de unaturlige variationer i tonelejet. Der kommer en slags ufrivillig vibrato ind over, når de skal sige en lang, vedvarende vokallyd som “aaaah”, og det kan man detektere,« siger Mads Græsbøll Christensen og fortsætter:
»På den måde kan sygdommen diagnosticeres lang tid, før en klinisk diagnose typisk ville blive stillet. En tidlig diagnosticering er vigtig, ikke bare for at komme hurtigt i gang med symptombehandlingen, men også i forhold til at studere og forstå sygdommen bedre.«
Hvis Parkinsons sygdom kan genkendes på baggrund af en simpel stemmeprøve, bliver det meget lettere og billigere at stille diagnosen. Enhver kan finde ud af at sige “aaaah” og holde tonen i nogle sekunder, og langt de fleste har en mobiltelefon, der kan optage lyden og levere den til forskerne, enten ved at ringe til en telefonsvarer eller ved hjælp af en app udviklet til formålet. Pludselig er vejen banet til store screening-programmer, der kan nå vidt ud i befolkningen.
Helt så enkelt er det dog ikke. Det fandt den britiske forsker Max Little fra University of Birmingham ud af, efter han havde indsamlet tusindvis af telefonstemmer i forbindelse med et projekt kaldet Parkinson's Voice Initiative.
I laboratoriet virkede teknologien næsten perfekt, idet Parkinsonramte kunne identificeres med 98,6 procents sikkerhed. Men telefonopkald har en noget ringere kvalitet end laboratorieoptagelser foretaget med gode mikrofoner i et støjisoleret lokale med minimal rumklang. De mange optagelser fra folk, der havde ringet ind og sagt “aaaah”, var stort set ubrugelige. I hvert fald før forskerne fra Audio Analysis Lab kastede sig over dem.
»Max Little kontaktede mig, for vores speciale er netop at rense lydsignalet ved at fjerne støj, rumklang og lignende. Max lavede forarbejdet, og vores arbejde er så at forsøge at få teknologien til at virke i den virkelige verden,« lyder det fra Mads Græsbøll Christensen.
Det viste sig at være noget af en opgave at få brugbare signaler ud af den store database. I første omgang handlede det om at finde en metode til automatisk at luge ud i optagelserne, så der ikke skulle bruges kræfter på at analysere lyd forstyrret af gøende hunde, smækkende døre eller råb som “Shut up, I’m on the phone!”, så selve den interessante “aaaah”-lyd blev isoleret fra resten af optagelsen.
Derefter kastede forskerne sig over det endnu større arbejde med at rense lyden. Her var udfordringen, at det er vidt forskellige fænomener, der forringer signalerne, og det kræver forskellige matematiske metoder at forbedre dem. Her var det ikke mindst ph.d.-studerende Amir Poorjam, der lagde et stort arbejde i at finde ud af, hvordan den optagede lyd kunne gøres anvendelig i forhold til at diagnosticere sygdomme.
Det er ikke bare baggrundsstøj som folk, der snakker i baggrunden eller trafikstøj, der skal fjernes fra “Aaaah”-lyden. Det er også rumklang, altså det reflekterede lydsignal fra omgivelser, ikke mindst vægge, loft og gulv.
Desuden er der grænser for, hvor gode mikrofonerne i mobiltelefoner er, og det er nemt at overskride det maksimale lydniveau, mikrofonerne kan klare. Det ved de fleste, der har prøvet at optage lyden fra en koncert – den bliver skarp og stærkt forvrænget på grund af fænomenet, der kaldes clipping.
Det skal der også kompenseres for, og endelige kan komprimeringen af lydsignalet også spille en rolle. Den analoge lyd, der kommer ud fra munden og opfanges af mikrofonen, bliver konverteret til et digitalt signal i mobiltelefonen, og det forringer også lyden.
»Vi er ret gode til at frasortere baggrundsstøj og rumklang hver for sig, men kombinationen af de to er svær at håndtere. Og vi skal også klare clipping og komprimering. Men ved at kombinere de algoritmer, der er gode til hver sin ting, kommer vi faktisk tæt på laboratorieforholdene,« fortæller Mads Græsbøll Christensen.
Parkinsons sygdom er en neurologisk sygdom, der er karakteriseret ved langsomme bevægelser, muskelstivhed og rysten. Patienterne har også ikke-motoriske symptomer som dårlig hukommelse og koncentrationsbesvær. Sygdommen har sit navn efter den engelske læge James Parkinson, der beskrev den i en afhandling i 1817.
På verdensplan er over syv millioner mennesker ramt af Parkinsons sygdom, der skyldes nedbrydning af nerveceller i hjernen, og som indtil videre er uhelbredelig. Heldigvis er der gode muligheder for at dæmpe de motoriske symptomerne, så man lettere kan leve med Parkinsons sygdom. Det kan gøres typisk med medicin, der erstatter eller forbedrer virkningen af signalstoffet dopamin, som Parkinson-patienter mangler.
Der findes også behandlinger, der er rettet direkte mod de berørte områder i hjernen. En kirurgisk behandling kaldet dyb hjernestimulation – på engelsk Deep Brain Stimulation, DBS – kan anvendes ved fremskreden Parkinsons sygdom, hvor medicinen ikke virker som håbet.
På verdensplan har mere end 150.000 patienter med Parkinsons sygdom eller den beslægtede sygdom essentiel tremor fået implanteret elektroder i hjernen, og langt de fleste af dem har fået færre rystelser og mindre muskelstivhed. Sygdommen forsvinder ikke ved denne behandlingsmetode, men det gør de fleste af symptomerne, så længe der er strøm på elektroderne. Andre behandlingsmetoder som for eksempel fokuseret ultralyd, der ikke kræver kirurgi, er på vej frem.
Dermed er vejen banet for at gøre det meget lettere at diagnosticere Parkinsons sygdom, men ambitionerne stopper ikke her. Forskerne fra Audio Analysis Lab vil gerne helt til bunds i talens brug hos mennesker og modellere, hvordan lyden opstår og formes, lige fra luften trykkes ud af lungerne til talen kommer ud af munden.
I talekanalen dannes lydbølgerne, når luft fra lungerne strømmer forbi stemmelæberne i strubehovedet. Når stemmelæberne aktiveres ved hjælp af strubens muskler, sættes de i komplekse svingninger, så der dannes en grundtone og en række overtoner.
I et par årtier har Mads Græsbøll Christensen arbejdet på at finde grundfrekvensen i de periodiske signaler, som vokallyde er tæt på at udgøre i korte intervaller.
»Vi har udviklet nogle af de mest støjrobuste og præcise metoder til at estimere grundfrekvensen. Det er ikke nemt, for stemmens toneleje er aldrig helt konstant, og baggrundsstøj forurener signalet,« siger han.
Grundfrekvensestimatorer bruges mange forskellige steder, for eksempel i mobiltelefoner, hvor de anvendes til effektiv komprimering og transmittering af talen, så den kan genskabes ud fra meget lidt data.
Når lyden har forladt strubehovedet, formes den af svælget, mundhulen og de nasale hulrum, der fungerer som resonansrum, der giver stemmen sin klang. Og så kan tunge, den bløde del af ganen og læberne hjælpe til med at danne alle de forskellige lyde, der kan komme ud af munden.
På Aalborg Universitet har forskerne opstillet en matematisk model for talekanalen kaldet Sparse Linear Prediction for Speech Processing, og den kan bringe dem tættere på at forstå, hvordan tale dannes og påvirkes af forskellige faktorer som alder, sygdom, rygning eller alkohol. Mange har nok også oplevet at vågne med en rusten stemme efter en festlig aften, og det er alt sammen noget, som modellerne kan hjælpe med at forklare.
»Hvis vi kombinerer vores model af talekanalen med grundfrekvensestimatorerne, så har vi karakteriseret to meget væsentlige dele af talesignalet, nemlig grundfrekvensen og det filter, der former talen og de lyde, vi siger,« fortæller Mads Græs-bøll Christensen og fortsætter:
»Det er matematiske metoder, som vi kan overføre til fysiske fænomener, og så har vi værktøjerne til at kunne fange små nuancer i talesignalerne, såsom ændringer grundet helbred.«
I første omgang fokuserer forskeren på Parkinsons sygdom, men på lidt længere sigt kan diagnosticering af andre sygdommen via talen komme i spil, og modellerne kan også bruges mere bredt til at finde ud af, hvad man kan sige om folk ud fra stemmen alene. Måske endda blot på baggrund af et ”AAAAH!". ♦