7 vinkkiä biosignaalien esikäsittelyyn: kuinka parantaa Deep Learning -luokittelijan tukevuutta

Miksi melujen ja vääristymien käsitteleminen on niin tärkeää

Tyypillisesti mitä tahansa biosignaaleihin liittyvää luokitustehtävää (epänormaalisuuden havaitseminen), kuten elektrokardiografia (EKG), elektroenkefalografia (EEG), sähköomografia (EMG) jne., Voidaan pitää aikasarjojen tunnistusongelmana.

Karush – Kuhn – Tucker -olosuhteiden mukaan tulosignaalien tulisi sopia paikallaisuuden kriteereihin. Tulosignaalien kuvioiden on oltava yksinkertaisesti samoja tai samanlaisia ​​kuin harjoitusjoukossa muuttamatta signaalin jakautumista ajan kuluessa.

Yleensä kaikki biosignaalien tallennukset altistuvat paljon ääniä. Nämä vääristymät lisäävät malliin lisävarianssia, koska ne rikkovat paikallaan pitämisen kriteerejä.

Näillä meluilla voi olla erilainen luonne ja tarkempia tietoja löydät täältä ja täältä. Nämä artikkelit kuvaavat EKG-ääniä, mutta sitä voidaan soveltaa myös kaikkiin biosignaaleihin.

Tämä tarkoittaa, että DL-luokittelijasi yleinen suorituskyky määräytyy esikäsittelytekniikoiden tehokkuuden avulla.

Katsotaanpa, kuinka käytännössä on mahdollista parantaa syvän oppimisen mallin kestävyyttä esikäsittelyllä.

1. 50% tehokkaasta digitaalisen signaalin käsittelystä on tehokasta analogista prosessointia

Mikä tahansa digitaalinen signaalinkäsittely alkaa tehokkaalla analogisen signaalin käsittelyllä. Yleisin virhe liittyy alias-ongelmaan.

Nyquist-lauseen mukaan ADC: n näytteenottotaajuuden tulisi olla 2 kertaa suurempi kuin tulosignaalin korkein taajuus. Mitkään signaalit eivät sovi tähän kriteerialiaaseen päätaajuusalueeseen ja peittävät hyödyllisen signaalin lisämeluina:

Tämän ongelman estämiseksi käytetään analogista alipäästösuotinta ennen ADC: tä. Laitteistoinsinöörit katsovat usein yksinkertaisen RC-piirin riittävän tätä tarkoitusta varten. Mutta täydellisen alipäästösuotimen ja todellisen välillä on valtava ero taajuusvasteessa:

Koostuu ideaali (vasen) ja todellinen (vasen) analogisten suodattimien taajuusominaisuuksista

Varmista, että Inti-Aliasing LPF täyttää Nyquist-taajuuden vaimennusvaatimukset (Lisätietoja, suosittelen tätä kirjaa):

  • 50 dB 8-bittiselle ADC: lle
  • 62 dB 10-bittiselle ADC: lle
  • 74dB 12-bittiselle ADC: lle
  • 98dB 16-bittiselle ADC: lle

2. Käytä samaa laitteistoa koulutukseen ja ennusteisiin

Eri laitteet määrittelevät erilaiset signaalin tallennusolosuhteet, kuten elektroniikan epälineaariset vääristymät, erilaiset kotelot, anturien erilainen sijainti jne.

Koska erilaiset olosuhteet määrittelevät eri signaalit, suosittelen käyttämään samaa laitteistoa harjoitusmallin ja ennusteiden tekemiseen. Se voi olla syy lisäharjoitteluun harjoitussarjassa.

Jos vaihtoehtoja ei ole, on mahdollista kokeilla harjoitusjoukon vääristymiä, mutta se vaatii lisäosaamista laitteisto- ja ääni-alueista.

3. Nyquist-lause harjoittelun nopeuttamiseksi

Kuten yllä on kuvattu, Nyquist-lause määrittelee ADC: n miniminäytetaajuuden 100%: n tallentamiseksi analogisen signaalin tiedoista muuntamisen jälkeen. Tämä tarkoittaa, että jos signaalin maksimitaajuus on alempi kuin Fs / 2, siinä on redundanssi, jota voidaan käyttää nopeuttamaan syvän verkon harjoittelua.

Tarkastellaan esimerkkiä.

On olemassa EKG-signaali näytteenottotaajuudella 125 Hz, jonka tarjoaa Physionet-tietokanta (30 Hz -suodatinta käytettiin):

Kärki EKG-esikäsittelylle: EKG-signaalit allokoivat 0–100 Hz, mutta 30 Hz: n alipäästösuodatinta voidaan käyttää. Se pitää P- ja T-aallot koskemattomina, mutta se vähentää R-piikin amplitudia 20-30%. Se ei ole kriittinen poikkeavuuksien havaitsemiseksi ja sykelaskentaan.

Signaalin tehonspektritiheys näyttää seuraavalta:

Kuten yllä on esitetty, pääosa signaalin energiasta on keskittynyt välille 0–30 Hz. Lasketaan se 80Hz: ksi ja vertaa sitä alkuperäiseen signaaliin:

Desimaation vaikutuksen osoittaminen: signaali näytteenottotaajuudella 80Hz (ylempi) ja 125Hz (alempi)

Alkuperäinen muoto säilytetään, mutta signaalin kokonaispituus pienenee 35%, 92: sta 59: een näytteeseen. Se vastaa harjoittelun kiihtyvyyttä 35% ilman tarkkuuden menettämistä.

Tämän lähestymistavan tehokkuuden osoittaminen on osoitettu Github-projektissani.

Tärkeä huomautus: varmista, että desimaatiosi ei menetä ylimääräisiä tietoja, joita voidaan käyttää tunnistukseen. Kokeilu on ainoa tapa todistaa. Mutta käytännössä kahden pinotun (CNN + LSTM) mallin kouluttaminen alinäytteistetyistä signaaleista on yleensä nopeampaa kuin yhden mallin kouluttaminen alkuperäisellä näytteenottotaajuudella menettämättä suorituskykyä.

4. Ymmärrä järjestelmän vaatimukset

Ennen kuin kokeilet monimutkaisempia suodatusalgoritmeja, kuten Wavelette tai adoptiivinen, suosittelen ymmärtämään, mitkä ominaisuudet tunnistamiseen vaaditaan.

Tässä on esimerkki.

Harkitaan syvän oppimisen mallin tehtävää rytmihäiriöiden havaitsemista kävellessä. Tyypillisesti EKG-kävelytiedot sisältävät matalataajuista kohinaa:

Samaan aikaan selkeä EKG-signaali näyttää tältä:

P- ja T-aallot ovat naamioituneet, ja sen purkaminen on melko ei-triviaalinen tehtävä. Ennen kuin yrität kehittää monimutkaisia ​​algoritmeja, katsotaanpa mikä on rytmihäiriö todella:

Rytmihäiriöiden havaitsemiseksi riittää vain pulssien laskeminen tehokkaan ilmaisimen rakentamiseksi, mutta ilmeisesti matalataajuisten lähtöviivojen vaeltaminen lisää ylimääräisen lajikkeen rikkoen liikkumattomuutta.

EKG: n eri osat voivat allokoida erilaisia ​​taajuusalueita:

Yksinkertaisesti, yksinkertainen 5–15 Hz: n kaistanpäästösuodatin ratkaisee uuttavat R-piikit. Suodatinta käytettäessä P- ja T-aallot vaimennetaan (ja siihen liittyviä poikkeavuuksia ei ole saatavana tunnistettavaksi), mutta järjestelmävaatimukset täyttyvät.

Pääsääntö: koska enemmän algoritmeja on monimutkaisia, sitä vähemmän ne ovat kestäviä ja vaativat enemmän resursseja toteuttamiseen (sekä aikaa että rahaa). Yksinkertaisin digitaalinen suodatus tulisi olla ensimmäinen asia, joka sinun täytyy yrittää.

5. Käytä MiniMax-periaatetta putkistojen kehittämisessä

MiniMax-periaate on upea strategia peliteoriasta.

Biosignaalien pääongelma on signaalien laadun muuttuminen ajan myötä:

  • Tapaus 1. Korkea laatu kohteen heikon toiminnan aikana:
  • Tapaus 2. Tietojen heikko laatu intensiivisen liikkumisen aikana. P ja T ovat naamioituja, eikä niitä ole mahdollista erottaa melusta 1-kanavaisella järjestelmällä:

Ensimmäisessä tapauksessa P, QRS, T ovat havaittavissa, se tarkoittaa, että suurin osa epänormaaleista EKG-malleista (sydänkohtaus, eteisvärinä jne.) Voidaan tunnistaa.

Toisessa tapauksessa vain jotkut QRS: ään liittyvät rytmihäiriöt (rytmihäiriöt jne.) Tunnistettiin.

Kuten yllä on osoitettu, paras tapa purkaa QRS on käyttää 5–15 Hz: n kaistanpäästösuodatinta, kun taas P ja T vaimennetaan.

Tapauksessa 2 se ei ole kriittinen, koska kohina peittää P: n ja T: n, mutta se rajoittaa mahdollisten havaittujen patologioiden määrää, kun tulossa on korkealaatuista tietoa.

Paras tapa välttää tämä ongelma on käyttää adaptiivista suodatinta, joka muuttaa sen impulssivasteen muuttuvaan ympäristöön:

Idea on yksinkertainen:

  1. Tee tiedonlaadun ilmaisin (lineaariset ilmaisimet / CNN);
  2. Määritä suodatinjoukko;
  3. Tee sääntö impulssivasteen muuttamisesta tulosignaalin laadun mukaan.

6. Älykäs tapa käyttää ylipäästösuotimia

Yleensä vaaditaan ylipäästösuodatus käsitellessään lähtötilanteen vaeltamista:

EEG lähtötason kohinalla

Ilmeisessä lähestymistavassa harkitaan ylipäästösuodattimen käyttöä. Tärkein rajoite tähän on erittäin matala rajataajuus (0,05 Hz) ja korkea stop-kaistan vaimennus (> 30 dB). Vaatimusten täyttämiseksi suodattimella on oltava korkea järjestys, mikä tarkoittaa pitkää viivettä, mikä ei välttämättä sovellu reaaliaikaisiin sovelluksiin.

Vaihtoehtoinen tapa:

  • Tulosignaalin hävittäminen;
  • Poista perustaso melusta käyttämällä alipäästösuotinta 0,05 Hz: n raja-taajuudella;
  • Interpoloi signaali;
  • Vähennä perustaso alkuperäisestä signaalista

Koodiesimerkki (Matlab) on saatavana tässä GitHub-arkistossa.

7. Iteratiivinen kokeilu

Kuten mikä tahansa tietotekniikan ongelma, biosignaalien luokittelu on iteratiivinen kokeellinen prosessi, koska erilaiset suodatustavat voivat olla sopivia eri sovelluksiin.

Olen tehnyt tiivistelmän luettelosta suodatustekniikoista luotettavimmista pahimpiin.

HUOMAUTUS: Se on vain henkilökohtainen mielipiteeni, se ei voi olla sama kuin sinun mielipiteesi.

  • Digitaalinen suodatus (FIR, IIR). FIR suositellaan, koska ryhmäviivevääristymiä ei ole. Sen suorituskyky on kohtuullinen, ihanteellisesti epäspesifisiin olosuhteisiin, erittäin helppo toteuttaa ja 100% kestävä.
  • Wavelet-suodatus. Vahva suorituskyky, mutta toteutus voi olla monimutkainen parametrien valinnan suhteen.
  • Adaptiivinen suodatus. Tämä menetelmä osoittaa huonompaa suorituskykyä kuin Wavelet-suodatus, mutta se on paljon yksinkertaisempi toteuttaa hyvällä ketteryydellä ja suorituskyvyllä.
  • Riippumaton komponenttianalyysi (ICA) / Blind Source Separation (BSS). Nopean ICA-algoritmin toteutus suosituimmissa ohjelmointikielissä on täällä. Suosittelen sitä kokeilemaan viimeksi, koska:
  1. Se toimii vain monikanavakokoonpanoissa;
  2. Pidän tämän lähestymistavan kestävyyttä erittäin heikkona, koska lähentymistä ei taata;
  3. Se vaatii suhteellisen enemmän laskentaresursseja, ei ehkä sovellu reaaliaikaisiin sovelluksiin.

___________________________________________________________________

Löysitkö paperista hyödyllisen? Jätä kommenttisi tämän linkin kautta

___________________________________________________________________

Dmitrii Shubin, tutkimus- ja kehitysinsinööri, lääketieteelliset laitteet

Toronto, ON, Kanada

Yhteystiedot:

Sähköposti: [email protected]

LinkedIn, GitHub