A képzett kardiológusok a pitvarfibrillációt az elektrokardiogram (EKG) vonalainak bizonyos szegmenseinek, az úgynevezett QRS-komplexumnak a vizuális értelmezésével észlelik. Hasonlóképpen, a rendelkezésre álló EKG-szoftverek is értékelik a nyomvonalakat/vonalakat eredményező EKG-vezetékek jeleinek rendellenességeit, hogy jelezzék a pitvarfibrillációt. Mi és mások korábban kimutattuk, hogy a gépi tanulási módszerek sikeresen azonosítják a paroxizmális pitvarfibrillációban (PAF) szenvedő betegeket a normál szinuszritmusban lévő EKG-juk alapján. Ebben a munkában túllépünk a korábbi fekete dobozos megközelítéseken, és a normális szinuszritmus QRS-komplexumában olyan specifikus mintázatokat azonosítunk, amelyek pitvarfibrillációhoz társulnak. Gyakori mintázatbányászatot hajtottunk végre diszkretizált hullámformájú nyers EKG-adatokon, hogy meghatározzuk a PAF-betegekre jellemző mintákat 25 PAF-beteg és 50 egészséges személy 128 Hz-en mintavételezett 1 perces Lead 1 EKG-felvételei alapján, amelyek egy Physionet-adattárból származnak. A lemintavételezett (16 Hz) EKG-nyomokat hét szimbólummal diszkretizáltuk, amelyek a nyomvonalakon belüli helyi variabilitás különböző fokainak felelnek meg, és a meglévő 1330 egyedi, 4 szimbólumot tartalmazó mintából kiválasztottuk azt a 850 mintát, amelyek legalább 5 alkalommal fordulnak elő (a ritkasággal kapcsolatos problémák enyhítése érdekében). Az így kapott 75×850 minta gyakorisági mátrix az egyes minták gyakoriságát reprezentálta a 75 beteg mindegyikén belül, és a PAF alanyokat egy bináris Least Absolute Shrinkage and Selection Operator regresszió alapján különböztették meg, ötszörös keresztvalidálással, amely 50 mintát választott ki (AUC = 0,95; 95% C.I. 0,88-1,00; 94% specificitás, 88% érzékenység). Ez az 50 minta alkalmas arra, hogy a PAF “ujjlenyomatát” a normális szinuszritmuson belül kiválassza: pl. az 1. ábrán látható kiválasztott minták egyike a PAF-betegek 76%-ánál volt megfigyelhető, míg az egészséges betegeknek csak 30%-ánál volt jelen. Tanulmányunk azt bizonyítja, hogy a gépi tanulás és a mesterséges intelligencia technikái nem korlátozódnak a fekete dobozos megközelítésekre, és felhasználhatók olyan értelmezhető meglátások levezetésére, amelyek bizonyos egészségi állapotokhoz kapcsolódó új biomarkerekhez vezethetnek.