Cardiologistas treinados detectam fibrilação atrial por interpretação visual de certos segmentos das linhas do eletrocardiograma (ECG) conhecido como complexo QRS. Da mesma forma, o software de ECG disponível também avalia anomalias nos sinais dos eletrocardiogramas que produzem os traços/linhas para sinalizar a fibrilação atrial. Nós e outros já demonstramos anteriormente que métodos de aprendizagem de máquinas identificam com sucesso pacientes com fibrilação atrial paroxística (PAF) com base no seu ECG durante o ritmo sinusal normal. Neste trabalho, nós vamos além das abordagens anteriores da caixa preta e identificamos padrões específicos no complexo QRS de um ritmo sinusal normal que estão associados à fibrilação atrial. Implementamos mineração frequente de padrões em dados de eletrocardiograma em forma de onda discretizada para determinar padrões que são específicos para pacientes com PAF com base em registros de eletrocardiograma de 1 minuto de chumbo 1 amostrados a 128 Hz de 25 pacientes com PAF e 50 sujeitos saudáveis de um repositório de dados Physionet. Descrevemos os traços de eletrocardiograma com amostra baixa (16 Hz) com sete símbolos correspondentes a vários graus de variabilidade local dentro dos traços e selecionamos entre os 1.306 padrões únicos de 4 símbolos existentes os 850 padrões que ocorrem pelo menos 5 vezes (para mitigar problemas relacionados à esparsidade). A matriz de freqüência do padrão 75×850 resultante representou a freqüência de cada padrão dentro de cada um dos 75 pacientes e sujeitos de PAF foram distinguidos com base em uma regressão binária de Retracção Menos Absoluta e Operador de Seleção com validação cruzada de 5 vezes que selecionou 50 dos padrões (AUC = 0,95; 95% C.I. 0,88-1,00; 94% de especificidade, 88% de sensibilidade). Estes 50 padrões são candidatos para obter a “impressão digital” da PAF dentro do ritmo sinusal normal: por exemplo, um dos padrões selecionados na Figura 1 foi observado em 76% dos pacientes com PAF, enquanto estava presente apenas em 30% dos pacientes saudáveis. Nosso estudo é uma prova de conceito de que a aprendizagem de máquinas e técnicas de inteligência artificial não estão restritas a abordagens de caixa negra e podem ser usadas para derivar insights interpretáveis que poderiam levar a novos biomarcadores associados a certas condições de saúde.