Teoria percepcyjnej pętli monitorowania mowy (Levelt, 1983) twierdzi, że wewnętrzna i jawna mowa są monitorowane przez system rozumienia, który wykrywa błędy poprzez porównywanie rozumienia sformułowanych wypowiedzi z wypowiedziami pierwotnie zamierzonymi. Aby przetestować monitor pętli percepcyjnej, mówcy nazywali obrazki i czasami próbowali zatrzymać mowę w odpowiedzi na słuchowe (Doświadczenie 1 i 3) lub wzrokowe (Doświadczenie 2, 4 i 5) słowa, które różniły się od nazwy obrazka. Słowa te były zróżnicowane pod względem ich semantycznego lub fonologicznego podobieństwa do zamierzonego słowa. Zdolność do powstrzymywania produkcji słów była wrażliwa na podobieństwo fonologiczne i, w Eksperymencie 5, na walencję emocjonalną, ale nie na podobieństwo semantyczne. Wyniki te sugerują, że pętla percepcyjna wykrywa błędy poprzez dokonywanie porównań na poziomie, na którym reprezentowana jest wiedza fonologiczna. Dane te sugerują również, że dialog, back channeling i inne obszary, w których produkcja mowy jest dotknięta przez jednoczesne rozumienie, mogą działać w oparciu o porównania fonologiczne.