Převod automatu na regulární výraz

Kapitoly: Regulární výrazy, Převod reguláru na automat, Zobecněný NKA, Převod automat na regulár

Ukážeme si, jak převést libovolný konečný automat na regulární výraz.

Popis algoritmu

Na vstupu máme nějaký NKA A. Jako první z něj uděláme ZNKA. V druhé fázi vždy v jednom kroku odstraníme jeden stav, správně pozměníme přechodové funkce a opakujeme, dokud nezbydou jen dva stavy — počáteční a koncový. Mezi nimi povede hrana, která bude jako popisek regulární výraz, který bude výsledkem celého algoritmu. Celý postup tak spočívá především v odstranění stavu a následné opravě automatu tak, abychom získali ekvivalentní automat.

Odstranění jednoho stavu

Jak odstranit jeden stav si můžeme znázornit na jednoduchém příkladu. Předpokládejme, že část našeho automatu vypadá takto:

kde R_i jsou nějaké regulární výrazy. Jak by vypadal automat, kdybychom odstranili stav q_r? Můžeme si to představit tak, že jsme ve stavu q_i a ptáme se, jaká všechna slova jsme schopni na tomto úseku vygenerovat? Pokud půjdeme ze stavu q_i přímo do stavu q_j, budou to všechna slova, která odpovídají regulárnímu výrazu R₄.

Pokud ale půjdeme do stavu q_r, tak můžeme vygenerovat slova tvaru R₁. Ve stavu q_r ale můžeme cyklit pro regulární výraz R₂, takže vlastně můžeme vygenerovat slova tvaru $R_1\circ(R_2^\ast)$. No a protože se ještě můžeme dostat ze stavu q_r do stavu q_j, tak tam ještě přidáme regulární výraz R₃. Celkově tak touto cestou můžeme získat slova tvaru $R_1\circ(R_2^\ast)\circ R_3$.

Nyní víme, že z této části automatu mohou vzniknout slova tvaru R₄ nebo tvaru $R_1\circ(R_2^\ast)\circ R_3$. To samozřejmě můžeme napsat ve tvaru regulárního výrazu jako $(R_4)|(R_1\circ(R_2^\ast)\circ R_3)$.

Nyní už můžeme jednoduše odstranit stav q_r a nechat jen dva stavy q_i a q_j a namísto R₄ napíšeme právě vypočtený regulární výraz:

Tento postup provedeme s každou hranou z každého stavu q_i do nějakého stavu q_j a to včetně smyček, tj. včetně případu, kdy q_i = q_j.

Po odstranění jednoho stavu získáme ekvivalentní automat — automat, který rozpoznává stejný jazyk.

Celý algoritmus

Na vstupu máme NKA $A=\left<Q, \Sigma, \delta, q_0, F\right>$.

Převedeme NKA A na ZNKA $Z=\left<Q^\prime, \Sigma, \delta^\prime, q_0^\prime, q_f^\prime\right>$. Dále budeme písmenem k označovat počet stavů v Z.
Pokud k = 2, algoritmus končí a na hraně mezi počátečním a koncovým stavem je výsledný regulární výraz.
Pokud k>2, vybereme libovolný stav q_r, který je různý od počátečního a koncového stavu, tj. $q_r\ne q_0^\prime$ a $q_r\ne q_f^\prime$. Dále vytvoříme nový ZNKA $Z^\prime=\left<Q^{\prime\prime}, \Sigma, \delta^{\prime\prime},q_0^{\prime},q_f^{\prime}\right>$, pro který bude platit: $$ Q^{\prime\prime}=Q^\prime\setminus\left\{q_r\right\} $$ a pro všechny $q_i\in Q^{\prime\prime}\setminus\left\{q_f^\prime\right\}$ a pro všechny $q_j\in Q^{\prime\prime}\setminus \left\{q_0^\prime\right\}$ nechť $$ \delta^{\prime\prime}(q_i, q_j)=(R_4)|(R_1(R_2^\ast)R_3), $$ kde $R_1=\delta^\prime(q_i,q_r)$, $R_2=\delta^\prime(q_r,q_r)$, $R_3=\delta^\prime(q_r, q_j)$, $R_4=\delta^\prime(q_i, q_j)$. Dále pokračuj krokem 2.

Příklad

Mějme na vstupu tento konečný automat:

Jako první jej převedeme na ZNKA (zbytečné ∅-přechody nebudeme znázorňovat):

Nyní aplikujeme druhou část algoritmu a odstraníme nějaký uzel. Začneme s uzlem q₂. Odstraníme uzel q₂ a přidáme přechod ze stavu q₁ do stavu q_f. Tento přechod označíme jako $b(a|b)^\ast$, protože z uzlu q₁ se dostaneme do stavu q₂ pro slova tvaru b, pak můžeme cyklit pro a|b, tím získáme $(a|b)^\ast$ a nakonec se pomocí epsilon pravidla přesuneme do q_f. Přitom platí, že $b(a|b)^\ast\epsilon=b(a|b)^\ast$. Dostaneme automat:

Zbývá nám odstranit poslední stav, q₁. Přidáme hranu ze stavu q_s do stavu q_f. Jak ji označíme? Do stavu q₁ se dostaneme přes epsilon pravidlo, to můžeme rovnou vypustit. Pak můžeme cyklit pro a, takže získáme regulární výraz $a^\ast$. No a nakonec se přes hranu dostaneme do q_f, takže výraz ještě zřetězíme s $b(a|b)^\ast$. Hranu tak popíšeme regulárním výrazem $a^\ast b(a|b)^\ast$.

Automat už má jen dva stavy, takže algoritmus končí. Na hraně je výsledný regulární výraz.

Zdroje

Příklad a popis algoritmu pochází z M. Sipser: Introduction to the Theory of Computation

« Předchozí: Zobecněný NKA

Další: Odhad unikátních hodnot »