X

Python: Алгоритм Кнута–Морриса-Пратта (алгоритм поиска подстроки в строке)

Алгоритм Кнута-Морриса-Пратта, основанный на использовании префикс-функции. Как и в примитивном алгоритме поиска подстроки, образец «перемещается» по строке слева направо с целью обнаружения совпадения. Однако ключевым отличием является то, что при помощи префикс-функции мы можем избежать заведомо бесполезных сдвигов.

Пусть S[0..m–1] – образец, T[0..n–1] – строка, в которой ведется поиск. Рассмотрим сравнение строк на позиции i, то есть образец S[0..m–1] сопоставляется с частью строки T[i..i+m–1]. Предположим, первое несовпадение произошло между символами S[j] и T[i+j], где i

  • Построить префикс-функцию образца S, обозначим ее F.
  • Положить k = 0, i = 0.
  • Сравнить символы S[k] и T[i]. Если символы равны, увеличить k на 1. Если при этом k стало равно длине образца, то вхождение образца S в строку T найдено, индекс вхождения равен i – |S| + 1. Алгоритм завершается. Если символы не равны, используем префикс-функцию для оптимизации сдвигов. Пока k > 0, присвоим k = F[k–1] и перейдем в начало шага 3.
  • Пока i

    Возможная реализация алгоритма Кнута-Морриса-Пратта на языке Python выглядит так:

    Источник: habrahabr.ru/post/191454/

  • This post was last modified on 27.11.2017 22:03

    Artem: Аудит, Разработка, ИБ, Поддержка и SEO сайтов
    Related Post