Синтаксический анализ представляет собой разбиение единого целого на компоненты, обычно целого предложения на отдельные слова. В качестве первого шага по преобразованию вашего сценария в HTML-документ PHP делает синтаксический анализ. После этого наступает момент выборки или проверки данных из строки. Это может быть достаточно просто, как при обработке списка слов, разделенных пробелами, или достаточно сложно, когда речь идет о строке, с помощью которой браузер идентифицирует себя на Web-сервере. Одним из решений может быть пометка строки с разбиением ее на части, но можно прибегнуть и к помощи регулярных выражений. В этой главе мы рассмотрим возможности PHP по синтаксическому анализу и оценке строк.
22.1. Пометка строк
Для пометки строк PHP применяет простую модель, а именно: определенные символы считаются разделителями, а символические строки, расположенные между разделителями, - маркерами. Набор разделителей можно менять по мере выборки маркеров из строки, что просто незаменимо при обработке "неправильных" строк, т.е. таких, которые нельзя отнести к строкам, разделенным запятыми.
В листинге 22.1 принимается предложение и разбивается с помощью функции strtok (см. главу 12, "Кодирование и декодирование") на слова. Если речь идет о сценарии, слово завершается пробелом, знаками пунктуации или символом "конец строки". Одинарные или двойные кавычки считаются частью слова. Результат работы сценария показан на рис. 22.1.
Листинг 22.1. Пометка строк
<?php /*
** Если предложение завершено, проанализировать его */
if(isset($_REQUEST['sentence'])) {
$total=0;
print("<b>Полученный текст:</b>"); print("{$_REQUEST['sentence']}<br>n<br>n"); //задать символы, разделяющие маркеры $separators = " ,!.?",-//получить маркеры
for($token = strtok($_REQUEST['sentence'], $separators); $token !== FALSE; $token = strtok($separators))
{
// Пропустить пустые маркеры
if($token != "")
{
// сосчитать слова
if(!isset($word_count[strtolower($token)]))
{
$word_count[strtolower($token)]=1;
}
else
{
$word_count[strtolower($token)]++;
}
$total++;
}
}
//сначала отсортировать по словам
ksort($word_count);
//затем отсортировать по частоте
arsort($word_count);
print("<b>Найдено $total слов </b>n"); print("<ul>n");
foreach($word_count as $key=>$value)
{
print("<li>$key ($value)</li>n");
}
print("</ul>n");
}
print("<form action="{$_SERVER['PHP_SELF']}" " .
"method="post">n");
print("<input name="sentence" size="40">n"); print("<input type="submit" value="Parse">n"); print("</form>n");
?>
Обратите внимание на использование в этом примере цикла for. Вместо наращивания счетчика он принимает поочередно маркеры. Когда функция strtok достигает конца вводимой информации, она возвращает значение FALSE. Первым намерением может быть проверить значение FALSE в цикле for с помощью оператора !=. Напомним, что пустая строка считается эквивалентной значению FALSE. Если два разделителя следуют друг за другом, то, как можно ожидать, функция strtok возвратит пустую строку. Так как останавливать разбивку на маркеры после каждого повторяющегося оператора в наши планы не входит, выполним проверку значения FALSE с помощью оператора !==.
Использование функции strtok целесообразно только в самых простых и структурированных случаях. Примером такой ситуации является чтение текстового файла, разделенного символами табуляции. Алгоритм может заключаться в следующем: выборка маркеров из строки с использованием в качестве пробела символа табуляции, а затем - выборка следующей строки из файла.
ТОП-10 популярных
Для работы с вещественными числами в MySQL предусмотрено три типа данных - это типы FLOAT, DOUBLE, DECIMAL. Числовой тип FLOAT...
БОЛЬШЕ БОЛЬШИХ LCD-мониторов
Процесс вытеснения с рынка мониторов с электронно-лучевой трубкой (CRT) продолжается. О смещении акцентов в пользу LCD-мониторов теперь заявляют даже те...
Процесс вытеснения с рынка мониторов с электронно-лучевой трубкой (CRT) продолжается. О смещении акцентов в пользу LCD-мониторов теперь заявляют даже те...
Больше больших LCD-мониторов
Процесс вытеснения с рынка мониторов с электронно-лучевой трубкой (CRT) продолжается. О смещении акцентов в пользу LCD-мониторов теперь заявляют даже те...
Процесс вытеснения с рынка мониторов с электронно-лучевой трубкой (CRT) продолжается. О смещении акцентов в пользу LCD-мониторов теперь заявляют даже те...
НОУТБУК с блестящим экраном
Eсли выпустившая ноутбук фирма предлагает его в качестве «замены настольному ПК», то это должно подразумевать под собой нечто большее, чем...
Eсли выпустившая ноутбук фирма предлагает его в качестве «замены настольному ПК», то это должно подразумевать под собой нечто большее, чем...
Иди и пиши. TravelMate C100
Планшетный компьютер платформы Tablet PC обязан в первую очередь быть легким, способным достаточно долго работать без подзарядки батарей. Эти требования...
Планшетный компьютер платформы Tablet PC обязан в первую очередь быть легким, способным достаточно долго работать без подзарядки батарей. Эти требования...
Магнито-оптический дисковод DynaMO
Cейчас, когда традиционные флоппи-дисководы на долгие годы замерли в своем развитии, поиск альтернативных носителей продолжается, и ситуация, казалось бы, разрешилась...
Cейчас, когда традиционные флоппи-дисководы на долгие годы замерли в своем развитии, поиск альтернативных носителей продолжается, и ситуация, казалось бы, разрешилась...
Компьютер для гурманов.«Эксимер ДМ»
Российская компания «Эксимер ДМ», известная как производитель настольных компьютеров, рабочих станций, серверов и ноутбуков, выступила техническим спонсором проведения торжеств, посвященных...
Российская компания «Эксимер ДМ», известная как производитель настольных компьютеров, рабочих станций, серверов и ноутбуков, выступила техническим спонсором проведения торжеств, посвященных...
Для длинных строк, т.е. строк длиннее 255 символов, в MySQL предусмотрены типы BLOB (Binary Large Object, большой двоичный объект) и...
В дополнение к календарным типам, предназначенным для хранения даты и времени отдельно, MySQL также поддерживает гибридные типы данных DATETIME и...
Вообще, к изменению настроек сервера прибегают очень редко. В MySQL программа заранее настроена так, чтобы соответствовать самым распространенным и основным...
PHP. Синтаксический анализ и обработка строк
23-05-2015
<< Предыдущая статья | Следующая статья >> |
PHP. Сортировка, поиск и случайные числа. Часть Шестая. | PHP. Синтаксический анализ и обработка строк. Часть Вторая. |