Для преобразования строк из одной кодировки в другую предназначена функция convert_cyr_string ():
Функция convert_cyr_string преобразует строку str из кодировки from в кодировку to. Значения аргументов from и to— одиночные символы, определяющие кодировку:
k —KOI8-R;
w —Windows-1251;
i — IS08859-5;
Для преобразования кодировок многобайтовых строк предназначена функция mb_convert_encoding().
Функция возвращает строку str, преобразованную из кодировки from- encoding в кодировку to-encoding.
Функция parse_url() позволяет разбить адрес на отдельные компоненты:
Функция parse_url() обрабатывает URL , переданный строкой url, и возвращает его компоненты. Массив, возвращаемый функцией, включает множество различных существующих компонентов URL: "scheme", "host", "port", "user", "pass", "path", "query" и "fragment".
Для разбора строки с параметрами ("query") имеется специальная функция parse_str():
void parse_str(string str [, array arr])
Функция parse_str() интерпретирует строку str так, как если бы эта строка содержала в себе переменные и их значения и передавалась бы в URL. Если задан второй необязательный параметр аrr, то значения, найденные при помощи этой функции, сохраняются не в глобальных переменных, а в элементах указанного массива.
Согласно спецификации RFC 1738 в URL не допускается использование пробелов, а также символов национальных алфавитов, поэтому для передачи русских слов через строку запроса URL или значение параметра следует преобразовать в безопасный режим при помощи функции urlencode():
Функция urlencode о возвращает строку , в которой все не алфавитно-цифровые символы, за исключением дефиса, знака подчеркивания и точки заменены знаком процента (%), за которым следуют две шестнадцатеричные цифры, обозначающие код символа.