Текст программы на языке Турбо Паскаль представляет собой последовательность предложений, состоящих из символов, образующих алфавит языка. Максимальная длина предложения 126 символов, рекомендуемая длина — 70 символов.
Алфавит языка Турбо Паскаль включает следующие символы:
1. Латинские прописные и строчные буквы A-Z; a-z; и символ _ «подчерк» (код ASCII 95), которые используются для формирования имен переменных (идентификаторов) и служебных слов.
2. Арабские цифры: 0—9 — для записи чисел и идентификаторов.
в) прочие: | [ | ] | — квадратные скобки для обозначения массивов и множеств; | { } | — фигурные скобки для записи комментариев; |_| — для разделения лексем; | ' | — апостроф для записи констант символьного и текстового типов; ½ $ | — для записи шестнадцатеричных констант и директив компилятора; # — для записи символа, не имеющего графического представления в ASCII-кодах (по его коду); | @ | — обозначение адреса переменной, типизированной константы, подпрограммы, метода; | ^ | — обозначение типа-указателя, значения величины по ее указателю или управляющего символа с кодами от 0 до 31.
Лексическая структура программы на Турбо Паскале состоит из последовательности лексем — минимальных единиц языка, имеющих самостоятельный смысл. Лексемы делятся на несколько следующих классов:
1. Ключевые (служебные, зарезервированные) слова. Всего 51 слово, в редакторе интегрированной среды Турбо Паскаль изображаются белым цветом:
ARRAY — «массив», BEGIN — «начало», CASE — «вариант», CONST — «константа», DO — «исполнять», DOWNTO— «уменьшать на единицу параметр цикла», ELSE — «иначе», END — «конец», FILE — «файл», FOR — «для», FUNCTION — «функция», GOTO — «переход к метке», IF — «если», IN — «принадлежность к множеству», LABEL— «метка», OF — «из», PROCEDURE — «процедура», PROGRAM — «начало программы», RECORD — «запись», REPEAT — «повторить», SET — «множество», THEN — «то», ТО — «увеличение на единицу параметра цикла», TYPE — «тип», UNTIL — «до», VAR — «переменная», WHILE — «пока», WITH — «с» и др.
2. Идентификаторы (изображаются желтым цветом) могут быть двух разновидностей:
а) имена, которые программист присваивает какой-либо переменной, константе, типу, метке, процедуре или функции (здесь нельзя использовать ключевые слова);
б) стандартные идентификаторы, которые являются именами встроенных в язык процедур и функций. Компилятор воспринимает 63 символа. Идентификатор должен начинаться с буквы, может содержать цифры и знак подчеркивания.
3. Знаки операций:ç := | + | - | * | / | <> ç = ç <= ç < ç > ç >= ç; DIV — деление нацело с отбрасыванием остатка, MOD — нахождение остатка от деления нацело, AND — логическое умножение (И), NOT — логическое отрицание (НЕ), OR — логическое сложение (ИЛИ).
4. Константы – это данные, значения которых не изменяются в процессе выполнения программы. В языке используются константы следующих видов:
а) числовые целые - десятичные числа, которые записываются в виде последовательности десятичных цифр, возможно, со знаком, например 158, -15, 234556 или шестнадцатеричные, которые представляются последовательностью шестнадцатеричных цифр с предшествующим символом ‘$’, например $24A5;
б) числовые вещественные. Они имеют две формы: вещественные с фиксированной точкой, где дробную часть числа от целой отделяет точка, а не запятая, например 12.56, -56.87 и вещественные с плавающей точкой, которые представляются в экспоненциальном формате, например 2.5Е9, 0.1Е-10. Здесь символ «Е» имеет смысл «десять в степени»;
в) булевские (логические). Имеются две булевские константы: TRUE – «истина» и FALSE – «ложь»;
г) символьные – символ, заключенный в апострофы, например ‘A’, ‘10’, ‘=’;
д) строковые – последовательность символов, заключенная в апострофы, например ‘PASCAL’.
5. Комментарии (изображаются серым цветом) — любая комбинация произвольных символов, заключенная либо в фигурные скобки {}, либо в комбинированные (*...*). Если за открывающей скобкой следует знак $, комментарий интерпретируется как директива компилятора.
Между лексемами разрешено вставлять один или несколько разделителей: пробелов, комментариев, символов «конец строки» (код 13) и других управляющих символов (коды от 0 до 31). Разделителями являются также знаки математических операций, круглые и квадратные скобки, запятые.