Обрабатываемую компьютером информацию удобно разделять на две основные категории: команды и данные. Команды, команда;машиннаяили машинные команды, — это явно заданные инструкции, управляющие пересылкой информации внутри компьютера, между компьютером и его устройствами ввода-вывода, а также определяют подлежащие выполнению операции. Каждая команда предназначена для осуществления элементарного действия. Команды реализуют основные арифметические и логические операции, перемещают данные из одной области памяти в другую, осуществляют операции ввода-вывода и множество других действий. Команды, составляющие программу, обычно выполняются последовательно, если только сама команда не дает указания компьютеру изменить порядок обработки. Система команд процессора определяет его архитектуру.
Данные данные— это числа и закодированные символы, обрабатываемые командами программы. Причем данные могут быть числами, текстом, графическими объектами или иметь какую-либо иную форму, но во всех случаях они должны быть представлены таким образом, чтобы их мог обработать компьютер. Термин «данные» часто используется для обозначения любой цифровой информации. Согласно этому определению, сама программа (то есть список команд) также может считаться данными, если она обрабатывается другой программой.
Данные, манипулирование которыми осуществляется при помощи этих команд, также хранятся в основной памяти, пока идет их обработка. Идея хранения команд и данных программы во время их обработки в основной памяти принцип;хранимойпрограммыизвестна как концепция хранимой программы. Ее авторство также приписывается Дж. фон Нейману, известному ученому, специалисту в области теории вычислительных систем. Данная концепция составляет основу стандартной архитектуры практически всех современных персональных компьютеров.
Информация, предназначенная для обработки компьютером, должна быть закодирована, то есть иметь подходящий для компьютера формат. Современное аппаратное обеспечение в большинстве своем основано на цифровых схемах, у которых существует только два устойчивых состояния. В результате кодирования каждое число, символ или команда преобразуется в строку двоичных цифр, называемых битбитами, любой из которых имеет одно из двух возможных значений: 0 или 1. Для представления чисел обычно используется двоичная система счисления, но иногда применяетсяформат;двоично-десятичный и двоично-десятичная система (Binary-CodedDecimal, BCD), в соответствии с которой каждая десятичная цифра кодируется отдельно, с помощью 4 бит.
Биты организуются в более крупные образования — байты и слова. Один байт соответствует восьми битам, каждый из которых может иметь значение 0 или 1. Один символ (буква, цифра, специальный символ) в «машинном» представлении как раз укладывается в 1 байт. 1 Кбайт (килобайт) содержит 1024 символа (это немногим более 1000, поскольку счет идет по степеням числа 2; 1 Кбайт = 210), 1 Мбайт (мегабайт) — 1024 Кбайт.
Буквы и цифры также представляются посредством двоичных кодов. Для них разработано несколько разных схем кодирования. Наиболее распространенными считаются схемы ASCIIASCII (AmericanStandardCodeforInformationInterchange — американский стандартный код для обмена информацией), где каждый символ представлен 7-битовым кодом, и EBCDICEBCDIC (ExtendedBinaryCodedDecimalInterchangeCode — расширенный двоично-десятичный код для обмена информацией), в котором для кодирования символа используется 8 бит.