ТЕМА 1: СОДЕРЖАНИЕ И ФУНКЦИИ БУХГАЛТЕРСКОГО УЧЁТА.
Таблица 3. Характеристики представления видеоинформации в различных форматах
Таблица 2. Характеристики различных стандартов представления графики
Таблица 1. Типы и структуры данных в некоторых системах программирования и управления данными
Данные
Система- язык программирования, СУБД, ИПС
Алгол
Кобол
PL/1
FoxBase/ Clipper
Adabas/ Natural
Oracle/ SQL
STAIRS, IRBIS, ISIS
Тип данных
Целое короткое (2 байта)
-
-
-
-
-
Small-mt
Целое норм (4 байта)
Integer
Computational
Int
N(x)
N(x)
Int
-
Целое длинн (8 байт)
-
-
Double
-
-
-
Действительное норм (4 байта)
Real
Computational
Roat
N(xy)
N(xy)
Float
Real
-
Действ двойное (8 байт)
-
-
-
-
-
Float
Double
-
Двоичное
-
-
Binary
-
B(x)
-
-
Десятичное упакованное (2 цифры на байт)
-
PIC(9)
Decimal
-
P(x)
-
-
Десятичное распакованное (1 цифра на байт)
-
PIC(X)
-
N(x)
U(x)
-
-
Логическое
Boolean
-
+
Logical
-
-
-
Символьное
-
PIC(A)
Char
CM
AM
Char
+
Длинный текстовый или бинарный объект (BLOB)
-
-
-
Memo
-
VarGrafic
VarChar
Дата
-
-
-
Date
-
Date
-
Время
-
-
-
-
-
Time
-
Структуры данных
Массивы
Array
-
Dim
Dimention
VAR(n)
-
-
Записи (структуры)
-
+
+
+
+
+
-
Множественные (векторные) поля записи
-
-
-
-
MU
-
+
Групповые поля записи
-
+
+
-
GR
-
+
Повторяющиеся группы в записи
-
-
-
-
PE
-
Текстовые поля (параграфы, предложения, слова)
-
-
-
-
-
-
+
Уместно привести пример представления числовой информации в различных перечисленных формах. Пусть задано число 13510 = = 2078=8716= 100000111,, тогда:
• внутренняя стандартная форма представления (тип BINARY для обработки в двоичной арифметике) - сохраняется (1000001112). Объем - 1 байт, или 8 двоичных разрядов;
• внутренняя форма двоично-десятичного представления (тип DECIMAL, каждый разряд десятичного числа представляется двоично-десятичной, в 4 бита, комбинацией). Представление 135 есть 001011 1012. Объем - 2,5 байта, 12 двоичных разрядов;
• символьное представление (тип ALPHABETIC, для вывода) - каждый разряд представляется байтом в соответствии с кодом ASCII. Представление 135 есть - 00110001 00110011 001101012. Объем - 3 байта.
Некоторые системы программирования (Fortran IV, например) поддерживают операции над комплексными числами вида Z= A + Bi (где А, В - действительные коэффициенты, а / - мнимая единица).
Очевидно, для размещения таких чисел необходим как минимум двойной расход оперативной памяти (по одному слову для размещения действительной и мнимой частей при обычной точности и по два слова при двойной точности). Кроме того, очевидно, что процессоры обычных универсальных ЭВМ вряд ли поддерживают операции над такими числами, в связи, с чем операции над ними требуют написания соответствующих подпрограмм или эмуляции комплексной арифметики.
Появление систем управления базами данных и систем программирования для разработки ИС приводит к появлению других типов данных:
• дата и время;
• бинарные (BLOB - Binary Large Object) и текстовые объекты без внутренней структуры (интерпретация возлагается на прикладные программы).
Понятие типа данных ассоциируется также с допустимыми значениями переменной и операциями над ними, например, данные типа время (ЧЧ:ММ:СС) или дата (ГГ/ММ/ДД) предполагают определенные диапазоны значений каждого из разрядов, а также машинные или эмулируемые операции (сложение/вычитание дат и/или моментов времени). Основной причиной проблемы 2000 г. являлось не столько двухразрядная запись года в базах данных, сколько встроенные в огромное количество программ (часто не документированных) операции над данными типа DATE -ГГ/ММ/ДД.
Структуры данных.В Алголе были определены два типа структур: элементарные данные и массивы (векторы, матрицы, тензоры, состоящие из арифметических или логических переменных). Основным нововведением, появившимся первоначально в Коболе (затем PL/1, Паскаль и пр.), являются агрегаты данных (структуры, записи), представляющие собой именованные комплексы переменных разного типа, описывающих некоторый объект или образующих некоторый достаточно сложный документ.
Рассмотренные выше экзотические типы данных (комплексные числа), очевидно, занимают промежуточное положение между элементарными переменными и массивами (структурами).
Термин запись подразумевает наличие множества аналогичных по структуре агрегатов, образующих файл (картотеку), содержащих данные по совокупности однородных объектов, элементы данных образуют поля, среди которых выделяются элементарные и групповые (агрегатные).
Появление СУБД и АИПС приводит к появлению новых разновидностей структур:
• множественных полей данных;
• периодических групповых полей;
• текстовых объектов (документов), имеющих иерархическую структуру (документ, сегмент, предложение, слово).
Двоичное кодирование мультимедиа информации.С 80-х гг. бурно развивается технология обработки на компьютере графической информации. Компьютерная графика широко используется в компьютерном моделировании в научных исследованиях, компьютерных тренажерах, компьютерной анимации, деловой графике, играх и т. д.
В последнее время в связи с резким ростом аппаратных возможностей персональных компьютеров пользователи получили возможность обрабатывать видеоинформацию.
Графическая информация на экране дисплея представляется в виде изображения, которое формируется из точек (пикселей). В современных компьютерах разрешающая способность (количество точек на экране дисплея), а также количество цветов зависят от видеоадаптера и могут меняться программно.
Цветные изображения могут иметь различные режимы: 16 цветов, 256 цветов, 65536 цветов (high color), 16777216 цветов (true color) - табл. 2. Очевидно, что количество бит на точку (пиксель), например, режима true color, равно:
/= Iog265 536 = 16 бит = 2 байта.
Разрешение
16 цветов
256 цветов
65 536 цветов
16 777 21 6 цветов
640x480
150 Кбайт
300 Кбайт
600 Кбайт
900 Кбайт
800x600
234,4 Кбайт
468,8 Кбайт
937,5 Кбайт
1,4 Мбайт
1024x768
384 Кбайт
768 Кбайт
1 ,5 Мбайт
2,25 Мбайт
1280х 1024
640 Кбайт
1,25 Мбайт
2,5 Мбайт
3,75 Мбайт
Наиболее распространенной разрешающей способностью экрана является разрешение 800 на 600 точек, т. е. 480 000 точек.
Рассчитаем необходимый для режима true color объем видеопамяти:
Аналогично рассчитывается объем видеопамяти, необходимый для хранения битовой карты изображений при других видеорежимах.
В видеопамяти компьютера хранится битовый план (bit map), являющийся двоичным кодом изображения, отсюда она считывается (не реже 50 раз в секунду) и отображается на экране.
Двоичное кодирование звуковой информации.С начала 90-х гг. персональные компьютеры получают широкие возможности для работы со звуковой информацией. Каждый компьютер, имеющий звуковую плату, может сохранять звук в виде файлов и воспроизводить его. С помощью специальных программных средств (редакторов аудиофайлов) открываются широкие возможности по созданию, редактированию и прослушиванию звуковых файлов. В дальнейшем создаются программы распознавания речи и появляется возможность голосового управления компьютером.
При двоичном кодировании аналогового звукового сигнала непрерывный сигнал дискретизируется (оцифровывается), т. е. заменяется серией отдельных выборок (см. рис. 1). Качество двоичного кодирования зависит от двух параметров: количества распознаваемых дискретных уровней сигнала и количества выборок в секунду.
Различные звуковые карты могут обеспечить как 8-, так и 16-битные выборки. При замене непрерывного звукового сигнала его дискретным представлением в виде ступенек 8-битные карты позволяют закодировать 256 различных уровней дискретизации звукового сигнала, соответственно 16-битные - 65 536 уровней.
Частота дискретизации аналогового звукового сигнала (количество выборок в секунду) также может принимать различные значения (5,5, 11, 22 и 44 кГц). Таким образом, качество звука в дискретной форме может быть очень плохим (качество радиотрансляции) при 8 битах и 5,5 кГц и весьма высоким (качество аудиоСВ) при 16 битах и 44 кГц.
Можно оценить объем моноаудиофайла с длительностью звучания 1 с при среднем качестве звука (16 бит, 22 кГц). Для этого 16 бит на одну выборку необходимо умножить на 22 000 выборок в секунду, что дает в результате 43 Кбайта.
Сжатие информации.Объем обрабатываемой и передаваемой информации быстро растет. Это связано с выполнением все более сложных прикладных процессов, появлением новых информационных служб, использованием изображений и звука.
Сжатие данных (data compression) - процесс, обеспечивающий уменьшение объема данных. Сжатие позволяет резко уменьшить объем памяти, необходимый для хранения данных, сократить (до приемлемых размеров) время их передачи. Особенно эффективно сжатие изображений. Сжатие данных может осуществляться как программным, так и аппаратным или комбинированным методом.
Сжатие текстов связано с более компактным расположением байтов, кодирующих символы. Определенные результаты дает статистическое кодирование, в котором наиболее часто встречающиеся символы получают коды наименьшей длины. Здесь также используется счетчик повторений пробелов. Что же касается звука и изображений, то объем представляющей их информации зависит от выбранного шага квантования и числа разрядов аналого-дискретного преобразования. В принципе, здесь используются те же методы сжатия, что и при обработке текстов. Если сжатие текстов происходит без потери информации, то сжатие звука и изображения почти всегда приводит к ее некоторой потере. Сжатие широко используется при архивировании данных.
Сжатие изображений (images compression) - процесс минимизации данных, определяющих изображение. Минимизация количества информации, предоставляющей изображение или видеофильм прежде всего, осуществляется при выборе шага квантования и разрядности кодов. При этом, естественно, происходит определенная (допустимая) потеря информации. Затем происходит сжатие изображения, представленного дискретным сигналом.
Сжатие изображения осуществляется в несколько этапов:
• изображение делится на блоки пикселов, каждый из которых подвергается обработке, устраняющей избыточлость;
• осуществляется кодирование с переменной длиной кодов, что исключает длинные цепочки нулей и единиц в последовательностях битов,
• дополнительное сжатие движущегося изображения за счет сравнения каждого изображения с предыдущим, чтобы сохранять только изменившуюся его часть.
Допускается потеря той информации, которая в решении поставленной задачи считается несущественной. Например, можно при обработке изображений удалить из аналогового сигнала частоты, которые находятся вне спектра, воспринимаемого глазом человека (до 10 000 цветов, 250 оттенков серого цвета). Нередко допускается игнорирование цвета каждого второго пиксела либо группа пикселов заменяется одним со средним значением цвета. Осуществляется также групповое кодирование. Его сущность заключается в кодировании групп одинаковых пикселов (например, небо без облаков на картине).
Размер файла сжатого дискретного неподвижного изображения зависит от четырех параметров: площади изображения, квадрата разрешения, числа бит, необходимых для представления пиксела, и коэффициента сжатия. В видеофильме к этому еще добавляется число образующих его неподвижных изображений. Выбор коэффициентов сжатия - компромисс между пропускной способностью системы (скоростью переноса файлов) и качеством восстанавливаемого изображения. Чем выше коэффициент сжатия, тем ниже это качество. При этом следует иметь в виду, что при очень высокой разрешающей способности и большом коэффициенте сжатия можно получить изображение с низкой разрешающей способностью.
Поэтому, выбор указанных параметров обосновывается технико-экономическим анализом и алгоритмом сжатия. Что касается качества изображения, то оно зависит от конкретной поставленной задачи. Например, в системах телеконференций основной объем необходимой информации содержится в речи, тогда как качество изображения может играть вторую роль.
В зависимости от скорости сжатия изображений выполняемые процессы подразделяются на два класса. К первому относится сжатие неподвижных изображений, которое может выполняться в фоновом режиме, с любой возможной скоростью Второй класс образуют алгоритмы сжатия движущихся изображений, которые должны выполняться в реальном времени по мере получения данных.
Существует немало технологий сжатия/восстановления изображений. Наиболее популярная из них предложена Объединенной группой экспертов в области фотографии (JPEG) и позволяет сократить размеры графического файла в 10-20 раз. Благодаря специальным процессорам и алгоритмам удается также сжимать видеосюжеты.
Кодирование видеоинформации.В связи с большим объемом информации, содержащейся в видеопотоке (до 6 Мбайт/с), для записи информации в ЭВМ обычно применяют сжатое кодирование потока данных на входе с использованием алгоритмов семейства MPEG/JPEG (табл. 3.).
№
Формат
Тип данных (размер изображения)
Длительность записи (CD/DVD), мин
VCD
288 х 384
S-VCD
480 х 576
DVD
576 х 720
VHS
288 х 384
-
S-VHS
540 х 720
-
Internet High Speed
193 х 144
-
Стандарт MPEG (Motion Picture Expert Group) включает несколько компонент: системного потока, описывающего структуру смешанного аудио- и видеопотока, а также MPEG-video и MPEG-audio.
В случае MPEG video сжатие достигается за счет четырех факторов.
1. Использование составляющих YUV вместо обычных RGB (красный, зеленый, синий).
Вместо элементарных цветов кодируется яркость (luminance, Y) и цветность (chrominance, U & V), причем цветность прорежена по вертикали и горизонтали в два раза по сравнению с яркостью (децимация). При этом вместо сильно коррелированных сигналов RGB получаются практически некоррелированные YUV, и за счет децимации достигается двукратное сжатие.
2. Дискретно-косинусное преобразование с последующим квантованием.
При этом квадраты пикселей (8 х 8) подвергаются двухмерному дискретно-косинусному преобразованию (DCT), которое родствен-но преобразованию Фурье, различие заключается в наборе базисных функций (в преобразовании Фурье это синусы и косинусы, в ОСТ - косинусы). Это преобразование переводит пространственное представление сигнала в частотное. Результат преобразования подвергается квантованию, т. е. огрублению точности, при этом коэффициент квантования для более высоких пространственных частот выбирается более высоким, чем для низких, с учетом особенностей восприятия. При этом высокие пространственные частоты передаются с меньшей точностью, чем низкие частоты. При квантовании многие пространственные частоты не кодируются и не передаются.
3. Устранение временной избыточности с компенсацией движения.
Это означает, что для ликвидации избыточности, заключающейся в большой корреляции между соседними кадрами, передается разность между ними. Кадры видеопотока разбиваются на несколько типов - Intra (Г), которые кодируются полностью, Predicted (P), для которых кодируется различие с предыдущим /- или Р-кадром, и Bidirectional (Б), для которых в качестве опорных (reference) используются /- и/или Р-кадры, между которыми он находится. Обычно /-кадры следуют 1 или 2 раза в секунду, и между двумя опорными кадрами лежит 2-4 В-кадра. Типичная последовательность кадров имеет вид: IBBPBBPBBPBBIBBP. В общем случае вид последовательности выбирается кодеком (кодирующее устройство или программа) и может зависеть или нет от содержания кадров. Поскольку изображение на соседних кадрах обычно сдвинуто, применяется компенсация движения, т. е. кодируется отклонение (разность) от некоторого сдвинутого опорного изображения Кодирование выполняется макроблоками (16 х 16 яркость, 8 x 8 цветность), для каждого макроблока определяется свой вектор движения.
4. Квазиоптимальное кодирование.
Коэффициенты, полученные после ОСТ, векторы движения и все остальное, кодируются кодами переменной длины. Это кодирование называют квазиоптимальным, поскольку кодовая таблица не строится заново для каждого конкретного случая, а выбрана при разработке стандарта на основе анализа типичных видеопоследовательностей.
MPEG-1 проектировался из расчета на поток 1,5 Мбит/с при 30 кадрах размером 352 х 240 в секунду, хотя он не ограничен этим и допускает существенно больший поток при произвольном размере кадра.
MPEG-2 проектировался с учетом опыта использования MPEG-1 и ориентируется на вещание, так как содержит средства для маскирования ошибок.
В случае MPEG audio исходный сигнал подвергается многоканальной фильтрации. Далее амплитуды сигналов в каждой полосе сравниваются для нахождения полос, подлежащих кодированию с учетом эффекта маскирования слабого сигнала сильным. Далее амплитуда сигнала в полосе квантуется и кодируется. При записи на Video CD скорость потока звука составляет 32 Кбайт/с.