русс | укр

Мови програмуванняВідео уроки php mysqlПаскальСіАсемблерJavaMatlabPhpHtmlJavaScriptCSSC#DelphiТурбо Пролог

Компьютерные сетиСистемное программное обеспечениеИнформационные технологииПрограммирование


Linux Unix Алгоритмічні мови Архітектура мікроконтролерів Введення в розробку розподілених інформаційних систем Дискретна математика Інформаційне обслуговування користувачів Інформація та моделювання в управлінні виробництвом Комп'ютерна графіка Лекції


Лекція 2. поняття даних


Дата додавання: 2014-05-29; переглядів: 1747.


Контекстна реклама -це різновид розміщення Інтернет-реклами, в основі якого лежить принцип відповідності змісту рекламного матеріалу змісту Інтернет-сторінки, на якій розміщується даний матеріал.

Ставка –максимальна кількість грошей, яку рекламодавець готовий платити за клік (перехід на сайт).

Мінімальна вартість кліка - вартість кліка, нижче за яку не можливо виставити свою ставку.

Позиція оголошення –місце розміщення оголошення у рекламному блоці.

CTR (click-through rate)показник ефективності інтернет-реклами, вимірюваний як відношення числа натиснень на рекламне оголошення (кліков) до числа показів цього оголошення.

СТВ (click-to-buyer) — показник ефективності інтернет-реклами, вимірюваний як відношення числа відвідувачів комерційного веб-ресурсу, привернутих рекламою і, яки оформили покупку, до загального числа привернутих рекламою відвідувачів. Показник відображає конверсію відвідувачів, в деяких випадках називається коефіцієнтом конверсії.

CTI (click-to-interest) — показник ефективності інтернет-реклами, вимірюваний як відношення числа відвідувачів комерційного веб-ресурсу, привернутих рекламою і, яки зацікавилися сервером (що відвідали декілька його сторінок), до загального числа привернутих рекламою відвідувачів.

AD Impression — загальне число зроблених веб-сайтом або видавцем показів того або іншого банера (завантажень комп'ютерами користувачів рекламного носія, відмічених в лог-файлах серверу) за певний час.

AD Reach — число унікальних користувачів, яким був показаний банер (виключається повторний рекламний показ банеру) за певний час.

AD Frequency — середня частота показу банера рекламодавця одному користувачу. Обчислюється як відношення загального числа показів до числа унікальних користувачів: AD Frequency = AD Impression/AD Reach.

FFA (flat free advertising) — фіксована платня за рекламу, простий метод ціноутворення в рекламі, при якому розміщення реклами оплачується за певний час, без урахування числа показів і зворотної реакції аудиторії.

СРМ (cost per mille, cost per thousand) — метод ціноутворення в рекламі, при якому її ціна обчислюється за 1000 показів рекламного носія.

СРС (cost per click) — методу ціноутворення в рекламі, вимірюваний як відношення витрат на рекламу до 1000 кліків — клацань мишею на рекламному банеру. Використовується також як показник ефективності інтернет-реклами.

CPV (cost per visit) — методу ціноутворення в інтернет-рекламі (може використовуватися як показник ефективності інтернет-реклами), вимірюваний як відношення витрат на рекламу до числа привернутих відвідувачів.

СРА (cost per action) — показник ефективності інтернет-реклами, вимірюваний як відношення витрат на рекламу до числа дій, що цікавлять рекламодавця, що були зроблені привернутими рекламою відвідувачами.

CPS (cost per sale) — показник ефективності інтернет-реклами, вимірюваний як відношення витрат на рекламу до числа здійснених привернутими клієнтами покупок.

СРЕ (cost per exposure) — показник ефективності інтернет-реклами, вимірюваний як відношення витрат на рекламу до числа рекламних звернень, що фактично дійшли до споживача.

 

 

5. ТЕМИ ДЛЯ НАПИСАННЯ РЕФЕРАТІВ

 

1. Сучасний стан і перспективи розвитку Інтернет-реклами.

2. Порівняний аналіз, характеристика і можливості сучасних браузерів.

3. Маркетингові дослідження в Інтернет.

4. Маркетинговий аналіз сайтів електронної комерції.

5. Копірайтинг: особливості написання текстів для сайтів.

6. Основні пошукові систем в українському Інтернету та їх характеристика.

7. Сервіси пошукової системи Google та їх використання у професійної діяльності маркетологу.

8. Методи пошукової оптимізації і просування Web-сайту в Інтернет.

9. Банерна реклама в українському Інтернету.

10. Дизайн сайту та його вплив на ведення бізнесу в Інтернет.

11. Використання соціальних мереж у маркетингової діяльності в Інтернет.

12. Системи контекстної реклами: характеристика й порівняний аналіз.

13. Характеристика і порівняний засобів Web-аналізу для просування сайту.

14. Показники ефективності рекламних кампаній у мережі Інтернет.

15. Блоги - новий засіб маркетингових комунікації.

 

Лекція 2. поняття даних

В лекції докладно розглядається поняття даних. Пояснюється значення понять об'єкт та атрибут, вибірка, залежна і незалежна змінна. Докладно обговорюються типи шкал. Приводяться різні типи наборів даних. Коротко розглянуті поняття бази даних і СУБД.

 

1. Що таке дані?

У широкому розумінні дані являють собою факти, текст, графіки, рисунки, звуки, аналогові або цифрові відео сегменти.

Дані можуть бути отримані в результаті вимірів, експериментів, арифметичних і логічних операцій.

Дані повинні бути представлені у формі, придатній для зберігання, передачі та обробки.

Іншими словами, дані – це неопрацьований матеріал, надаваний постачальниками даних і використовуваний споживачами для формування інформації на основі даних.

Набір даних й їхніх атрибутів

У таблиці 2.1 представлена двомірна таблиця, що представляє собою набір даних.

 

Таблиця 2.1. Двомірна таблиця "об'єкт-атрибут"

  Атрибути
Об'єкти Код клієнта Вік Родинний стан Доход Клас
Single
Married
Single
Married
Divorced
Married
Divorced
Single
Married

 

По горизонталі таблиці розташовуються атрибути об'єкта або його ознаки. По вертикалі таблиці – об'єкти.

Об'єкт описується як набір атрибутів.

Об'єкт також відомий як запис, випадок, приклад, рядок таблиці і т.д.

Атрибут – властивість, що характеризує об'єкт.

Наприклад: кольори ока людини, температура води і т.д.

Атрибут також називають змінною, полем таблиці, виміром, характеристикою.

У результаті операціоналізацій понять, тобто переходу від загальних категорій до конкретних величин, виходить набір змінних досліджуваного поняття.

Змінна (variable) – властивість або характеристика, загальна для всіх досліджуваних об'єктів, прояв якої може змінюватися від об'єкта до об'єкта.

Значення (value) змінної є проявом ознаки.

При аналізі даних, як правило, немає можливості розглянути всю сукупність об'єктів, що цікавить нас. Вивчення дуже великих обсягів даних є дорогим процесом, що вимагає більших часових витрат, а також неминуче приводить до помилок, пов'язаних з людським фактором.

Цілком достатньо розглянути деяку частину всієї сукупності, тобто вибірку, і одержати інформацію, що цікавить нас, на її підставі.

Однак розмір вибірки повинен залежати від різноманітності об'єктів, представлених у генеральній сукупності. У вибірці повинні бути представлені різні комбінації та елементи генеральної сукупності.

Генеральна сукупність (population) – вся сукупність досліджуваних об'єктів, що цікавить дослідника.

Вибірка(sample) – частина генеральної сукупності, певним способом відібрана з метою дослідження та одержання висновків про властивості і характеристики генеральної сукупності.

Параметри – числові характеристики генеральної сукупності.

Статистики – числові характеристики вибірки.

Часто дослідження ґрунтуються на гіпотезах. Гіпотези перевіряються за допомогою даних. Гіпотеза – припущення щодо параметрів сукупності об'єктів, що повинне бути перевірене на її частині.

Гіпотеза – частково обґрунтована закономірність знань, що служить або для зв'язку між різними емпіричними фактами, або для пояснення факту або групи фактів.

Приклад гіпотези: між показниками тривалості життя і якістю харчування є зв'язок. У цьому випадку метою дослідження може бути пояснення змін конкретної змінної, у цьому випадку – тривалості життя. Допустимо, існує гіпотеза, що залежна змінна (тривалість життя) змінюється залежно від деяких причин (якість харчування, спосіб життя, місце проживання і т.д.), які і є незалежними змінними.

Однак змінна споконвічно не є залежною або незалежною. Вона стає такою після формулювання конкретної гіпотези. Залежна змінна в одній гіпотезі може бути незалежної в іншій.

 

Виміри

 

Вимір – процес присвоєння чисел характеристикам досліджуваних об'єктів відповідно до певного правила.

У процесі підготовки даних виміряється не сам об'єкт, а його характеристики.

Шкала – правило, відповідно до якого об'єктам привласнюються числа.

Багато інструментів Data Mining при імпорті даних з інших джерел пропонують вибрати тип шкал для кожної змінної і/або вибрати тип даних для вхідних і вихідних змінних (символьні, числові, дискретні та безперервні). Користувачеві такого інструмента необхідно володіти цими поняттями.

Змінні можуть бути числовимиданими або символьними.

Числові дані, у свою чергу, можуть бути дискретними й безперервними.

Дискретні дані є значеннями ознаки, загальне число яких скінчене або безмежне, але може бути підраховане за допомогою натуральних чисел від одного до безмежності.

Приклад дискретних даних. Тривалість маршруту тролейбуса (кількість варіантів тривалості звичайно): 10, 15, 25 хв.

Безперервні дані – дані, значення яких можуть приймати яке завгодно значення в деякому інтервалі. Вимір безперервних даних припускає велику точність.

Приклад безперервних даних: температура, висота, вага, довжина і т.д.

 

Шкали

Існує п'ять типів шкал вимірів: номінальна, порядкова, інтервальна, відносна і дихотомічна.

 

Номінальна шкала (nominal scale) – шкала, що містить тільки категорії; дані в ній не можуть упорядковуватися, з ними не можуть бути зроблені ніякі арифметичні дії.

Номінальна шкала складається з назв, категорій, імен для класифікації і сортування об'єктів або спостережень по деякій ознаці.

Приклад такої шкали: професії, місто проживання, родинний стан.

Для цієї шкали застосовні тільки такі операції: дорівнює (=), не дорівнює (¹).

Порядкова шкала (ordinal scale) – шкала, у якій числа присвоюють об'єктам для позначення відносної позиції об'єктів, але не величини розходжень між ними.

Шкала вимірів дає можливість ранжувати значення змінних. Виміри у порядковій шкалі містять інформацію тільки про порядок проходження величин, але не дозволяють сказати "наскільки одна величина більше іншої", або "наскільки вона менше іншої".

Приклад такої шкали: місце (1, 2, 3-е), що команда одержала на змаганнях, номер студента в рейтингу успішності (1-й, 23-й, і т.д.), при цьому невідомо, наскільки один студент успішніший за іншого, відомий лише його номер у рейтингу.

Для цієї шкали застосовуються тільки такі операції: дорівнює (=), не дорівнює (¹), більше (>), менше (<).

Інтервальна шкала (interval scale) – шкала, різниці між значеннями якої можуть бути обчислені, однак їхні відношення не мають змісту.

Ця шкала дозволяє знаходити різницю між двома величинами, має властивості номінальної та порядкової шкал, а також дозволяє визначити кількісну зміну ознаки.

Приклад такої шкали: температура води у морі зранку – 19 градусів, увечері – 24, тобто вечірня на 5 градусів вище, але не можна сказати, що вона в 1,26 разів вище.

Номінальна і порядкова шкали є дискретними, а інтервальна шкала – неперервною, вона дозволяє здійснювати точні виміри ознаки і робити арифметичні операції додавання (+), віднімання (–), множення (*), ділення (/).

Для цієї шкали застосовуються тільки такі операції: дорівнює (=), не дорівнює (¹), більше (>), менше (<), операції додавання (+) і віднімання (–).

Відносна шкала (ratio scale) – шкала, у якій є певна точка відліку та можливі відносини між значеннями шкали.

Приклад такої шкали: вага новонародженої дитини (4 кг й 3 кг). Перший в 1,33 рази важчий.

Ціна на картоплю у супермаркеті в 1,2 рази вища, від ціни на базарі.

Відносні та інтервальні шкали є числовими.

Для цієї шкали застосовуються тільки такі операції: дорівнює (=), не дорівнює (¹), більше (>), менше (<), операції додавання (+) і віднімання (–), множення (*) і ділення (/).

Дихотомічна шкала (dichotomous scale) – шкала, що містить тільки дві категорії.

Приклад такої шкали: стать (чоловіча та жіноча).

Приклад використання різних шкал для вимірів властивостей різних об'єктів, у цьому випадку температурних умов, наведений у таблиці даних, зображеної в таблиці 2.2.

 

Таблиця 2.2. Безліч вимірів властивостей різних об'єктів

Номер об'єкта Професія (номінальна шкала) Середній бал (інтервальна шкала) Освіта (порядкова шкала)
слюсар середня
вчений вища
вчитель вища

 

Приклад використання різних шкал для вимірів властивостей однієї системи, у цьому випадку температурних умов, наведено у таблиці даних, зображеної в таблиці 2.3.

 

Таблиця 2.3. Безліч вимірів властивостей однієї системи

Дата виміру Хмарність (номінальна шкала) Температура у 8 годині ранку (інтервальна шкала) Сила вітру (порядкова шкала)
1 вересня хмарно 22°С Вітер сильний
2 вересня похмуро 17°С Вітер слабкий
3 вересня ясно 23°С Вітер дуже сильний

 

Висновки. У цій частині лекції ми розглянули поняття даних, об'єкта та атрибута, їхньої характеристики.

Також ми обговорили типи шкал. Номінальна шкала описує об'єкти або спостереження в термінах якісних ознак. На один крок далі йдуть порядкові шкали, що дозволяють упорядковувати спостереження або об'єкти по певній характеристиці. Інтервальні та відносні шкали більш складні, у них можливе визначення кількісного значення ознаки.

 

 


<== попередня лекція | наступна лекція ==>
Термінологічний словник | Типи набору даних


Онлайн система числення Калькулятор онлайн звичайний Науковий калькулятор онлайн