Доцільність і ефективність конкретного методу класифікації та зменшення розмірності обумовлюється математичною моделлю, тобто математичною постановкою задач. Визначальним у виборі математичної постановки задачі є характер початкової інформації, що складається з двох частин:
а) апріорних відомостей знань про досліджувані класи;
б) вибіркової статистичної інформації навчальних вибірок.
Математична модель, яка лежить в основі побудови того чи іншого методу зниження розмірності включає переважно в себе три основних компоненти:
Форму задання початкової інформації. Тут треба відповісти на питання:
а) в якому виді задано основну інформацію про об’єкт;
б) чи є серед початкових статистичних даних навчальна інформація, тобто які-небудь відомості про аналізовану результуючу властивість;
в) якщо навчальна інформація присутня в початкових статистичних даних, то в якій саме формі вона представлена.
Тип оптимізаційного критерію інформативності шуканого набору ознак . Критерій інформативності може бути орієнтований на досягнення різних цілей. Можна виділити цілий клас критеріїв автоінформативності, оптимізація яких приводить до набору допоміжних змінних , що в свою чергу дозволяє майже точно відтворити інформацію, що міститься в описовому масиві статистичних даних . Якщо описова інформація представлена матрицею “об’єкт-властивість” то мова йде про максимально точне відтворення початкових значень змінних на основі значно меншого числа допоміжних змінних . Критерій орієнтований на пошук економних наборів допоміжних змінних , що забезпечують максимально точне відтворення інформації, що відноситься до результуючої ознаки.
Клас допустимих перетворень початкових ознак. Допоміжні ознаки при представленні початкової описової інформації матрицею “об’єкт-властивість” будується у вигляду функцій від , тобто . Для забезпечення змістовності і конструктивної реалізованості розв’язку оптимізаційної задачі необхідно визначити обмеження в класі допустимих розв’язків , в рамках якого ця оптимізаційна задача буде розв’язуватись. Від вибору суттєво залежить і отримуваний розв’язок даної оптимізаційної задачі.