Геодезия, Картография, Земеустройство GKZ-5-6'2019 (За сайта) | Page 22

SUMMARY

For mapping and analyzing statistical information it is almost always necessary to classify the data set with an appropriate classification method. Classification procedures for map compiling are used to facilitated the reading process. The task of the cartographer is to determine the number of classes and their limits (the low and high value of each class), which will include the corresponding objects. In GIS the maximum and minimum values for each class are automatically determined by analyzing the data changes. By changing the classes, there are many different thematic maps of the same set of data.

This study summarizes the advantages and disadvantages of the various classification methods based on the data analysis. It also clarifies when to classify information and when to use unclassified data, especially if they represent territorial distribution. A database for epidemiology of heriditary neuropathies in Bulgaria was used. The article targets all GIS software users, who are not cartographers. The aim is to avoid the presence of cartographic improper products on the Internet.

Key words: classification, ArcGIS, normal distribution

РЕЗЮМЕ

При картографиране и анализ на статистическа информация, почти винаги е необходимо да се класифицира наборът от данни с подходящ класифициращ метод. Класифициращите процедури при съставяне на картата се използват, за да улеснят нейното прочитане. Задачата на картографа е да се определи броят на класовете и техните граници (ниската и високата стойност на всеки клас), а те от своя страна определят кои обекти ще попаднат във всеки клас. С използване на ГИС това става автоматично с математическа процедура, която анализира промените в данните. Чрез промяната на класовете се създават много различни на вид тематични карти от един и същ набор от данни. В това изследване са обобщени предимствата и недостатъците на различните класифициращи методи въз основа на анализа на данните в разгледаните примери. Използвана е база данни за епидемиология на наследствени невропатии в България. Дискутира се също въпросът кога трябва да се класифицира информацията и кога може да се работи с некласифицирани данни, особено когато те са отнесени към територии. Статията е насочена към всички използващи ГИС софтуерни продукти в своята работа, но не са специалисти картографи. Целта е да се избегне наличието на картографски неиздържани продукти в интернет пространството.

Ключови думи: класификация, ArcGIS, нормално разпределение

1. ВЪВЕДЕНИЕ

Известно е, че днес картите могат да бъдат създадени и използвани от всеки отделен човек с умерени компютърни умения от почти всяко място на Земята и за почти всяка цел. Налични са нови и по-бързи технологии. В тази нова среда за картографиране, ГИС потребителите често забравят за утвърдени картографски принципи, които и до днес остават непроменени. Това създава проблеми или води до продукти, системи и приложения, които не са картографски приемливи и използваеми. Един такъв важен проблем е правилното класифициране на картографските данни, за да бъдат най-правилно възприети от читателя на картата. Класификацията на данните в картографията ни позволява да се създаде по-малък брой класове на данните и да изберем съответни на тях цветни знаци, които могат лесно да бъдат разграничавани. Главната цел на класификацията е обекти с близки стойности да попаднат в един и същ клас.

Класифицираната тематична карта представя данните, групирани в различни класове. На картата те могат да бъдат разграничени с различна големина на знаците или различни цветови нюанси на териториите. По този начин класифицираната карта е с ограничено цветово разнообразие. Цветовите нюанси на некласифицираната тематична карта [4] са правопропорционални на стойностите на всеки изобразен обект. Теоретично некласифицираните данни се възприемат по-добре, отколкото класифицираните в случай, че картографираните обекти (явления) в картата са по-малко на брой. Като цяло, картографите не одобряват резултата от некласифицирана статистическа информация, тъй като картата ще съдържа много на брой картографски знаци.

За класифициране на данните са важни изборът на използвания метод за класификация и броят на класовете, които се създават. Броят на класовете при числени данни се определя от няколко фактора: разпределението на данните (т.е. от промяната на стойностите в набора от данни), предвидената точност за представяне на данните и не на последно място - възможността на ГИС софтуера да покаже малките разлики между цветовете. Изследванията на Робинсон и други известни картографи показват, че е препоръчително да не се използват повече от пет до шест класа при картографиране на статистически (количествени) данни, така че читателят на картата да е в състояние да ги различи лесно [3]. За добро представяне на данните е важно да се определи интервалът на класа по начин, който точно да отразява промяната в масива от данни. Горната граница на първи клас винаги е минималната стойност на набора от данни. Долната граница се получава чрез добавяне към горната граница на интервал, чиято стойност зависи от избрания класифициращ метод. Интервалите могат да бъдат постоянни (определени и еднакви) и променливи (произволни или естествени). За всеки следващ клас горната граница се определя, така че стойността й да е над най-високата стойност в предходния клас.

ГИС софтуерът обикновено дава възможност за автоматично класифициране на данните, като се използва стандартен класификационен метод. Но кой от тях да изберем?

2. СТАТИСТИЧЕСКИ МЕТОДИ ЗА КЛАСИФИЦИРАНЕ НА

ДАННИТЕ В ARCGIS СРЕДА

Много автори са работили по същността на класифициращите методи, как работят и какви резултати дават. Има и множество алгоритми за тях. Компютърната технология сега ни предостави възможност за използване на методи, които винаги са съществували в статистиката, но за картографски цели не са били използвани поради

20

КАРТОГРАФИЯ, ГИС

КЛАСИФИЦИРАНЕ НА СТАТИСТИЧЕСКИ ДАННИ В ГИС СРЕДА

Доц. д-р инж. Пенка Кастрева, Югозападен университет, Благоевград,

ас. д-р Кристина Кастрева, УМБАЛ Александровска, Медицински университет, София

ГКЗ 5-6 ' 2019