Маалыматты тазалоо
Сабактын кыскача мазмуну: бул сабактан сиз маалыматты анализге даярдоону үйрөнөсүз.
Маалыматты тазалап бүткөндөн кийин бир гана катарда аталышы бар, анын алдындагы сапчалардагы маалымат аталышка форматы жана мааниси жагынан дал келгидей болушу керек. Бул маалыматты анализдөөгө жана визуалдаштырууга жардам берет.
Эске салабыз: таблицада маалыматтын түп нускасында эмес, көчүрүп алган баракчасында иштейбиз!
1-эреже. Аталыш бир гана катарда.
Биздин учурда аталыштар катары – жылдар көрсөтүлгөн биринчи сапча. Биринчи тилкеде аталыш жок экенине көңүл буруңуз. Аны A1 уячасына жазыңыз.
2-эреже. Бир тилкеде бир типтеги гана маалымат.
Эгер сиздин тилке “Оору” деп аталса, анда анын түбүндө оорулардын аталышы гана болушу мүмкүн.
Эгер сиздин тилкеде эки типтеги маалымат болсо, мисалы, оору жана облус, анда дагы бир тилке түзүңүз да, ага “Облус” деген ат бериңиз. Облустар тууралуу бардык маалыматты ошол жакка көчүрүңүз.
Таблицадагы 6- жана 7- сапты караңыз: «гастроэнтериты, колиты, вызванные установленными возбудителями». 7-сапта эч кандай маалымат жок, анткени оорунун аталышы эки сапка бөлүнүп кеткен. Муну оңдош үчүн 7-сапка дарттын толук атын жазыңыз, ал эми 6-сапты өчүрүп салыңыз. Бул үчүн курсорду саптын номуруна алып барыңыз, чычкандын оң жагын басып, «удалить» тандаңыз.
Мына ушундай болушу керек:
Ошондой эле 18-сапка көңүл буруңуз, «ВИЧ – инфекция 1». Бул чынында эле оорунун аталышыбы? Күмөн ой жаралганда сөзсүз түп нускага (оригинал), башкача айтканда, отчеттогу баштапкы маалыматка барыңыз. Биздин учурда 1 – сноска экенин көрөсүз, ал ВИЧ боюнча маалыматтар Кыргызстандын жарандарынын санына карап берилгенин көрсөтүп турат.
Бул маалыматты биз мета белгилер жазылган баракчага кошуп коебуз, а “1” санын өчүрүп таштайбыз.
3-эреже. Бир тилкеде бир форматтагы гана маалыматтар
Бул эмнени түшүндүрөт? Маалымат текст же сан түрүндө берилиши мүмкүн. Сандык форматтын өзү да бир нече түргө бөлүнүп кетет: жөнөкөй сан, пайыз, календардык дата.
“Оору” (заболевания) тилкесиндеги маалыматтар кандай форматта болуш керек? А жылдар боюнча тилкелердечи?
Бул жөн гана формалдуулук эмес. Эгер маалымат сан катары жазылбаса, Эксель аны менен ар кандай математикалык операцияларды жасай албайт. А сиз болсо оорунун саны өсүп жана азайганын, кайсы жылы дарт катталган учурлар көп болгонун биле албайсыз.
Маалымат кайсы форматта жазылганын кантип аныктаса болот? Эреже боюнча Эксель текстти сол жакка, ал эми сандарды оң жакка форматтайт. Таблицаңызда маалыматтар ушундай жайгашканын текшериңиз.
4-эреже. Дефис коюлган тилкелерге көңүл буруңуз.
Биздин учурда дефис менен маалымат жок жерлер белгиленген. Ушундай тилкелерге дайыма кылдат болуңуз,: сызыкча мындагы маани нөлгө барабар экенин түшүндүрөбү же бул көрсөткүч боюнча маалымат чогултууга мүмкүн болбогонунбу?
Эгер биринчи учур болсо, «-» белгисин 0 (нөлгө) алмаштыра алабыз. А эгер экинчиси болсо анда ошол оору боюнча маалыматтар менен ишей албайбыз же жок маалыматты башка булактардан таап, таблицага кошобуз.
Биздин учурда «-» чынында эле нөлдү түшүндүрөт. Андыктан биз дефистердин баарын автоматтык түрдө нөлгө алмаштыра турган эң жөнөкөй операцияны жасайбыз. Бул үчүн маалымат бар бардык уячаларды белгилеңиз, «Найти и заменить» командасын табыңыз.
Сиздин операциялык системаңыздын версиясында бул нерсе менюлардын башка сапчасында болушу мүмкүн.
Эми «Найти» деген жерге «-», а «Заменить» деген жерге эч нерсе жазбаңыз.
«Заменить все» басыңыз.
Даяр! Биз жети жерди алмаштырдык.
Бизде 6 тилке жана 22 саптан турган таблица пайда болду. Ал анализге даяр. Куттуктайбыз!