Մեծ տվյալների դարաշրջան
Մեծ կամ մեծածավալ տվյալներ, տվյալագիտություն, տվյալների վերլուծություն, տվյալների հենքով պրոդուկտներ․․․ սրանք այն նոր տերմիններն են, որ «ժողովրդավարություն», «տեսլական» և նման այլ բառերի նման բոլոր պատեհ և անպատեհ առիթներին սիրում են գործածել շատերը, ովքեր փորձում են ավելի բանիմաց և առաջադեմ երևալ։ Սակայն մեզնից շատերը, այդ թվում՝ շատ սկսնակ ՏՏ մասնագետներ, չգիտեն, թե ինչ է ընդգրկում այդ «մեծ տվյալներ» (Big Data) հասկացությունը և արդյո՞ք դա ինչ-որ կերպ ինձ վերաբերում է։ Ես, որպես հասարակ մահկանացու, ինչ կապ ունեմ մեծ տվյալների հետ կամ ինչպես կարող եմ օգտվել դրանց վերլուծությունից և կիրառությունից։
Առաջին հայացքից կարող է թվալ, որ դա ինձ չի վերաբերում, բայց եկեք մի փոքր ավելի խորանանք և հասկանանք, թե ինչպես եմ ես՝ որպես 21-րդ դարում ապրող մարդ, առնչվում մեծ տվյալների հետ։
Ամեն առավոտ, ինչպես աշխատող շատ երիտասարդներ, ես փորձում եմ արթնանալ, այն էլ արթնանալ վաղ և այդ դժվար գործում ինձ օգնության է գալիս բջջային հեռախոսիս մեջ ներբեռնված զարթուցիչը, որն արդեն գիտի, որ պետք է զնգալ առնվազն 3 անգամ, այն էլ 2 րոպեն մեկ, երբեմն էլ նույնիսկ 5 անգամ։ Պարզվում է, որ նույնիսկ զարթուցիչը ունի տվյալներ իմ արթնանալու սովորության մասին։
Արթնանալուց հետո առաջին բանը, որ անում եմ, միացնում եմ հեռուստացույցը, որպեսզի բացի ինձնից ինչ-որ մեկն էլ խոսի տանը, և միաժամանակ միացնում հեռուստալիքը գրանցող սարքը, որը նույնպես հավաքում է տվյալներ այն մասին, թե ով եմ ես, քանի տարեկան եմ, ինչ մասնագետ եմ և ամենակարևորը, եթե տանն եմ, ինչ հեռուստալիք եմ նայում և ինչ հաղորդում կամ ֆիլմ և երբ եմ տանը։
Այնուհետև ինձ առնչվող տվյալներ սկսում է հավաքել բջջային այն հավելվածը, որը հետևում է առավոտյան իմ վազքին և հաշվում, թե քանի կիլոմետր վազեցի, քանի քայլ արեցի, ինչ արագությամբ և քարտեզի վրա ցույց տալիս իմ վազքուղին։
Նախաճաշից և առավոտյան դառը սուրճից հետո, որպես սեփական տրանսպորտային միջոց չունեցող մարդ, ես միացնում եմ ggTaxi հավելվածը, և փորձում գտնել տաքսի։ Տվյալներ այն մասին, թե որքան հաճախ եմ օգտվում, որ ուղղություններն են իմ նախընտրելիները, ովքեր են իմ նախընտրած վարորդները, միջինում որքան ժամանակ եմ սպասում․․․ այս բոլոր տվյալները հավաքվում են։
Հասնելով աշխատանքի վայր` սկսվում է տվյալների հավաքագրման փոթորիկը. էլեկտրոնային նամակներ, վճարումներ, նկարների, տեսանյութերի և տվյալների որոնումներ։ Տվյալներ, որոնք ես ինքնակամ կիսում եմ որոնողական համակարգերի հետ, որոնք անխնա կուտակում են։
Աշխատանքն աշխատանքով, բայց ընդմիջման ժամը «սրբություն» է, անփոխարինելի menu.am և նորից տվյալներ նախընտրելի ռեստորանի, ուտելիքի տեսակի, քանակի, պատվիրման ժամի վերաբերյալ։ Չնայած սոված վիճակին, այնուամենայնիվ, տվյալներով ես կիսվում եմ ինքնակամ։ Իսկ երեկոյան արդեն ուտելիքը ոչ թե պատվիրվում է, այլ այցելում եմ տարբեր սննդի կետեր ու նորից տվյալներ review-ների, comment-ների, like-երի տեսքով։
Պարզվում է՝ յուրաքանչյուր օր մենք տրամադրում ենք 2,5 քվինտիլիոն բայթ (նման բառեր չհասկացող մարդկանց համար դա 1018 է) տվյալներ, և ակնկալվում է՝ թվայնացման բումի հետ մեկտեղ այդ թիվը մոտակա երկու տարիների ընթացքում կմեծանա 90%-ով։
Հարց է առաջանում․ ինչ-որ բան փոխվելու՞ է մեզ համար կամ ինչպես կասվեր ժողովրդական լեզվով «մեզ ի՞նչ»։
Մեծ տվյալների հավաքագրումից հետո հաջորդ քայլը այդ տվյալների վերլուծությունն է և դրա հիման վրա տվյալահեն պրոդուկտների մշակում, որոնք ավելի արդյունավետ կբավարարեն այդ պրոդուկտներից օգտվողների կարիքները։ Օրինակ, եթե վերցնենք նույն հեռուստացույցի ալիքների գրանցման օրինակը, ապա տվյալների վերլուծության արդյունքում հեռուստաընկերությունները կարող են հասկանալ, թե որ ալիքներն ու հաղորդումներն են նախընտրելի իմ տարիքային խմբի մարդկանց համար և երբ է պետք դրանք հեռարձակել։ Տեխնիկական լեզվով ասած նրանք կունենա data insights։
Կամ նույն ggTaxi հավելվածը, մշակելով իմ՝ որպես հաճախորդի տվյալները, կհասկանա, որ իմ բնակավայրում վարորդները քիչ են, և սպասման ժամանակը կրճատելու ու իմ կարիքները ավելի արդյունավետ օգտագործելու համար կհամագործակցի ավելի շատ վարորդների հետ հենց իմ տարածքում։
Ինձ սովից փրկող menu.am-ը կհասկանա, որ ես միշտ պատվիրում եմ ընդմիջման համար, և իր հավելվածի միջոցով ինձ կհիշեցնի դրա մասին 12։30 կամ կառաջարկի այնպիսի ուտելիքներ, որոնք իմ նախընտրելին են։ Այս ամենի արդյունքում իմ կյանքը՝ որպես սովորական մարդու, կհեշտանա, իսկ բիզնեսի համար վաճառքի ծավալները կմեծանան, ծառայությունների որակը կլավանա։
Իսկ ինչպե՞ս է կատարվում տվյալների վերլուծություն ներկայիս դարաշրջանում, և ինչպե՞ս են ստեղծվում տվյալների հենքով պրոդուկտները։ Ո՞վ է տվյալների մասնագետը/ինժեները։
Այս ամենի մասին դեռ կխոսենք։ Չմոռանանք նաև տվյալների անվտանգության և գաղտնիության մասին։