Տվյալագիտությունը որպես այս դարաշրջանի «սև ոսկի»
Ժամանակին նավթը համարվում էր «սև ոսկի» այն երկրի համար, որն ուներ խոշոր նավթային հանքեր։ Ներկայումս ՏՏ ոլորտի «զավթման» դարաշրջանում «սև ոսկի» կարելի է համարել տվյալագիտության զարգացման մակարդակը։ Ինչպես նավթի դեպքում, այս դեպքում էլ շահում և ավելի շատ եկամուտ են ստանում այն ընկերությունները, որոնք հնարավորինս արդյունավետ են այն օգտագործում։
«Մեծ տվյալների դարաշրջան» հոդվածում քննարկեցինք, թե ինչ են մեծածավալ տվյալները, ինչ կտան մեզ՝ հասարակ մահկանացուներիս, և դրանց արդյունավետ օգտագործումը։ Իսկ ինչպե՞ս է տեղի ունենում տվյալագիտությունը կամ տվյալների հենքով պրոդուկտների մշակումը։
Տվյալագիտությունն ինձ հիշեցնում է իմ այցը Ռուսական պետական թանգարան։ Շրջելով սրահներում՝ հանկարծակի հայտնվեցի մի նկարի առաջ, որին նայելով տեսնում էի միայն կետեր, ինչ-որ անիմաստ վրձնի հարվածներ։ Հեռանալով կես մետր և գլուխս փոքր-ինչ բարձրացնելով` նկատեցի, որ այդ կետերն ունեն որոշակի օրինաչափություն և երբ իրենց միացնում ես, ստացվում է ալիք։ Իսկ երբ ալիքներն ես իրար միացնում, ստացվում է փոթորիկ, որի ժամանակ ալիքներից որոշներն արդեն գրավել են նավը, իսկ որոշներն էլ դեռ սպասվում են։ Ընդհանուր պատկերը տեսնելու համար ես ստիպված էի մի քիչ ավելի հեռու գնալ: Այդ դեպքում նոր հասկացա, որ կանգնած եմ Այվազովսկու «Իններորդ ալիք» կտավի առջև։ Այս նույն գործընթացը տեղի է ունենում տվյալագիտության մեջ։
Ի՞նչ փուլերից է բաղկացած տվյալների հենքով որևէ նախագծի իրականացումը
Տվյալագիտությունը նախ և առաջ տվյալների հավաքագրումն է, որը նկարի պարագայում նույնն է, ինչ ներկի կետերը տեսնելը։ Ինչպես նկատել եք նախորդ հոդվածում, տվյալները շատ հաճախ առաջանում են ինքնաբերաբար, իսկ համապատասխան համակարգերի և գործընթացների առկայության դեպքում նաև հավաքագրվում են։ Թվային այս դարաշրջանում մեր ամեն մի քայլն է թվային, հետևաբար մեր թողած հետքերն ու տրված տվյալներն էլ են թվային։ Եթե վերցնենք ցանկացած առցանց գնում, ենթադրենք` գնում ենք մանկական հագուստ, ապա մենք ինքնակամ գրանցվում ենք այդ կայքում, տրամադրում ենք տեղեկատվություն մեր մասին, մեր բանկային տվյալները, ինչպես նաև որոշակիորեն ներկայացնում ենք, թե որ տարիքային խմբի համար ենք գնումներ անում, ինչ սեռի է նա, կամ որ գումարային սանդղակի հագուստ ենք մենք նախընտրում։
Տվյալների հավաքագրումից հետո կատարվում է այսպես կոչված ՝ data munging, երբ տվյալները դուրս են բերվում համակարգից հետագա օգտագործման համար, այնուհետև տվյալների մաքրում/data cleaning, որից հետո տվյալների վերլուծաբանները կամ ինժեներները սկսում են գտնել տվյալների մեջ որոշակի օրինաչափություններ։ Այս փուլում, որպես իսկական հետախույզներ, նրանք ուսումնասիրում են բոլոր հնարավոր կապերը, օրինաչափությունները և տարբերությունները և գտնում data insights, որոնց հիման վրա տվյալների ինժեներները կատարում են data modeling և ստեղծում տվյալների հենքով պրոդուկտներ։ Կոնկրետ մանկական հագուստի գնումների դեպքում տվյալ կայքը, ուսումնասիրելով իմ գնումները, կհասկանա, որ օրինակ՝ ես հիմնականում գնում եմ հագուստ 1,5 տարեկան տղայի համար։ Ուսումնասիրելով իմ կողմից կատարված մի քանի գնումները՝ կստանա հետևյալ insight-ները՝ միջին գնային սանդղակ, ոչ շատ սպորտային, բնական նյութերից, հիմնականում բամբակյա և այլ պարամետրեր։ Տվյալների մասնագետները կմշակեն տվյալների մոդելներ, որոնց կիրառությամբ ինձ կառաջարկվի իմ նախապատվություններին համապատասխան այլ տարբերակներ։ Կոնկրետ այս պարագայում ես կստանամ էլ․ նամակներ մանկական հագուստի հնարավոր տարբերակներ, որոնք կամ կհամապատասխանեն իմ նախորդ գնումներին, կամ կլինեն իմ նախապատվություններին համապատասխան։ Այս գործընթացը իրականացնելու և ավտոմատացնելու համար անհրաժեշտ է ունենալ տվյալների ինժեներ, ով շատերին կարող է թվալ գաղտնիքներ բացահայտող սուպերհերոս։
Ի՞նչ հմտություններ են պետք տվյալների ինժեներ դառնալու համար
Եթե նայենք հմտությունների և գիտելիքների տեսանկյունից, ապա տվյալների մասնագետը պետք է ունենա
- գերազանց մաթեմատիկակական գիտելիքներ,
- լավ վերլուծական հմտություններ,
- տիրապետի որոշակի մակարդակի ծրագրավորման, մասնավորապես այնպիսի լեզուների, որոնց օգնությամբ կատարվում է տվյալների վերլուծություն և վիզուալիզացիա,
- ամենակարևորը, ունենա բիզնեսի տվյալ ոլորտի գիտելիքներ և փորձ։
Մասնավորապես, եթե խոսքը գնում է առևտրի մասին, ապա պարտադիր է, որ նա ունենա որոշակի փորձառություն մանրածախ և առցանց վաճառքի ոլորտում։ Տվյալների մասնագետը կամ ինժեները նույն ծրագրավորողը չէ։ Տարբերություններն այս երկու մասնագետների միջև շատ են․ եթե ծրագրավորողը ստեղծում է որոշակի կարիքների համար անհրաժեշտ կամ համապատասխան թվային գործիք, ապա տվյալների ինժեները հավաքում է տվյալները, վերլուծում է և դրանց հիման վրա մշակում մոդելներ, որոնք որոշակի թեստավորումից հետո կարող են դառնալ կամ առանձին պրոդուկտներ, կամ առանձին մոդուլներ/features։
Արդյո՞ք հետաքրքիր է տվյալագիտությունը
Տվյալագիտության հանդեպ հետաքրքրությունը գնալով մեծանում է, սակայն այն դեռևս «թանկարժեք» ոլորտ է և լայնամասշտաբ հասանելի է միայն մեծ ընկերություններին, ինչպիսիք են օրինակ՝ Microsoft-ը, Amazon-ը, Facebook-ը։ Այնուհանդերձ, տվյալագիտությունը կիրառելի է բոլոր ոլորտներում և հետաքրքիր լուծումներ կարող է առաջարկել առողջապահության, գյուղատնտեսության, բանկային և այլ ոլորտում։ Եթե ուղղակի դիտարկենք մեր առօրյա կյանքը, ապա դրանց կիրառելիության ոլորտները մենք ինքներս կնախանշենք։ Օրինակ՝ նույն առողջապահության ոլորտում գլաուկոմա ունեցող հիվանդների համար շատ կարևոր է ունենալ գրանցումներ այն մասին, թե օրվա որ ժամերին են կաթեցնում դեղերը, (այն պետք է կաթեցնել 12 ժամ ընդմիջումով), ամսական մեկ անգամ ստուգել աչքի ներակնային ճնշումը, ինչպես նաև գրանցել այդ ժամանակահատվածում սրտի աշխատանքի կանոնավորությունը և արյան ճնշումը։ Հաշվի առնելով, որ տվյալ հիվանդության դեպքում աչքը շատ արագ սովորում է ազդող դեղին՝ հիվանդները ստիպված են հաճախակի փոխել դեղերը և նրանց համադրությունը։ Այս բոլոր տվյալները հիվանդություն ունեցող մարդիկ ամեն դեպքում ունենում են, երբեմն թվային, երբեմն էլ ոչ թվային տարբերակով։ Տվյալագետները, ուսումնասիրելով առկա տվյալները, կարող են հետաքրքիր բացահայտումներ անել և ուղղորդել ոչ միայն հիվանդներին, այլ նաև բժիշկներին այն հարցում, թե երբ նշանակեն հիվանդի հաջորդ այցելությունը, կամ հասկանան տվյալ հիվանդի անցած ճանապարհը, նրա ընդունած դեղերի հաջորդականությունը, թե դեղատներին, որոնք կարող են հասկանալ, թե որոնք են ոլորտում պահանջարկ ունեցող դեղերը և նրանց սպառման ժամկետները, դեղարտադրող ընկերություններին, որոնք կարող են հասկանալ օգտագործողների մոտ նկատվող արդյունքները՝ իջած ճնշման, ալերգիայի կամ այլ դեղերի հետ համադրության իմաստով։
Տվյալագիտությունն իր հետ բերում է նոր հասկացություններ և գաղափարներ, ինչպիսիք են՝ մեքենայացված ուսուցումը, արհեստական բանականությունը և այլն։ Այս ամենի մասին կքննարկենք հաջորդ հոդվածի ժամանակ։