විශාල දත්ත රැස් කරන්නේ කවුද සහ ඇයි?

2019 අගභාගයේදී, ඇපල් කාඩ් සේවාව සමඟ අපකීර්තියක් ඇති විය: ලියාපදිංචි කිරීමේදී, එය පිරිමින් සහ කාන්තාවන් සඳහා විවිධ ණය සීමාවන් නිකුත් කළේය. ස්ටීව් වොස්නියැක් පවා වාසනාවන්ත නොවීය:

වසරකට පෙර, Netflix වේදිකාව පරිශීලකයින්ට ඔවුන්ගේ ස්ත්‍රී පුරුෂ භාවය, වයස සහ ජාතිකත්වය අනුව විවිධ පෝස්ටර් සහ ටීසර් පෙන්වන බව අනාවරණය විය. මේ සඳහා සේවයට ජාතිවාදී චෝදනා එල්ල විය.

අවසාන වශයෙන්, Facebook විසින් එහි පරිශීලකයින්ගේ දත්ත එකතු කිරීම, විකිණීම සහ හැසිරවීම සම්බන්ධයෙන් මාර්ක් සකර්බර්ග්ට නිතිපතා තරවටු කරනු ලැබේ. වසර ගණනාවක් පුරා, ඔහුට චෝදනා එල්ල වූ අතර, රුසියානු විශේෂ සේවාවන්ට ආධාර කිරීම, වෛරය සහ රැඩිකල් අදහස් ඇති කිරීම, නුසුදුසු ප්‍රචාරණය, පරිශීලක දත්ත කාන්දු කිරීම, ළමා අපරාධකරුවන්ට එරෙහි පරීක්ෂණවලට බාධා කිරීම, ඇමරිකානු මැතිවරණ වලදී හැසිරවීම සඳහා පවා ඔහුට චෝදනා එල්ල විය.

zuck විසින් ෆේස්බුක් සටහන

ඒ අතරම, පෝර්න්හබ් ඔන්ලයින් සේවාව වාර්ෂිකව විවිධ ජාතීන්, ස්ත්‍රී පුරුෂ භාවය සහ වයස්වල පුද්ගලයින් සොයන්නේ කුමන ආකාරයේ අසභ්‍ය දර්ශනද යන්න පිළිබඳ වාර්තා ප්‍රකාශයට පත් කරයි. තවද කිසියම් හේතුවක් නිසා මෙය කිසිවෙකුට කරදරයක් නොවේ. මෙම සියලු කථා සමාන වුවද: ඒ සෑම එකක් තුළම අපි විශාල දත්ත සමඟ කටයුතු කරන්නෙමු, එය XNUMXst සියවසේදී "නව තෙල්" ලෙස හැඳින්වේ.

විශාල දත්ත යනු කුමක්ද?

විශාල දත්ත - ඒවා විශාල දත්ත (eng. Big Data) හෝ පාර-දත්ත - නිතිපතා සහ විශාල පරිමාවකින් පැමිණෙන දත්ත සමූහයකි. ඒවා එකතු කිරීම, සැකසීම සහ විශ්ලේෂණය කිරීම, පැහැදිලි ආකෘති සහ රටා ඇති කරයි.

කැපී පෙනෙන උදාහරණයක් වන්නේ විශාල හැඩ්‍රොන් ඝට්ටකයේ දත්ත අඛණ්ඩව සහ විශාල ප්‍රමාණවලින් පැමිණේ. ඔවුන්ගේ උපකාරයෙන් විද්යාඥයින් බොහෝ ගැටලු විසඳයි.

නමුත් වෙබයේ විශාල දත්ත විද්‍යාත්මක පර්යේෂණ සඳහා සංඛ්‍යාලේඛන පමණක් නොවේ. විවිධ කණ්ඩායම් සහ ජාතිකත්වයන් භාවිතා කරන්නන් හැසිරෙන ආකාරය, ඔවුන් අවධානය යොමු කරන දේ සහ ඔවුන් අන්තර්ගතය සමඟ අන්තර් ක්‍රියා කරන ආකාරය නිරීක්ෂණය කිරීමට ඒවා භාවිතා කළ හැක. සමහර විට, මේ සඳහා, දත්ත එකතු කරනු ලබන්නේ එක් මූලාශ්රයකින් නොව, සමහර රටා සංසන්දනය කිරීම සහ හඳුනා ගැනීමයි.

ජාලයේ විශාල දත්ත කොතරම් වැදගත්ද යන්න ගැන, ඔවුන් කතා කිරීමට පටන් ගත්තේ එය ඇත්ත වශයෙන්ම ගොඩක් ඇති විටය. 2020 ආරම්භයේදී ලෝකයේ අන්තර්ජාල භාවිතා කරන්නන් බිලියන 4,5 ක් සිටි අතර ඉන් බිලියන 3,8 ක් සමාජ ජාල වල ලියාපදිංචි වී ඇත.

Big Data වෙත ප්‍රවේශය ඇත්තේ කාටද

සමීක්ෂණවලට අනුව, අපගේ රටවල්වලින් අඩකට වඩා වැඩි සංඛ්යාවක් විශ්වාස කරන්නේ ජාලයේ ඔවුන්ගේ දත්ත තෙවන පාර්ශවයන් විසින් භාවිතා කරන බවයි. ඒ අතරම, බොහෝ දෙනෙක් සමාජ ජාල සහ යෙදුම්වල පුද්ගලික තොරතුරු, ඡායාරූප සහ දුරකථන අංකයක් පවා පළ කරති.

විශාල දත්ත රැස් කරන්නේ කවුද සහ ඇයි?
විශාල දත්ත රැස් කරන්නේ කවුද සහ ඇයි?
විශාල දත්ත රැස් කරන්නේ කවුද සහ ඇයි?
විශාල දත්ත රැස් කරන්නේ කවුද සහ ඇයි?

එය මෙහි පැහැදිලි කළ යුතුය: පළමු පුද්ගලයා පරිශීලකයා වේ, ඕනෑම සම්පතක් හෝ යෙදුමක් මත එහි දත්ත ස්ථානගත කරයි. ඒ සමගම, මෙම දත්ත සැකසීමට ඔහු එකඟ වේ (ගිවිසුමෙහි ටික් එකක් තබයි). දෙවන පාර්ශවය - එනම්, සම්පතේ හිමිකරුවන්. තෙවන පාර්ශවයක් යනු සම්පත් හිමිකරුවන්ට පරිශීලක දත්ත මාරු කිරීමට හෝ විකිණීමට හැකි අයයි. බොහෝ විට මෙය පරිශීලක ගිවිසුමේ ලියා ඇත, නමුත් සෑම විටම නොවේ.

තෙවන පාර්ශවය වන්නේ වාණිජ අරමුණු සඳහා දත්ත මිලදී ගන්නා රාජ්‍ය ආයතන, හැකර්වරුන් හෝ සමාගම් ය. හිටපු අයට අධිකරණයක හෝ ඉහළ අධිකාරියක තීන්දුවක් මගින් දත්ත ලබා ගත හැකිය. හැකර්වරුන්, ඇත්ත වශයෙන්ම, කිසිදු අවසරයක් භාවිතා නොකරයි - ඔවුන් හුදෙක් සේවාදායකයේ ගබඩා කර ඇති දත්ත සමුදායන් හැක් කරයි. සමාගම්වලට (නීතියෙන්) දත්ත වෙත ප්‍රවේශ විය හැක්කේ ඔබ විසින්ම අවසර දී ඇත්නම් පමණි - ගිවිසුම යටතේ ඇති කොටුව සලකුණු කිරීමෙන්. එසේ නොමැති නම් එය නීති විරෝධී ය.

සමාගම් Big Data භාවිතා කරන්නේ ඇයි?

වාණිජ ක්ෂේත්‍රයේ විශාල දත්ත දශක ගණනාවක් තිස්සේ භාවිතා කර ඇත, එය දැන් තරම් තීව්‍ර නොවීය. මේවා, උදාහරණයක් ලෙස, නිරීක්ෂණ කැමරාවලින් වාර්තා, GPS නාවිකයන්ගෙන් දත්ත හෝ මාර්ගගත ගෙවීම් වේ. දැන්, සමාජ ජාල, මාර්ගගත සේවා සහ යෙදුම් සංවර්ධනය කිරීමත් සමඟ, මේ සියල්ල සම්බන්ධ කර වඩාත් සම්පූර්ණ පින්තූරයක් ලබා ගත හැකිය: අනාගත ගනුදෙනුකරුවන් ජීවත් වන ස්ථානය, ඔවුන් නැරඹීමට කැමති දේ, ඔවුන් නිවාඩුවට යන ස්ථානය සහ ඔවුන් සතුව ඇති මෝටර් රථ වෙළඳ නාමය.

ඉහත උදාහරණ වලින්, විශාල දත්ත ආධාරයෙන්, සමාගම්, පළමුවෙන්ම, දැන්වීම් ඉලක්ක කිරීමට අවශ්ය බව පැහැදිලිය. එනම්, නිෂ්පාදන, සේවා හෝ තනි විකල්පයන් නිවැරදි ප්‍රේක්ෂකයින්ට පමණක් පිරිනැමීම සහ නිශ්චිත පරිශීලකයෙකු සඳහා භාණ්ඩය අභිරුචිකරණය කිරීම. මීට අමතරව, ෆේස්බුක් සහ අනෙකුත් විශාල වේදිකා වල වෙළඳ දැන්වීම් වඩ වඩාත් මිල අධික වෙමින් පවතින අතර, එය පේලියට සෑම කෙනෙකුටම පෙන්වීම කිසිසේත් ලාභදායී නොවේ.

විවෘත මූලාශ්රවලින් අනාගත ගනුදෙනුකරුවන් පිළිබඳ තොරතුරු රක්ෂණ සමාගම්, පෞද්ගලික සායන සහ සේවා යෝජකයන් විසින් ක්රියාශීලීව භාවිතා කරයි. නිදසුනක් වශයෙන්, පළමුවැන්නාට, ඔබ බොහෝ විට ඇතැම් රෝග හෝ ඖෂධ පිළිබඳ තොරතුරු සොයන බව ඔවුන් දුටුවහොත් රක්ෂණ නියමයන් වෙනස් කළ හැකි අතර, ඔබ ගැටුම් සහ සමාජ විරෝධී හැසිරීම් වලට ගොදුරු වේද යන්න සේවා යෝජකයන්ට තක්සේරු කළ හැකිය.

නමුත් මෑත වසරවලදී අරගල කරන තවත් වැදගත් කාර්යයක් තිබේ: වඩාත්ම ද්රාව්ය ප්රේක්ෂකයන්ට සමීප වීමට. තනි OFD (මූල්‍ය දත්ත ක්‍රියාකරු) හරහා ගෙවීම් සේවා සහ ඉලෙක්ට්‍රොනික චෙක්පත් මගින් කාර්යය සැලකිය යුතු ලෙස පහසු කර ඇතත් මෙය කිරීම එතරම් පහසු නොවේ. හැකි තරම් සමීප වීම සඳහා, සමාගම් ළමා කාලයේ සිට අනාගත ගනුදෙනුකරුවන් සොයා ගැනීමට සහ "පෝෂණය" කිරීමට පවා උත්සාහ කරයි.: සබැඳි ක්‍රීඩා, අන්තර්ක්‍රියාකාරී සෙල්ලම් බඩු සහ අධ්‍යාපනික සේවා හරහා.

එය ක්රියාත්මක වන්නේ කෙසේද?

දත්ත එක්රැස් කිරීම සඳහා විශාලතම අවස්ථාවන් වන්නේ එකවර සේවා කිහිපයක් හිමි ගෝලීය සංගත වලින්ය. ෆේස්බුක් දැන් බිලියන 2,5කට වඩා ක්‍රියාකාරී පරිශීලකයින් සිටී. ඒ අතරම, සමාගමට වෙනත් සේවාවන් ද ඇත: Instagram - බිලියන 1 කට වඩා, WhatsApp - බිලියන 2 කට වඩා සහ වෙනත් අය.

නමුත් ගූගල්ට ඊටත් වඩා බලපෑමක් ඇත: ජීමේල් ලෝකයේ බිලියන 1,5 ක ජනතාවක් භාවිතා කරයි, තවත් බිලියන 2,5 ක් ඇන්ඩ්‍රොයිඩ් ජංගම මෙහෙයුම් පද්ධතිය මගින්, බිලියන 2 කට වඩා යූ ටියුබ් විසින් භාවිතා කරයි. එය Google සෙවීම සහ Google සිතියම් යෙදුම්, Google Play වෙළඳසැල සහ Chrome බ්‍රවුසරය ගණන් නොගනී. එය ඔබගේ සබැඳි බැංකුව සවි කිරීමට ඉතිරිව ඇත - සහ Google හට ඔබ ගැන සෑම දෙයක්ම වචනානුසාරයෙන් දැන ගැනීමට හැකි වනු ඇත. මාර්ගය වන විට, Yandex මේ සම්බන්ධයෙන් දැනටමත් පියවරක් ඉදිරියෙන් සිටින නමුත්, එය රුසියානු භාෂාව කතා කරන ප්රේක්ෂකයින් පමණක් ආවරණය කරයි.



???? පළමුවෙන්ම, අපි සමාජ ජාල වල පළ කරන සහ කැමති දේ ගැන සමාගම් උනන්දු වෙති. නිදසුනක් වශයෙන්, ඔබ විවාහක බව බැංකුව දකින අතර Instagram හෝ Tinder හි ගැහැණු ළමයින්ට ක්රියාශීලීව කැමති නම්, ඔබ පාරිභෝගික ණයක් අනුමත කිරීමට වැඩි ඉඩක් ඇත. ඒ වගේම පවුලට උකස් තිබ්බා.

ඔබ ක්ලික් කරන දැන්වීම් මොනවාද, කොපමණ වාර ගණනක් සහ කුමන ප්‍රතිඵලයක් සමඟද යන්න වැදගත් වේ.

(එනම් ඊළඟ පියවර වන්නේ පුද්ගලික පණිවිඩ: ඒවායේ තවත් බොහෝ තොරතුරු අඩංගු වේ. VKontakte, Facebook, WhatsApp සහ අනෙකුත් ක්ෂණික පණිවිඩකරුවන් මත පණිවිඩ කාන්දු විය. ඔවුන්ට අනුව, පණිවිඩය යවන අවස්ථාවේ භූ පිහිටීම නිරීක්ෂණය කිරීම පහසුය. නිසැකවම ඔබ දැක ඇත: ඔබ යමක් මිලදී ගැනීම හෝ යමෙකු සමඟ පීසා ඇණවුම් කිරීම ගැන සාකච්ඡා කරන විට, අදාළ වෙළඳ දැන්වීම් වහාම සංග්‍රහයේ දිස් වේ.

🚕 විශාල දත්ත සක්‍රියව භාවිතා කරන අතර බෙදා හැරීම සහ කුලී රථ සේවා මගින් "කාන්දු" වේ. ඔබ ජීවත් වන සහ වැඩ කරන ස්ථානය, ඔබ ආදරය කරන දේ, ඔබේ ආසන්න ආදායම කුමක්දැයි ඔවුන් දන්නවා. උදාහරණයක් ලෙස, Uber, ඔබ බාර් එකෙන් ගෙදර යන විට සහ පැහැදිලිවම අධික ලෙස ධාවනය කරන්නේ නම් මිල වැඩි බව පෙන්වයි. ඔබේ දුරකථනයේ වෙනත් එකතුකරන්නන් සමූහයක් ඇති විට, ඊට ප්‍රතිවිරුද්ධව, ඔවුන් මිල අඩු ඒවා ලබා දෙනු ඇත.

(එනම් හැකි තරම් තොරතුරු රැස් කිරීමට ඡායාරූප සහ වීඩියෝ භාවිතා කරන සේවාවන් තිබේ. උදාහරණයක් ලෙස, පරිගණක දර්ශන පුස්තකාල - ගූගල් සතුව එකක් ඇත. ඔබේ ප්‍රමාණය හෝ උස කුමක්ද, ඔබ අඳින වෙළඳ නාම මොනවාද, ඔබ ධාවනය කරන්නේ කුමන මෝටර් රථයද, ඔබට ළමයින් හෝ සුරතල් සතුන් සිටීද යන්න බැලීමට ඔවුන් ඔබ සහ ඔබේ වටපිටාව පරිලෝකනය කරයි.

(එනම් බැංකු වෙත ඔවුන්ගේ තැපැල් යැවීම සඳහා SMS ද්වාර සපයන අයට කාඩ්පත මත ඔබේ මිලදී ගැනීම් නිරීක්ෂණය කළ හැක - අවසාන ඉලක්කම් 4 සහ දුරකථන අංකය දැනගැනීම - ඉන්පසු මෙම දත්ත වෙනත් කෙනෙකුට විකුණන්න. එබැවින් වට්ටම් සහ පිසා තෑග්ගක් ලෙස මේ සියල්ල අයාචිත තැපෑල.

🤷️️ අවසාන වශයෙන්, අපි අපගේ දත්ත වම් සේවා සහ යෙදුම් වෙත කාන්දු කරමු. එය අන් අය විසින් ලියා ඇත්තේ කෙසේදැයි සොයා බැලීමට සෑම කෙනෙකුම තම දුරකථන අංකය පුරවා ගැනීමට සතුටු වන විට Getcontact වටා එම ප්‍රබෝධය මතක තබා ගන්න. දැන් ඔවුන්ගේ එකඟතාව සොයාගෙන ඔබේ දත්ත මාරු කිරීම ගැන එය පවසන දේ කියවන්න (ස්පොයිලර්: අයිතිකරුවන්ට ඔවුන්ගේ අභිමතය පරිදි ඒවා තෙවන පාර්ශවයකට මාරු කළ හැකිය):

විශාල දත්ත රැස් කරන්නේ කවුද සහ ඇයි?

එකම Facebook සමඟ සිදු වූ පරිදි - නඩුවක් පැමිණෙන තෙක් සංගතවලට වසර ගණනාවක් පරිශීලක දත්ත සාර්ථකව එකතු කර විකිණීමට පවා හැකිය. එවිට තීරනාත්මක කාර්යභාරය ඉටු කරනු ලැබුවේ සමාගම විසින් GDPR උල්ලංඝනය කිරීමෙනි - යුරෝපා සංගමයේ නීතියක් වන අතර එය ඇමරිකානු නීතියට වඩා දැඩි ලෙස දත්ත භාවිතය සීමා කරයි. තවත් මෑත උදාහරණයක් වන්නේ Avast ප්‍රති-වයිරස සෝලිය: සමාගමේ අනුබද්ධ සේවාවන්ගෙන් එකක් මිලියන 100 සිට 400 දක්වා පරිශීලකයින්ගේ දත්ත එකතු කර විකුණනු ලැබේ.

නමුත් මේ සියල්ලෙන් අපට යම් වාසියක් තිබේද?

විශාල දත්ත අප සැමට උපකාර කරන්නේ කෙසේද?

ඔව්, දීප්තිමත් පැත්තක් ද තිබේ.

විශාල දත්ත අපරාධකරුවන් අල්ලා ගැනීමට සහ ත්‍රස්තවාදී ප්‍රහාර වැළැක්වීමට, අතුරුදහන් වූ දරුවන් සොයා ගැනීමට සහ අනතුරෙන් ඔවුන් ආරක්ෂා කිරීමට උපකාරී වේ.

ඔවුන්ගේ උදව්වෙන් අපි අපට බැංකු සහ පුද්ගලික වට්ටම් වලින් හොඳ දීමනා ලැබේ. අපි ඔවුන්ට ස්තූතියි වෙළඳ ප්‍රචාරණයෙන් පමණක් උපයන බොහෝ සේවා සහ සමාජ ජාල සඳහා අපි ගෙවන්නේ නැත. එසේ නොමැතිනම්, Instagram සඳහා පමණක් මසකට ඩොලර් දහස් ගණනක් වැය වේ.

ෆේස්බුක් පමණක් සක්‍රීය පරිශීලකයින් බිලියන 2,4 ක් සිටී. ඒ අතරම, 2019 සඳහා ඔවුන්ගේ ලාභය ඩොලර් බිලියන 18,5 කි. වෙළඳ ප්‍රචාරණය හරහා සමාගම සෑම පරිශීලකයෙකුගෙන්ම වසරකට ඩොලර් 7,7 ක් දක්වා උපයන බව පෙනී යයි.

අවසාන වශයෙන්, සමහර විට එය පහසු ය: ඔබ සිටින ස්ථානය සහ ඔබට අවශ්‍ය දේ සේවාවන් දැනටමත් දන්නා විට සහ ඔබට අවශ්‍ය තොරතුරු ඔබම සොයා බැලිය යුතු නැත.

විශාල දත්ත යෙදීම සඳහා තවත් පොරොන්දු වූ අංශයක් වන්නේ අධ්‍යාපනයයි.

වර්ජිනියාවේ එක් ඇමරිකානු විශ්ව විද්‍යාලයක, ඊනියා අවදානම් කණ්ඩායමේ සිසුන් පිළිබඳ දත්ත රැස් කිරීම සඳහා අධ්‍යයනයක් පවත්වන ලදී. මේ අය හොඳට ඉගෙන ගන්න, පන්ති මඟ හැරිලා, අයින් වෙන්න ඉන්න අය. කාරණය නම් සෑම වසරකම ප්‍රාන්තවල පුද්ගලයින් 400 ක් පමණ අඩු කරනු ලැබේ. මෙය ඔවුන්ගේ ශ්‍රේණිගත කිරීම් අඩු කර අරමුදල් කපා හැර ඇති විශ්ව විද්‍යාල සඳහා මෙන්ම සිසුන්ට ද නරක ය: බොහෝ අය අධ්‍යාපනය සඳහා ණය ලබා ගනී, අඩු කිරීමෙන් පසුව තවමත් ආපසු ගෙවීමට සිදුවනු ඇත. නැතිවූ කාලය සහ වෘත්තීය අපේක්ෂාවන් ගැන සඳහන් නොකරන්න. විශාල දත්ත ආධාරයෙන්, නියමිත වේලාවට පසුගාමී අය හඳුනාගෙන ඔවුන්ට උපදේශකයෙකු, අමතර පන්ති සහ වෙනත් ඉලක්කගත සහාය ලබා දිය හැකිය.

මෙය, මාර්ගය වන විට, පාසල් සඳහා ද සුදුසු ය: එවිට පද්ධතිය ගුරුවරුන්ට සහ දෙමාපියන්ට දැනුම් දෙනු ඇත - ඔවුන් පවසන්නේ, දරුවාට ගැටළු ඇති බවයි, අපි ඔහුට එකට උදව් කරමු. කුමන පෙළපොත් වඩා හොඳින් ක්‍රියා කරයිද සහ කුමන ගුරුවරුන් ද්‍රව්‍ය වඩාත් පහසුවෙන් පැහැදිලි කරයිද යන්න තේරුම් ගැනීමට විශාල දත්ත ඔබට උපකාර කරයි.

තවත් ධනාත්මක උදාහරණයක් වන්නේ වෘත්තීය පැතිකඩයි.: නව යොවුන් වියේ දරුවන්ට ඔවුන්ගේ අනාගත වෘත්තිය තීරණය කිරීමට උපකාර වන අවස්ථාව මෙයයි. මෙහිදී, සාම්ප්‍රදායික පරීක්ෂණ භාවිතයෙන් ලබා ගත නොහැකි තොරතුරු රැස් කිරීමට විශාල දත්ත ඔබට ඉඩ සලසයි: පරිශීලකයා හැසිරෙන ආකාරය, ඔහු අවධානය යොමු කරන දේ, ඔහු අන්තර්ගතය සමඟ අන්තර් ක්‍රියා කරන ආකාරය.

එම ඇමරිකා එක්සත් ජනපදයේ, වෘත්තීය මාර්ගෝපදේශ වැඩසටහනක් ඇත - SC ACCELERATE. එය වෙනත් දේ අතර, CareerChoice GPS තාක්ෂණය භාවිතා කරයි: ඔවුන් සිසුන්ගේ ස්වභාවය, විෂයයන් කෙරෙහි ඔවුන්ගේ නැඹුරුව, ශක්තීන් සහ දුර්වලතා පිළිබඳ දත්ත විශ්ලේෂණය කරයි. යෞවනයන්ට ඔවුන් සඳහා සුදුසු විද්‍යාල තෝරා ගැනීමට උපකාර කිරීමට දත්ත පසුව භාවිතා වේ.


Yandex.Zen මත දායක වී අපව අනුගමනය කරන්න — තාක්ෂණය, නවෝත්පාදන, ආර්ථික විද්‍යාව, අධ්‍යාපනය සහ එක් නාලිකාවක බෙදාගැනීම.

ඔබමයි