உலகை ஆளும் தரவுகள்: தரவு விஞ்ஞானி (Data Scientist) ஆவது எப்படி?

 சில ஆண்டுகளுக்கு முன்புவரை +2-வுக்குப் பிறகான மேற்படிப்புகளுக்கு மாணவர்களின் முதன்மைத் தேர்வாக பொறியியலும், மருத்துவமும் இருந்தன. 2000-க்குப் பிறகான காலகட்டத்தில் இந்தியாவில் உற்பத்தித் துறையும், தகவல் தொழில்நுட்பத்துறையும் (ஐ.டி) வளர்ச்சியடையத் தொடங்கியிருந்த நிலையில் பொறியியல், கணினி அறிவியல் படிப்பில் சேர மாணவர்கள் மிகுந்த ஆர்வம் காட்டினர். 

 காலப்போக்கில் இந்த நிலை மாறி கலை, அறிவியல் படிப்புகளில் மாணவர்களின் கவனம் குவிந்தது. அந்தக் கவனம் இன்றைக்கும் தொடர்கிறது என்றாலும், தொழில்நுட்ப மேம்பாடும், தொழில்நுட்பத்தை மையப்படுத்திய வாழ்க்கைமுறையின் வளர்ச்சியும் பொறியியலில் புதிய படிப்புகளை உருவாக்கியிருக்கின்றன. 

இது பொறியியல் மீதான மாணவர்களின் ஆர்வத்தை மீண்டும் துளிர்க்கச் செய்துள்ளது. தரவு அறிவியல் (DATA SCIENCE) என்றால் என்ன? தரவுகள் (Data) என்பவை பயனுள்ள குறிப்புகள் எனலாம். அவை எண்களாகவோ, வெப்பநிலை, ஒலி, ஒளி, அழுத்தம், உயரம் முதலான அளவீடுகளாகவோ, சொற்களாகவோ அல்லது பிற பயனுடைய குறிப்புகளாகவோ இருக்கலாம். எந்த ஒன்றைப் பற்றியும் ஆய்வு செய்ய வேண்டும், அலச வேண்டும் என்றால் அடிப்படையாகத் தரப்பட வேண்டிய குறிப்புகளாக அல்லது செய்திகளாக இருப்பதால் இவை தரவுகள் எனப்படுகின்றன. 

இவ்வகைத் தரவுகளைக் கொண்டு முறைப்படி ஆய்வு செய்து புதிய முடிவுகள், கருத்துகள், கண்டுபிடிப்புகள் ஆகியவற்றைப் பெற முடியும். உலகில் இதுவரை உற்பத்தி செய்யப்பட்ட தரவுகளில், 90 சதவிகிதம் கடந்த 2 ஆண்டுகளில் மட்டுமே உற்பத்தி செய்யப்பட்டிருக்கின்றன என்ற தகவல் உங்களைத் திகைக்கச் செய்யலாம். மனிதர்கள் நாளொன்றில் சுமார் 2.5 குவின்டில்லியன் பைட்ஸ் அளவுக்குத் தரவுகள் உற்பத்தி செய்கின்றனர். 

2025-ல் 463 எக்ஸாபைட்ஸ் அளவுக்கான தரவுகளை நாளொன்றில் மனிதர்கள் உற்பத்தி செய்வார்கள் என்று கணிக்கப்பட்டுள்ளது. 'Data is the new oil' என்று கூறும் அளவுக்கு தரவுகளின் ஆற்றல் வளர்ந்திருக்கிறது; ஆம், நாம் வாழ்வது பெருந்தரவுகளின் யுகத்தில்! 2020-ம் ஆண்டு இந்தியாவில் இணையப் பயனாளர்களின் எண்ணிக்கை 69 கோடியாக இருந்தநிலையில், இந்த ஆண்டு அது 76 கோடியாக உயர்ந்திருக்கிறது. இந்த எண்ணிக்கை அடுத்த ஆண்டு 82 கோடியாக உயரும் என்று கணிக்கப்பட்டுள்ளது; 2017-ல் இந்தியாவில் 24 கோடியாக இருந்த ஃபேஸ்புக் பயனாளர்களின் எண்ணிக்கை, 2020-ல் 34 கோடியாக உயர்ந்திருக்கிறது. 

இத்தனை கோடி பயனாளர்களின் இணையச் செயல்பாடுகள் உற்பத்தி செய்யும் தரவுகளின் அடிப்படையில் தான் விளம்பரங்களும், பரிந்துரைகளும் இன்னும் பிறவும் திரையில் தோன்றுகின்றன. இந்தக் கட்டற்ற தரவுகளைக் கொண்டு தரவு அறிவியலின் அடிப்படையில் உருவாக்கப்படும் நிரல்கள்தான் இணைய உலகை இன்று ஆள்கின்றன. ஆக, டிஜிட்டல் உலகில் நம்முடைய இயக்கம் என்பது நாம் உற்பத்தி செய்யும் தரவுகளின் அடிப்படையில் நிர்ணயிக்கப்படுகிறது; 

அது நம் யதார்த்த வாழ்விலும் எதிரொலிக்கத் தொடங்கியிருக்கிறது. இந்தப் பின்னணியில் தான் தரவு அறிவியல் என்பது மிகுந்த முக்கியத்துவம் பெறும் ஒன்றாக இன்றைக்குப் பரிணமித்திருக்கிறது. தரவு அறிவியல் என்றால் என்ன என்று இப்போது உங்களுக்கு ஓர் அறிமுகம் கிடைத்திருக்கும். இது அடிப்படையில் ஒரு தகவல் தொழில்நுட்பப் பிரிவு. உற்பத்தியாகும் ஒட்டுமொத்த தரவுகளைத் தொகுத்து, அவற்றை ஒருங்கிணைத்து அவற்றிலிருந்து பயன்படக்கூடிய தேவையாக தரவுகளைப் பிரித்து குறிப்பிட்ட புதிய தரவுகளை எதிர்காலச் செயல்பாட்டுக்கு உருவாக்குதல் தரவு அறிவியல் எனப்படுகிறது. யாரெல்லாம் படிக்கலாம்? எந்தவொன்றின் அடிப்படைக் கட்டமைப்பின் மீதும், அதன் அடுத்தடுத்த நிலைகள் மீதும் ஈடுபாடு உள்ளவர்களுக்கு ஏற்ற துறையாக தரவு அறிவியல் விளங்குகிறது. 

எண்கள், கணக்குகளில் ஆர்வம் கொண்ட கணிதம், புள்ளியியல் மாணவர்கள் தரவு அறிவியலை எளிமையாகப் படிக்க முடியும்; கணிதம், புள்ளியியல், கணினி அறிவியல், பொறியியல் படித்தவர்கள் இந்தத் துறையைத் தேர்ந்தெடுப்பது பொருத்தமானதாக இருக்கும். மற்ற படிப்புகளில் இருந்து சற்றே மாறுபட்ட இந்தத் துறையில், கட்டற்ற எண்ணிக்கையிலான தரவுகளைக் கையாள்வதற்கு மன ஆற்றலும் அவசியமாகிறது. எக்ஸெல் (Excel) குறித்த அறிவும் தேவை; ஆர் (R) ப்ரோகிராமிங், டாப்ளூ (Tableau), மைக்ரோசாஃப்ட் பிஐ (BI), கூகுள் சார்ட்ஸ் (Charts), பைதன் (Python), சாஸ் (SAS) போன்ற நிரல்கள் குறித்த அறிவு இருப்பதும் அவசியமானது. 

இந்தத் தகுதிகளோடு தரவு அறிவியலைப் படிப்பவர்கள் துறை சார் வல்லுநர்களாக மிளிரலாம். எங்கு படிக்கலாம்? இந்தியாவில் கீழ்கண்ட இடங்களில் டேட்டா சயின்ஸ் பயிலலாம்: Indian Institute of Information Technology and Management (IITM) – Kerala, IIT Madras, IIIT Delhi, Jawaharlal Nehru University (JNU), Indian Institute of Science (IISc) - Bangalore, National Institute of Securities Markets (NISM), IIM Calcutta, IIT Hyderabad, IIT Kharagpur, Ahmedabad University, Academy of Maritime Education and Training, Bharathiar University Coimbatore. தமிழகத்தில் வி.ஐ.டி பல்கலைக்கழகம், சென்னை லயோலா கல்லூரி போன்ற இடங்களில் எம்.ஸ்.சி., டேட்டா சயின்ஸ் படிப்பு வழங்கப்படுகிறது. இவை தவிர, இணைய வழியிலான டேட்டா சயின்ஸ் படிப்பைச் சென்னை ஐ.ஐ.டி. வழங்குகிறது. விண்ணப்பிப்பது எப்படி? சென்னை ஐ.ஐ.டி-யில் வழங்கப்படும் இணைய வழியிலான டேட்டா சயின்ஸ் படிப்புக்கு விண்ணப்பிப்பதற்கான வழிமுறைகள் குறித்து விரிவாக அறிய இந்த இணையப் பக்கத்துக்குச் செல்லலாம்: https://onlinedegree.iitm.ac.in/admissions.html#AD1 கொல்கத்தாவிலுள்ள பிராக்ஸிஸ் பிஸ்னஸ் ஸ்கூல் போன்ற தனியார் நிறுவனங்கள் உதவித்தொகையுடன் டேட்டா சயின்ஸ் படிப்பை வழங்குகின்றன; மேலதிக விவரங்களுக்கு இந்த இணையப் பக்கத்துக்குச் செல்லலாம்: https://praxis.ac.in/Programs/data-science-course-program/ சான்றிதழ் படிப்பாகவும் வழங்கப்படும் டேட்டா சயின்ஸ் பயில புள்ளியியல், கணினியியல், கணிதம் படித்தவர்களுக்கு முன்னுரிமை வழங்கப்படுகிறது. வேலைவாய்ப்புகள் டேட்டா சயின்ஸ் படித்தவர்களுக்கு, Data Scientist, Data Architect, Data Mining Engineer, Business Intelligence Analyst என ஏராளமான வாய்ப்புகள் கொட்டிக் கிடக்கின்றன. தமிழகம், இந்தியா மட்டுமல்லாது உலகம் முழுவதும் இதற்கான வேலைவாய்ப்புகள் உள்ளதால், வரும் காலங்களில் மாணவர்களின் தவிர்க்கமுடியாத தேர்வாக டேட்டா சயின்ஸ் இருக்கும் என்று எதிர்பார்க்கப்படுகிறது! 

Related links: 


Post a Comment

Previous Post Next Post

Search here!