இயந்திர கற்ற,ல் ஆழ்கற்றல் ஆகிய வழிமுறைகளுக்காக Weka எனும் கட்டற்ற கட்டணமற்ற பயன்பாடுஉதவிடுகின்றது

இயந்திர கற்றல், ஆழ்கற்றல் , முன்கணிப்பு பகுப்பாய்வு ஆகியதற்போதைய பல்வேறு நவீனவசதி வாய்ப்புகள் பொறியியல், நிதியியல், பொருளாதாரம், நிகழ்நேரமுன் கணிப்பு ஆ கிய பல்வேறு துறைகளில் ஆராய்ச்சியின் முக்கிய களங்களாக விளங்குகின்றன இதற்காக இந்தத் துறைகளில் ஆராய்ச்சியாளர்கள் வெவ்வேறு கருவிகளிலும் தொழில்நுட்பங்களிலும் அல்லும் பகலும் அயராது பணியாற்றி அதிக அளவு துல்லியத்தை அடைந்து வருகின்றார்கள், ஆழ்கற்றல் பணியானது இயந்திரக் கற்றலுடன் (எம்.எல்) மிகவும் நெருக்கமாக ஒருங்கிணைக்கப்பட்டுள்ளது, இதன் விளைவாக குறைந்தபட்ச பிழை விகிதத்துடன் அதிக அளவு செயல்திறனும் துல்லியமும் கிடைக்கின்றது
இதற்காக ஏராளமான மென்பொருள் நூலகங்கள் பரவலாகப் பயன்படுத்தப்படுகின்றன என்றாலும், Weka என்பது ஆராய்ச்சியாளர்கள் , தரவு தளவிஞ்ஞானிகள் ஆகியோர்களால் விரும்பப்படும் ஒரு மிகவும் சக்திவாய்ந்த கருவியாக விளங்குகின்றது. இது பிக் டேட்டா அனலிட்டிக்ஸ் உள்ளிட்ட இயந்திர கற்றல் , தரவு அறிவியல் அடிப்படையிலான வழிமுறைகளின் மிகப்பெரிய தொகுப்பைக் கொண்டுள்ளது. இந்த Weka என்பது மீப்பெரும் தரவுகளைஆய்வுசெய்திடவும் இயந்திரகற்றலிற்கும் உதவகாத்திருக்கும் ஒரு கட்டற்ற கட்டணமற்ற கருவியாகும் இந்த Weka ஆனது கட்டளை வரி இடைமுகம், வரைகலை பயனர் இடைமுகம் (GUI) ஆகியவற்றுடனான வழிமுறைகளை செயல்படுத்தி பயன்படுத்தி கொள்ளும். வகையில்உருவாக்கி வெளியிடப்பட்டுள்ளது முன்பே ஏற்றப்பட்ட தொகுப்புகளைத் தவிர, மேம்பட்ட பயன்பாடுகளுக்காக ஒருங்கிணைக்கக்கூடிய வகைப்படுத்தப்பட்ட நீட்டிப்பு தொகுப்புகள் பல இதில் உள்ளன. இந்த Wekaவில் இயந்திர கற்றல் வழிமுறைகளைப் பயன்படுத்தி முன்கணிப்புகள் செயற்படுத்திடபடுகின்றன குறிப்பாக இதில் ஆழ்கற்றலிற்காக மட்டுமெனதனியான WekaDeepLearning4j என்பது பயன்படுத்தி கொள்ளலாம் இதற்கான இணைய முகவரி(https://deeplearning.cms.waikato.ac.nz/) யாகும் .தற்போது Weka 3.8 Weka 3.9 ஆகிய இருபதிப்புகளாக GPL எனும்பொதுஅனுமதியின் அடிப்படையில் பொதுமக்களின் பயன்பாட்டிற்காக வெளியிடப்பட்டுள்ளது இதனுடைய இணையமுகவரி https://www.cs.waikato.ac.nz/ml/weka/ ஆகும்

ஆழ்கற்றலில் TensorFlow எனும் கட்டற்ற பயன்பாட்டினை பயன்படுத்தி கொள்க

தற்போது ஆழ்கற்றலானது (Deep Learning)பேரளவு தரவுகளை அலசி ஆராய்வதற்கான சிறந்த கருவியாகவும் புத்திதசாலிதனமான அமைவாகவும் பரவலாக பயன்படுத்தி கொள்ளப்படுகின்றது அவ்வாறான ஆழ்கற்றலை பயன்படுத்தி கணினியின் அடிப்படையில் நாம் மனிதர்கள் பேசும் இயற்கையான மொழிகளை செயல்படுத்திடு-வதற்காக வும்(NLP) ,பேசுவதை அங்கீகரிப்பதற்கும் fault diagnosis, predictive maintenance, mineral exploration, computer vision என்பனபோன்ற எண்ணற்ற செயல்களை செயல்படுத்து-வதில் TensorFlow எனும் கட்டற்ற மென்பொருளானது முதன்மையான பங்காற்றுகின்றது இது வரைபடத்தின் அடிப்படையிலான கணினி செயல்படுமாறு புதிய கட்டமைவினை செய்திடும் திறன்மிக்கது இந்த TensorFlow என்பது பைதானின் நிரல்தொடர் வடிவமைப்பின் அடிப்படையில் உருவாக்கி வெளியிடப் படுகின்றது அவ்வாறான பைதானின் அடிப்படையிலானஒரு எளிய TensorFlow வின் கணித செயல்பாட்டினை இப்போது காண்போம்
a = tf.Variable([4])
b = tf.Variable([7])
with tf.Session() as session:
session.run(tf.global_variables_initializer())
b = a + b
result = session.run(a)
print(a)
result = session.run(b)
print(b)
print(session.run(a))
print(session.run(b))
இதில்tf.global_variables_initializer() எனும் கட்டளைவரியானது உலகாளாவிய மாறிகளின் மதிப்பை துவக்கநிலைக்கு கொண்டுசெல்கின்றது இந்த TensorFlow இல் tf.Variable எனும் மாறிகள் மாறிகளின்(variables)தரவுகளை கையாளுவதறகாக பயன்படுத்தி கொள்ளப்-படுகின்றன. TensorFlow ஆனது ஒரு தரவோட்ட வரைபடத்தினை (dataflow graph) அனைத்து கணக்கீடுகளை சார்ந்திருக்கும் தனிப்பட்ட செயல்களை குறிப்பதற்காக பயன்படுத்தி கொள்கின்றது அதன்பின்னர் TensorFlow session என்பது உருவாக்கப்பட்டு உள்ளக அல்லது தொலைவிலுள்ள சாதனங்கள் அனைத்திலும் இந்த வரைபடங்கள் இயக்கப்படுகின்றன இறுதி பயனாளிகளிடமிருந்து சாதனங்களில் tf.estimator, Estimator , Keras ஆகிய மேல்நிலை APIs கள் வரைபடங்களின் sessionsகளின் விவரங்கள் மறைக்கப்படுகின்றன இந்த தரவுோட்ட வரைபடத்தில் முனைமங்கள் கணக்கீட்டு unitsகளையும் edges களானவை தரவுகள் பயன்படுத்தப்பட்டவைகளையும் அல்லது கணக்கீட்டில் உருவாக்கப்பட்டவைகளையும் பிரிதிநிதிபடுத்திகின்றன TensorFlow ஆனது ஒரு தரவோட்ட வரைபடத்தினுடன்கூடிய கணக்கீட்டு நூலகமாக மிகமேம்பட்ட பயன்பாடுகளை பயன்படுத்தி கொள்ள உதவுகின்றது ஒரு TensorFlowஐ செயல்படுத்திட துவங்கிடும்போது API ஆனது இயல்புநிலை வரைபடச்செயலிற்கான node , edge ஆகியவை உருவாகின்றன tf.Variable()எனும் மாறியானது எழுதகூடிய TensorFlow மதிப்பினை சேமித்து வைப்பதற்காக ஒரு செயலை சேர்க்கின்றது தொடர்ந்து இருsession.run() களுக்குஇடையே இ்ந்த மாறியானது செயலில் இருக்கின்றது அதனை தொடர்ந்து வரைபடத்திற்கு தேவையான மதிப்புகளை சேர்த்து வரைபடத்தினை உருவாக்குகின்றது

LSTMஎன்பதன் துனையுடன் தரவுகளின் வரிசைகளில் ஆழமான கற்றலை செயல்படுத்திடுக

“ஆழமான கற்றல் பல செயலாக்க அடுக்குகளைக் கொண்ட கணக்கீட்டு மாதிரிகள் பல நிலைகளின் சுருக்கத்துடனான தரவுகளின் பிரதிநிதித்துவங்களைக் கற்றுக்கொள்ள அனுமதிக்கின்றது” என்று யான் லீகன் என்பவர் ஆழமான கற்றலை (Deep Learning)வரையறுக்கின்றார்
தரவுகளின் வரிசைகளில் ஆழமான கற்றல் மற்ற வகை தரவுகளுடன் ஒப்பிடும்போது காட்சிகளுடன் மேற்பார்வையிடப்பட்ட கற்றல் வேறுபட்டது. இங்கே, வரிசைகிரமத்தையும் அதன் செயல்முறையையும் நாம் கருத்தில் கொள்ள வேண்டும். மாதிரிகள் உருவாக்க பயிற்சி அளிக்க ஒவ்வொரு வரிசைக்கும் சரியான தரவுகளின் தொகுப்பை நாம் தேடிகண்டுபிடிக்க வேண்டும். இந்த ஆழமான கற்றலிலுள்ள வெவ்வேறு வகையான வரிசைமுறைகள் பின்வருமாறு.
1) வரிசை கணிப்புகள்: இது வரிசை மாதிரியின் அடிப்படையில் அடுத்த வரிசையின் முன்கணிப்பு ஆகும்.
2) வரிசை வகைப்பாடு: இது வரிசை மாதிரியின் அடிப்படையில் ஒரு வரிசையை வகைப்படுத்துகிறது.
3) வரிசை உருவாக்கம்: இது வரிசை முறையின் அடிப்படையில் ஒரு புதிய வரிசையை உருவாக்குகிறது.
இவ்வாறான வரிசை முன்கணிப்பு குறித்த நம்முடைய பகுப்பாய்வுகளின் அடிப்படையில், வரிசை வகைப்பாட்டில் உருவாகிடும் சிக்கல்களுக்கு தீர்வாக நீண்ட குறுகிய கால நினைவகமானது (LSTM) சிறப்பாக செயல்படுகின்றது.
நீண்ட குறுகிய கால நினைவகம் (Long Short Term Memory(LSTM))
பாரம்பரிய நரம்பியல் வலைபின்னல்கள் கடந்த காலத்தை நினைவில் கொள்ள முடியாது, ஆனால் சமீபத்திய கடந்த காலத்தை (குறுகிய கால நினைவகம்) மட்டுமே இந்த வலைபின்னல்களின் குறைபாடாக கருதப்படுகிறது. தொடர்ச்சியான நரம்பியல் வலைபின்னல்களை (RNN) கொண்டுஇந்த சிக்கலை சரிசெய்ய முடியும் (இதைப் பற்றி மேலும்அறிந்து கொள்ள http://karpathy.github.io/2015/05/21/rnn-effectiveness/ எனும் இணைய முகவரிக்கு செல்க). LSTM என்பது உண்மையில் ஒரு சிறப்பு வகையான RNN ஆகும், இது நீண்ட கால சார்புகளைக் கற்றுக் கொள்ளும் திறன் கொண்டது. வரிசைப்படுத்துதல் வகைப்பாடு , முன்கணிப்பு மாதிரி ஆகியவற்றைத் தீர்வு செய்வதற்காக, கடந்த வரிசைகளை நினைவில் வைத்துக் கொள்ள நமக்கு உண்மையில் நரம்பியல் பிணையம் தேவையாகும், இதன் மூலம் நாம் வரிசையை வகைப்படுத்தவும்அல்லது கணிக்கவும் முடியும். இந்த தலைப்புகளைப் பற்றி நமக்கு அதிகம் தெரியாவிட்டால், RNN, LSTM ஆகியவற்றை பற்றி மேலும் கற்றறிந்து கொள்க என பரிந்துரைக்கப்படுகின்றது.