Home செய்திகள் மெட்டா மிகப்பெரிய லாமா 3 AI மாதிரியை வெளியிடுகிறது, மொழி மற்றும் கணித ஆதாயங்களைக் கோருகிறது

மெட்டா மிகப்பெரிய லாமா 3 AI மாதிரியை வெளியிடுகிறது, மொழி மற்றும் கணித ஆதாயங்களைக் கோருகிறது

சந்தா அடிப்படையிலான ChatGPT-4க்கு சவால் விடும் வகையில் இந்த மாடல் இலவசமாக அமைக்கப்பட்டுள்ளது

நியூயார்க்:

மெட்டா பிளாட்ஃபார்ம்கள் அதன் பெரும்பாலும் இலவச லாமா 3 செயற்கை நுண்ணறிவு மாடல்களின் மிகப்பெரிய பதிப்பை செவ்வாயன்று வெளியிட்டது, இது பலமொழி திறன்கள் மற்றும் OpenAI போன்ற போட்டியாளர்களிடமிருந்து பணம் செலுத்திய மாடல்களின் ஹீல்ஸைப் பற்றிய பொதுவான செயல்திறன் அளவீடுகளை பெருமைப்படுத்துகிறது.

புதிய Llama 3 மாடல் எட்டு மொழிகளில் உரையாட முடியும், உயர்தர கணினி குறியீட்டை எழுத முடியும் மற்றும் முந்தைய பதிப்புகளை விட சிக்கலான கணித சிக்கல்களை தீர்க்க முடியும் என்று Facebook தாய் நிறுவனம் வலைப்பதிவு இடுகைகள் மற்றும் வெளியீட்டை அறிவிக்கும் ஆய்வுக் கட்டுரையில் தெரிவித்துள்ளது.

405 பில்லியன் அளவுருக்கள் அல்லது பயனர் வினவல்களுக்கு பதில்களை உருவாக்க அல்காரிதம் கணக்கில் எடுத்துக்கொள்ளும் மாறிகள், கடந்த ஆண்டு வெளியிடப்பட்ட முந்தைய பதிப்பைக் குறைக்கிறது, இருப்பினும் போட்டியாளர்கள் வழங்கும் முன்னணி மாடல்களை விட இது இன்னும் சிறியது.

OpenAI இன் GPT-4 மாடல், மாறாக, ஒரு டிரில்லியன் அளவுருக்கள் இருப்பதாகவும், அமேசான் 2 டிரில்லியன் அளவுருக்கள் கொண்ட மாதிரியை தயார் செய்து வருவதாகவும் தெரிவிக்கப்பட்டுள்ளது.

பல சேனல்களில் லாமா 3 ஐ விளம்பரப்படுத்திய தலைமை நிர்வாகி மார்க் ஜுக்கர்பெர்க், எதிர்கால லாமா மாடல்கள் அடுத்த ஆண்டுக்குள் தனியுரிம போட்டியாளர்களை முந்திவிடும் என்று எதிர்பார்க்கிறேன் என்றார். அந்த மாடல்களால் இயக்கப்படும் Meta AI சாட்போட் இந்த ஆண்டின் இறுதிக்குள் மிகவும் பிரபலமான AI உதவியாளராக மாறும் பாதையில் உள்ளது, ஏற்கனவே நூற்றுக்கணக்கான மில்லியன் மக்கள் இதைப் பயன்படுத்துகின்றனர், என்றார்.

தொழில்நுட்ப நிறுவனங்கள் தங்கள் வளர்ந்து வரும் வள-வெறி கொண்ட பெரிய மொழி மாதிரிகளின் போர்ட்ஃபோலியோக்கள் அவற்றில் முதலீடு செய்யப்பட்டுள்ள மகத்தான தொகைகளை நியாயப்படுத்த மேம்பட்ட பகுத்தறிவு போன்ற அறியப்பட்ட சிக்கல் பகுதிகளில் குறிப்பிடத்தக்க போதுமான ஆதாயங்களை வழங்க முடியும் என்பதைக் காட்டுவதற்காக இந்த வெளியீடு வந்துள்ளது.

மெட்டாவின் சொந்த உயர்மட்ட AI விஞ்ஞானி, இதுபோன்ற மாதிரிகள் பகுத்தறிவின் வரம்புகளுக்கு எதிராகத் தாக்கும் என்றும், முன்னேற்றங்களை உருவாக்க மற்ற வகை AI அமைப்புகள் தேவைப்படும் என்றும் அவர் நம்புகிறார்.

அதன் முதன்மையான 405 பில்லியன் அளவுரு மாடலைத் தவிர, மெட்டா அதன் இலகு-எடை 8 பில்லியன் மற்றும் 70 பில்லியன் பாராமீட்டர் Llama 3 மாடல்களின் மேம்படுத்தப்பட்ட பதிப்புகளையும் வெளியிடுகிறது என்று நிறுவனம் தெரிவித்துள்ளது.

மூன்று புதிய மாடல்களும் பன்மொழி மற்றும் விரிவாக்கப்பட்ட “சூழல் சாளரம்” வழியாக பெரிய பயனர் கோரிக்கைகளை கையாள முடியும், இது குறிப்பாக கணினி குறியீட்டை உருவாக்கும் அனுபவத்தை மேம்படுத்தும் என்று மெட்டாவின் ஜெனரேட்டிவ் AI இன் தலைவர் அஹ்மத் அல்-டஹ்லே கூறினார்.

“சமூகத்திலிருந்து நாங்கள் பெற்ற முதல் கருத்து இதுதான்,” அல்-டஹ்லே ராய்ட்டர்ஸிடம் ஒரு நேர்காணலில் கூறினார், பெரிய சூழல் சாளரங்கள் மாதிரிகளுக்கு நீண்ட நினைவகத்தை வழங்குகின்றன, இது பல-படி கோரிக்கைகளை செயலாக்க உதவுகிறது.

தனித்தனியாக, அல்-டஹ்லே அவர்கள் பயிற்சி பெற்ற சில தரவை உருவாக்க AI ஐப் பயன்படுத்தி கணித சிக்கல்களைத் தீர்ப்பது போன்ற பணிகளில் லாமா 3 மாதிரியின் செயல்திறனை மேம்படுத்த முடிந்தது என்று கூறினார்.

மெட்டா அதன் லாமா மாடல்களை டெவலப்பர்கள் பயன்படுத்துவதற்கு இலவசமாக வெளியிடுகிறது, புதுமையான தயாரிப்புகள், போட்டியாளர்களை குறைவாக சார்ந்து இருப்பது மற்றும் நிறுவனத்தின் முக்கிய சமூக வலைப்பின்னல்களில் அதிக ஈடுபாடு ஆகியவற்றை ஜுக்கர்பெர்க் கூறுகிறார். இருப்பினும், சில முதலீட்டாளர்கள் தங்கள் புருவங்களை உயர்த்தியுள்ளனர்.

டெவலப்பர்கள் அதன் இலவச மாடல்களை பணம் செலுத்தும் மாடல்களைப் பயன்படுத்தத் தேர்வுசெய்தால், நிறுவனம் அதன் போட்டியாளர்களின் வணிக மாதிரிகளைக் குறைக்கும். அதன் அறிவிப்பின் மூலம், மெட்டா முக்கிய கணிதம் மற்றும் அறிவுச் சோதனைகளில் வெற்றிகளைப் பற்றிக் கூறியது, அது அந்த வாய்ப்பை மேலும் ஈர்க்கும்.

AI மேம்பாட்டில் முன்னேற்றத்தை அளவிடுவது மிகவும் கடினமானது என்றாலும், மெட்டா வழங்கிய சோதனை முடிவுகள் அதன் மிகப்பெரிய Llama 3 மாடல் ஏறக்குறைய பொருத்தமாக இருப்பதாகவும், சில சந்தர்ப்பங்களில், Anthropic’s Claude 3.5 Sonnet மற்றும் OpenAI’s GPT-4o ஆகியவற்றை சிறப்பாகக் கருதுவதாகவும் தெரிகிறது. சந்தையில் இரண்டு மிகவும் சக்திவாய்ந்த எல்லை மாதிரிகள்.

போட்டி நிலை கணித வார்த்தை சிக்கல்களின் MATH அளவுகோலில், எடுத்துக்காட்டாக, GPT-4o இன் 76.6 மற்றும் Claude 3.5 Sonnet இன் 71.1 உடன் ஒப்பிடும்போது, ​​மெட்டாவின் மாதிரி 73.8 மதிப்பெண்களைப் பெற்றது.

மாடல் MMLU இல் 88.6 மதிப்பெண்களைப் பெற்றது, இது கணிதம், அறிவியல் மற்றும் மனிதநேயம் ஆகியவற்றில் டஜன் கணக்கான பாடங்களை உள்ளடக்கிய ஒரு அளவுகோலாகும், அதே நேரத்தில் GPT-4o 88.7 மற்றும் க்ளாட் 3.5 சொனட் 88.3 மதிப்பெண்களைப் பெற்றது.

அவர்களின் ஆய்வறிக்கையில், மெட்டா ஆராய்ச்சியாளர்கள் இந்த ஆண்டின் பிற்பகுதியில் வெளிவரவிருக்கும் மாடல்களின் வரவிருக்கும் “மல்டிமாடல்” பதிப்புகளையும் கிண்டல் செய்தனர், அந்த அடுக்கு படம், வீடியோ மற்றும் பேச்சு திறன்கள் கோர் லாமா 3 உரை மாதிரியின் மேல் இருக்கும்.

கூகுளின் ஜெமினி 1.5 மற்றும் ஆந்த்ரோபிக்ஸ் கிளாட் 3.5 சொனட் போன்ற பிற மல்டிமாடல் மாடல்களுடன் அந்த மாதிரிகள் “போட்டியுடன்” செயல்பட முடியும் என்று ஆரம்பகால சோதனைகள் தெரிவிக்கின்றன.

(தலைப்பைத் தவிர, இந்தக் கதை என்டிடிவி ஊழியர்களால் திருத்தப்படவில்லை மற்றும் சிண்டிகேட் ஊட்டத்தில் இருந்து வெளியிடப்பட்டது.)

காத்திருக்கிறது பதில் ஏற்றுவதற்கு…

ஆதாரம்