Home செய்திகள் ஆப்பிள் ஒரு ஓப்பன் சோர்ஸ் மோனோகுலர் டெப்த் எஸ்டிமேஷன் AI மாடலை வெளியிடுகிறது

ஆப்பிள் ஒரு ஓப்பன் சோர்ஸ் மோனோகுலர் டெப்த் எஸ்டிமேஷன் AI மாடலை வெளியிடுகிறது

ஆப்பிள் இந்த ஆண்டு பல திறந்த மூல செயற்கை நுண்ணறிவு (AI) மாதிரிகளை வெளியிட்டது. இவை பெரும்பாலும் ஒரு குறிப்பிட்ட பணிக்காக வடிவமைக்கப்பட்ட சிறிய மொழி மாதிரிகள். பட்டியலில் சேர்த்து, குபெர்டினோ அடிப்படையிலான தொழில்நுட்ப நிறுவனமான டெப்த் ப்ரோ என அழைக்கப்படும் புதிய AI மாடலை இப்போது வெளியிட்டுள்ளது. எந்தவொரு படத்தின் மோனோகுலர் ஆழமான வரைபடத்தை உருவாக்கக்கூடிய ஒரு பார்வை மாதிரி இது. இந்த தொழில்நுட்பம் 3D இழைமங்கள், ஆக்மென்டட் ரியாலிட்டி (AR) மற்றும் பலவற்றின் தலைமுறைக்கு பயனுள்ளதாக இருக்கும். பல கேமராக்களின் உதவியுடன் உருவாக்கப்பட்டதை விட, AI ஆல் உருவாக்கப்பட்ட ஆழமான வரைபடங்கள் சிறந்தவை என்று திட்டத்தின் பின்னணியில் உள்ள ஆராய்ச்சியாளர்கள் கூறுகின்றனர்.

ஆப்பிள் டெப்த் புரோ AI மாடலை வெளியிடுகிறது

3D மாடலிங் மற்றும் AR, தன்னாட்சி ஓட்டுநர் அமைப்புகள், ரோபாட்டிக்ஸ் மற்றும் பல போன்ற பல்வேறு தொழில்நுட்பங்களில் ஆழமான மதிப்பீடு ஒரு முக்கியமான செயல்முறையாகும். மனிதக் கண் என்பது ஒரு சிக்கலான லென்ஸ் அமைப்பாகும், இது ஒரு புள்ளி கண்ணோட்டத்தில் பொருட்களைக் கவனிக்கும்போது கூட அவற்றின் ஆழத்தை துல்லியமாக அளவிட முடியும். இருப்பினும், கேமராக்கள் அவ்வளவு சிறப்பாக இல்லை. ஒற்றை கேமராவில் எடுக்கப்பட்ட படங்கள் இரு பரிமாணமாகத் தோன்றி, சமன்பாட்டிலிருந்து ஆழத்தை நீக்குகிறது.

எனவே, ஒரு பொருளின் ஆழம் முக்கிய பங்கு வகிக்கும் தொழில்நுட்பங்களுக்கு, பல கேமராக்கள் பயன்படுத்தப்படுகின்றன. இருப்பினும், இது போன்ற மாடலிங் பொருள்கள் நேரத்தைச் செலவழிக்கும் மற்றும் வளம்-தீவிரமானதாக இருக்கும். மாறாக, ஏ ஆய்வுக் கட்டுரை “டெப்த் ப்ரோ: ஷார்ப் மோனோகுலர் மெட்ரிக் டெப்த் இன் லெஸ்ஸ் தத் ஒரு செகண்ட்” என்ற தலைப்பில், ஆப்பிள் பார்வை அடிப்படையிலான AI மாதிரியைப் பயன்படுத்தி பொருட்களின் மோனோகுலர் படங்களின் பூஜ்ஜிய-ஷாட் ஆழ வரைபடங்களை எவ்வாறு உருவாக்கியது என்பதை எடுத்துக்காட்டுகிறது.

டெப்த் புரோ AI மாடல் ஆழமான வரைபடங்களை எவ்வாறு உருவாக்குகிறது
பட உதவி: Apple

AI மாதிரியை உருவாக்க, ஆராய்ச்சியாளர்கள் விஷன் டிரான்ஸ்ஃபார்மர் அடிப்படையிலான (ViT) கட்டமைப்பைப் பயன்படுத்தினர். 384 x 384 இன் வெளியீட்டுத் தீர்மானம் தேர்ந்தெடுக்கப்பட்டது, ஆனால் உள்ளீடு மற்றும் செயலாக்கத் தீர்மானம் 1536 x 1536 இல் வைக்கப்பட்டது, இது AI மாதிரி விவரங்களைப் புரிந்து கொள்ள அதிக இடத்தை அனுமதிக்கிறது.

தற்போது ஆன்லைன் இதழான arXiv இல் வெளியிடப்பட்ட காகிதத்தின் முன் அச்சிடப்பட்ட பதிப்பில், AI மாதிரியானது கூண்டு, உரோமம் கொண்ட பூனையின் உடல் மற்றும் விஸ்கர்கள் போன்ற பார்வைக்கு சிக்கலான பொருட்களின் ஆழ வரைபடங்களை இப்போது துல்லியமாக உருவாக்க முடியும் என்று ஆராய்ச்சியாளர்கள் கூறினர். மேலும் தலைமுறை நேரம் ஒரு வினாடி என்று கூறப்படுகிறது. திறந்த மூல AI மாதிரியின் எடைகள் தற்போது GitHub இல் ஹோஸ்ட் செய்யப்படுகின்றன பட்டியல். ஆர்வமுள்ள நபர்கள் ஒற்றை GPU இன் அனுமானத்தில் மாதிரியை இயக்கலாம்.

ஆதாரம்

LEAVE A REPLY

Please enter your comment!
Please enter your name here