Home தொழில்நுட்பம் Google DeepMind இன் புதிய AI கருவி ஒலிப்பதிவுகளை உருவாக்க வீடியோ பிக்சல்கள் மற்றும் உரைத்...

Google DeepMind இன் புதிய AI கருவி ஒலிப்பதிவுகளை உருவாக்க வீடியோ பிக்சல்கள் மற்றும் உரைத் தூண்டுதல்களைப் பயன்படுத்துகிறது

Google DeepMind மறைப்புகளை எடுத்துள்ளார் வீடியோ ஒலிப்பதிவுகளை உருவாக்குவதற்கான புதிய AI கருவி. ஆடியோவை உருவாக்க டெக்ஸ்ட் ப்ராம்ட்டைப் பயன்படுத்துவதோடு, வீடியோவின் உள்ளடக்கத்தையும் DeepMind இன் கருவி கணக்கில் எடுத்துக்கொள்கிறது.

இரண்டையும் இணைப்பதன் மூலம், பயனர்கள் “நாடக மதிப்பெண், யதார்த்தமான ஒலி விளைவுகள் அல்லது வீடியோவின் கதாபாத்திரங்கள் மற்றும் தொனியுடன் பொருந்தக்கூடிய உரையாடல்” ஆகியவற்றுடன் காட்சிகளை உருவாக்க கருவியைப் பயன்படுத்தலாம் என்று DeepMind கூறுகிறது. DeepMind இன் இணையதளத்தில் வெளியிடப்பட்ட சில எடுத்துக்காட்டுகளை நீங்கள் பார்க்கலாம் – மேலும் அவை மிகவும் நன்றாக இருக்கின்றன.

க்கு ஒரு வீடியோ சைபர்பங்க்-எஸ்க்யூ சிட்டிஸ்கேப் வழியாக கார் ஓட்டும்போது, ​​ஆடியோவை உருவாக்க, கூகுள் “கார்ஸ் ஸ்கிடிங், கார் எஞ்சின் த்ரோட்லிங், ஏஞ்சலிக் எலக்ட்ரானிக் மியூசிக்” ஆகியவற்றைப் பயன்படுத்தியது. சறுக்கலின் சத்தம் காரின் இயக்கத்துடன் எவ்வாறு பொருந்துகிறது என்பதை நீங்கள் பார்க்கலாம். மற்றொன்று உதாரணம் உருவாக்குகிறது “நீருக்கடியில் துடிக்கும் ஜெல்லிமீன்கள், கடல்வாழ் உயிரினங்கள், கடல்” என்ற கட்டளையைப் பயன்படுத்தி ஒரு நீருக்கடியில் ஒலிக்காட்சி.

பயனர்கள் உரை வரியில் சேர்க்க முடியும் என்றாலும், DeepMind இது விருப்பமானது என்று கூறுகிறது. பயனர்கள் உருவாக்கப்பட்ட ஆடியோவை பொருத்தமான காட்சிகளுடன் உன்னிப்பாகப் பொருத்த வேண்டிய அவசியமில்லை. DeepMind இன் கூற்றுப்படி, கருவியானது வீடியோக்களுக்கான “வரம்பற்ற” ஒலிப்பதிவுகளை உருவாக்க முடியும், இது பயனர்கள் முடிவற்ற ஆடியோ விருப்பங்களைக் கொண்டு வர அனுமதிக்கிறது.

ஆடியோவை உருவாக்க உரைத் தூண்டுதல்களைப் பயன்படுத்தும் ElevenLabs இன் ஒலி விளைவுகள் ஜெனரேட்டர் போன்ற பிற AI கருவிகளிலிருந்து இது தனித்து நிற்க உதவும். DeepMind’s Veo மற்றும் Sora போன்ற கருவிகளில் இருந்து AI-உருவாக்கப்பட்ட வீடியோவுடன் ஆடியோவை இணைப்பதை இது எளிதாக்கும் (இதன் பிந்தையது ஆடியோவை இணைக்க திட்டமிட்டுள்ளது).

DeepMind தனது AI கருவியை வீடியோ, ஆடியோ மற்றும் “ஒலியின் விரிவான விளக்கங்கள் மற்றும் பேசும் உரையாடலின் டிரான்ஸ்கிரிப்டுகள்” ஆகியவற்றைக் கொண்ட சிறுகுறிப்புகளில் பயிற்சியளித்ததாகக் கூறுகிறது. இது வீடியோ-க்கு-ஆடியோ ஜெனரேட்டரை ஆடியோ நிகழ்வுகளை காட்சி காட்சிகளுடன் பொருத்த அனுமதிக்கிறது.

கருவிக்கு இன்னும் சில வரம்புகள் உள்ளன. எடுத்துக்காட்டாக, DeepMind உதடு அசைவை உரையாடலுடன் ஒத்திசைக்கும் திறனை மேம்படுத்த முயற்சிக்கிறது, இதை நீங்கள் பார்க்கலாம் ஒரு களிமண் குடும்பத்தின் வீடியோ. DeepMind மேலும் அதன் வீடியோ-க்கு-ஆடியோ அமைப்பு வீடியோ தரத்தை சார்ந்தது என்று குறிப்பிடுகிறது.

ஆதாரம்