बेंगळुरू: कल्पना करा की तुम्ही गिटार वाजवत आहात किंवा आईन्स्टाईनसोबत जेवत आहात. इंडियन इन्स्टिट्यूट ऑफ सायन्स (IISc) च्या संशोधकांनी एक प्रणाली विकसित केली आहे ज्यामुळे हे शक्य होते. त्यांची प्रणाली वापरकर्त्यांना स्वतःला किंवा इतरांना अखंडपणे जोडण्याची परवानगी देते AI-व्युत्पन्न व्हिज्युअल अधिक अचूक करा चेहर्यावरील वैशिष्ट्यांचे समायोजन,
“आमची प्रणाली चेहऱ्याच्या वैशिष्ट्यांवर अचूक नियंत्रण ठेवत या सर्जनशील परिस्थितींना शक्य करते,” प्राध्यापक व्यंकटेश बाबू स्पष्ट करतात. ते म्हणाले की, दोन एआय मॉडेल्सच्या सामर्थ्यांचे संयोजन करण्याच्या टीमच्या अभिनव पध्दतीमध्ये यश सामावलेले आहे.
संगणकीय आणि डेटा विज्ञान (CDS) विभागातील IISc च्या व्हिजन आणि AI लॅब (VAL) येथे विकसित केलेली नाविन्यपूर्ण प्रणाली, दोन शक्तिशाली प्रतिमा निर्मिती तंत्रज्ञान एकत्र करते: टेक्स्ट-टू-इमेज (T2I) प्रसार मॉडेल आणि शैलीदार जनरेटर ॲडव्हर्सरियल नेटवर्क्स (स्टाइलगॅन) मॉडेल). ,
ऋषुभ परिहार, सच्चिदानंद व्ही.एस., सब्रीश्वरण मणी आणि तेजन करमाली यांच्या संशोधन पथकाने, प्रोफेसर बाबू यांच्या मार्गदर्शनाखाली काम करत, एक मॉडेल तयार केले आहे जे StyleGAN चे चेहर्याचे प्रतिनिधित्व T2I मॉडेलशी सुसंगत स्वरूपात रूपांतरित करते. यामुळे मॉडेल्सच्या वैयक्तिक मर्यादांवर मात करण्यात मदत झाली आहे.
T2I मॉडेल्स मजकूर तपशीलांमधून जटिल दृश्ये तयार करण्यात उत्कृष्ट आहेत, परंतु ते अचूक चेहरा संपादनासह संघर्ष करतात. याउलट, StyleGAN मॉडेल वास्तववादी चेहरे तयार करण्यात आणि सुधारण्यात माहिर आहेत, परंतु चेहऱ्याच्या प्रतिमांपुरते मर्यादित आहेत. टीमचे सोल्यूशन एक नाविन्यपूर्ण अडॅप्टर सादर करते जे हे अंतर भरून काढते, ज्यामुळे दोन्ही क्षमतांचे अखंड एकत्रीकरण होते.
“चेहऱ्याच्या वैशिष्ट्यांचे मिश्रण न करता एकाच प्रतिमेमध्ये अनेक विषय हाताळण्याची क्षमता हे या प्रणालीचे मुख्य वैशिष्ट्य आहे. समांतर जनरेशन तंत्रज्ञान हे सुनिश्चित करते की पार्श्वभूमी दृश्यासह नैसर्गिकरित्या मिसळताना प्रत्येक वैयक्तिक ओळख वेगळी राहते. “वापरकर्ते प्रतिमेतील इतर विषयांवर परिणाम न करता वैयक्तिक चेहर्यावरील वैशिष्ट्ये सुधारू शकतात – जसे की स्मित किंवा दाढी जोडणे,” बाबू म्हणाले.
हा विकास एक महत्त्वाचा टप्पा आहे जनरेटिव्ह एआय तंत्रज्ञान सर्जनशील अभिव्यक्ती आणि प्रतिमा हाताळण्यासाठी नवीन शक्यता देते. जटिल दृश्ये निर्माण करताना चेहऱ्याच्या वैशिष्ट्यांवर अचूक नियंत्रण ठेवण्याची प्रणालीची क्षमता मनोरंजनापासून डिजिटल कलापर्यंतच्या क्षेत्रात अनेक अनुप्रयोग उघडते.
बाबूने चेतावणी दिली, “आम्ही आमचा कोड ज्यांना जबाबदारीने वापरायचा आहे त्यांच्यासाठी खुला ठेवला असला तरी, आम्ही लोकांना विनंती करतो की, कोणत्याही नवीन तंत्रज्ञानामुळे त्याचा गैरवापर होऊ नये.”