ADVERTISEMENTs

ભારતીય મૂળના સંશોધકોએ કોન્ટેક્સ-જાગૃત રોબોટ્સ માટે ફ્રેમવર્ક વિકસાવ્યું.

ફ્રેમવર્ક મોટા ભાષા મોડલ્સ (LLMs) નો ઉપયોગ કરીને પરિસ્થિતિજન્ય પ્રશ્નો ઉત્પન્ન કરે છે, અંતર્ગત ઑબ્જેક્ટ-સ્થિતિની માહિતી બનાવે છે અને પછી સંદર્ભની ચોકસાઈ માટે મૂલ્યાંકન કરે છે.

ભારતીય મૂળના ડોક્ટરલ વિદ્યાર્થી વિષ્ણુ દોરબાલા / Courtesy photo

મેરીલેન્ડ યુનિવર્સિટીના સંશોધકોની ટીમે એક એવું ફ્રેમવર્ક વિકસાવ્યું છે જે રોબોટ્સને રોજિંદા માનવ વાતાવરણ વિશે સંદર્ભના આધારે તર્ક કરવાની ક્ષમતા આપે છે. ભારતીય મૂળના ડોક્ટરલ વિદ્યાર્થી વિષ્ણુ દોરબાલાના નેતૃત્વ હેઠળના આ અભ્યાસે સિચ્યુએશનલ એમ્બોડીડ ક્વેસ્ચન આન્સરિંગ (S-EQA) નામનું એક નવું પેરાડાઇમ રજૂ કર્યું છે, જે રોબોટ્સને માનવ વાતાવરણ સાથે સંબંધિત સંદર્ભબદ્ધ પ્રશ્નોને સમજવામાં મદદ કરે છે.

પરંપરાગત સિસ્ટમો ફક્ત વસ્તુઓની ઓળખ કરે છે, પરંતુ S-EQA રોબોટ્સને પરિસ્થિતિઓ વિશે તર્ક કરવાની ક્ષમતા આપે છે—જેમ કે ઘર રાત્રે સુરક્ષિત છે કે નહીં તે નક્કી કરવા માટે બહુવિધ વસ્તુઓની સ્થિતિ અને તેમની પરસ્પર નિર્ભરતાને તપાસવી. દોરબાલાએ જણાવ્યું, “મોબાઇલ રોબોટ્સ ઘરેલું જીવનને સરળ બનાવે તેવી અપેક્ષા છે. આમાં ‘શું ઘર રાત્રે સૂવા માટે તૈયાર છે?’ જેવા રોજિંદા પ્રશ્નોના જવાબ આપવાનો સમાવેશ થાય છે. આ માટે દરવાજા બંધ છે કે નહીં, ફાયરપ્લેસ બંધ છે કે નહીં જેવી બાબતોની સ્થિતિ એકસાથે સમજવી જરૂરી છે. અમારું કાર્ય લાર્જ લેન્ગ્વેજ મોડલ્સનો ઉપયોગ કરીને આ સમસ્યાનું નવું સમાધાન આપે છે, જે ઘરેલું રોબોટ્સને વધુ સ્માર્ટ અને ઉપયોગી બનાવવાનો માર્ગ મોકળો કરે છે.”

દોરબાલા ઉપરાંત, ડિનેશ મનોચા, પોલ ક્રિસમેન આઇરીબ ચેર અને કમ્પ્યુટર સાયન્સ તથા ઇલેક્ટ્રિકલ એન્ડ કમ્પ્યુટર એન્જિનિયરિંગના ડિસ્ટિંગ્વિશ્ડ યુનિવર્સિટી પ્રોફેસર, અને રેઝા ઘનાદાન, ISR પ્રોફેસર અને ઇનોવેશન્સ ઇન AIના એક્ઝિક્યુટિવ ડિરેક્ટર, આ ટીમનો ભાગ છે.

આ પ્રોજેક્ટની શરૂઆત 2023માં દોરબાલાની એમેઝોનના આર્ટિફિશિયલ જનરલ ઇન્ટેલિજન્સ ગ્રૂપ સાથેની ઇન્ટર્નશિપ દરમિયાન થઈ હતી અને પછી મનોચાના માર્ગદર્શન હેઠળ તેને વિસ્તારવામાં આવ્યો. બે વર્ષ દરમિયાન, તેમના સતત સહયોગથી એમ્બોડીડ AI માટે એલ્ગોરિધમ ડિઝાઇન અને ડેટાસેટ ડેવલપમેન્ટમાં પ્રગતિ થઈ.

સિસ્ટમ બનાવવા માટે, સંશોધકોએ પ્રોમ્પ્ટ-જનરેટ-ઇવેલ્યુએટ (PGE) એલ્ગોરિધમ વિકસાવ્યું. આ ફ્રેમવર્ક લાર્જ લેન્ગ્વેજ મોડલ્સ (LLMs)નો ઉપયોગ કરીને સંદર્ભબદ્ધ પ્રશ્નો ઉત્પન્ન કરે છે, અંતર્ગત વસ્તુ-સ્થિતિની માહિતી બનાવે છે અને પછી સંદર્ભની ચોકસાઈ માટે મૂલ્યાંકન કરે છે. ટીમે GPT-4નો ઉપયોગ સિચ્યુએશનલ ડેટાપોઇન્ટ્સ બનાવવા, BERT એમ્બેડિંગ્સનો ઉપયોગ નવીનતા સુનિશ્ચિત કરવા અને ક્લસ્ટરિંગ પદ્ધતિઓનો ઉપયોગ પ્રતિનિધિત્વાત્મક પ્રશ્નો ઓળખવા માટે કર્યો. વર્ચ્યુઅલહોમ નામના સિમ્યુલેટેડ ઘરેલું વાતાવરણનો ઉપયોગ 2,000 સિચ્યુએશનલ પ્રશ્નોનો ડેટાસેટ બનાવવા માટે કરવામાં આવ્યો.

ડેટાસેટની માન્યતા ચકાસવા માટે, એમેઝોન મિકેનિકલ ટર્ક પર મોટા પાયે અભ્યાસ હાથ ધરવામાં આવ્યો, જેણે પુષ્ટિ કરી કે AI દ્વારા ઉત્પન્ન થયેલા 97.26 ટકા પ્રશ્નો માનવ સર્વસંમતિથી જવાબ આપી શકાય તેવા હતા. જોકે, આ પ્રશ્નોના જવાબ આપવામાં લેન્ગ્વેજ મોડલ્સ માત્ર 46 ટકા જવાબોમાં માનવ પ્રતિસાદ સાથે સંરેખિત થયા, જે વાસ્તવિક પ્રશ્નો ઉત્પન્ન કરવા અને ચોક્કસ તર્ક કરવા વચ્ચેના અંતરને દર્શાવે છે.

મનોચાએ આ સંશોધનને પ્રેક્ટિકલ ઘરેલું રોબોટિક્સ અને સંદર્ભ-જાગૃત AI તરફનું મહત્વનું પગલું ગણાવ્યું, ભારપૂર્વક જણાવ્યું કે સિચ્યુએશનલ જાગૃતિ સિસ્ટમોને માનવ-કેન્દ્રિત વાતાવરણમાં વધુ વિશ્વસનીય રીતે કાર્ય કરવા સક્ષમ બનાવી શકે છે.

તેમનું પેપર, “ઇઝ ધ હાઉસ રેડી ફોર સ્લીપટાઇમ? જનરેટિંગ એન્ડ ઇવેલ્યુએટિંગ સિચ્યુએશનલ ક્વેરીઝ ફોર એમ્બોડીડ ક્વેસ્ચન આન્સરિંગ,” 2025માં ચીનના હેંગઝોઉમાં યોજાનાર IEEE/RSJ ઇન્ટરનેશનલ કોન્ફરન્સ ઓન ઇન્ટેલિજન્ટ રોબોટ્સ એન્ડ સિસ્ટમ્સ (IROS)માં રજૂ કરવામાં આવશે.

Comments

Related

ADVERTISEMENT

 

 

 

ADVERTISEMENT

 

 

E Paper

 

 

 

Video