મેરીલેન્ડ યુનિવર્સિટીના સંશોધકોની ટીમે એક એવું ફ્રેમવર્ક વિકસાવ્યું છે જે રોબોટ્સને રોજિંદા માનવ વાતાવરણ વિશે સંદર્ભના આધારે તર્ક કરવાની ક્ષમતા આપે છે. ભારતીય મૂળના ડોક્ટરલ વિદ્યાર્થી વિષ્ણુ દોરબાલાના નેતૃત્વ હેઠળના આ અભ્યાસે સિચ્યુએશનલ એમ્બોડીડ ક્વેસ્ચન આન્સરિંગ (S-EQA) નામનું એક નવું પેરાડાઇમ રજૂ કર્યું છે, જે રોબોટ્સને માનવ વાતાવરણ સાથે સંબંધિત સંદર્ભબદ્ધ પ્રશ્નોને સમજવામાં મદદ કરે છે.
પરંપરાગત સિસ્ટમો ફક્ત વસ્તુઓની ઓળખ કરે છે, પરંતુ S-EQA રોબોટ્સને પરિસ્થિતિઓ વિશે તર્ક કરવાની ક્ષમતા આપે છે—જેમ કે ઘર રાત્રે સુરક્ષિત છે કે નહીં તે નક્કી કરવા માટે બહુવિધ વસ્તુઓની સ્થિતિ અને તેમની પરસ્પર નિર્ભરતાને તપાસવી. દોરબાલાએ જણાવ્યું, “મોબાઇલ રોબોટ્સ ઘરેલું જીવનને સરળ બનાવે તેવી અપેક્ષા છે. આમાં ‘શું ઘર રાત્રે સૂવા માટે તૈયાર છે?’ જેવા રોજિંદા પ્રશ્નોના જવાબ આપવાનો સમાવેશ થાય છે. આ માટે દરવાજા બંધ છે કે નહીં, ફાયરપ્લેસ બંધ છે કે નહીં જેવી બાબતોની સ્થિતિ એકસાથે સમજવી જરૂરી છે. અમારું કાર્ય લાર્જ લેન્ગ્વેજ મોડલ્સનો ઉપયોગ કરીને આ સમસ્યાનું નવું સમાધાન આપે છે, જે ઘરેલું રોબોટ્સને વધુ સ્માર્ટ અને ઉપયોગી બનાવવાનો માર્ગ મોકળો કરે છે.”
દોરબાલા ઉપરાંત, ડિનેશ મનોચા, પોલ ક્રિસમેન આઇરીબ ચેર અને કમ્પ્યુટર સાયન્સ તથા ઇલેક્ટ્રિકલ એન્ડ કમ્પ્યુટર એન્જિનિયરિંગના ડિસ્ટિંગ્વિશ્ડ યુનિવર્સિટી પ્રોફેસર, અને રેઝા ઘનાદાન, ISR પ્રોફેસર અને ઇનોવેશન્સ ઇન AIના એક્ઝિક્યુટિવ ડિરેક્ટર, આ ટીમનો ભાગ છે.
આ પ્રોજેક્ટની શરૂઆત 2023માં દોરબાલાની એમેઝોનના આર્ટિફિશિયલ જનરલ ઇન્ટેલિજન્સ ગ્રૂપ સાથેની ઇન્ટર્નશિપ દરમિયાન થઈ હતી અને પછી મનોચાના માર્ગદર્શન હેઠળ તેને વિસ્તારવામાં આવ્યો. બે વર્ષ દરમિયાન, તેમના સતત સહયોગથી એમ્બોડીડ AI માટે એલ્ગોરિધમ ડિઝાઇન અને ડેટાસેટ ડેવલપમેન્ટમાં પ્રગતિ થઈ.
સિસ્ટમ બનાવવા માટે, સંશોધકોએ પ્રોમ્પ્ટ-જનરેટ-ઇવેલ્યુએટ (PGE) એલ્ગોરિધમ વિકસાવ્યું. આ ફ્રેમવર્ક લાર્જ લેન્ગ્વેજ મોડલ્સ (LLMs)નો ઉપયોગ કરીને સંદર્ભબદ્ધ પ્રશ્નો ઉત્પન્ન કરે છે, અંતર્ગત વસ્તુ-સ્થિતિની માહિતી બનાવે છે અને પછી સંદર્ભની ચોકસાઈ માટે મૂલ્યાંકન કરે છે. ટીમે GPT-4નો ઉપયોગ સિચ્યુએશનલ ડેટાપોઇન્ટ્સ બનાવવા, BERT એમ્બેડિંગ્સનો ઉપયોગ નવીનતા સુનિશ્ચિત કરવા અને ક્લસ્ટરિંગ પદ્ધતિઓનો ઉપયોગ પ્રતિનિધિત્વાત્મક પ્રશ્નો ઓળખવા માટે કર્યો. વર્ચ્યુઅલહોમ નામના સિમ્યુલેટેડ ઘરેલું વાતાવરણનો ઉપયોગ 2,000 સિચ્યુએશનલ પ્રશ્નોનો ડેટાસેટ બનાવવા માટે કરવામાં આવ્યો.
ડેટાસેટની માન્યતા ચકાસવા માટે, એમેઝોન મિકેનિકલ ટર્ક પર મોટા પાયે અભ્યાસ હાથ ધરવામાં આવ્યો, જેણે પુષ્ટિ કરી કે AI દ્વારા ઉત્પન્ન થયેલા 97.26 ટકા પ્રશ્નો માનવ સર્વસંમતિથી જવાબ આપી શકાય તેવા હતા. જોકે, આ પ્રશ્નોના જવાબ આપવામાં લેન્ગ્વેજ મોડલ્સ માત્ર 46 ટકા જવાબોમાં માનવ પ્રતિસાદ સાથે સંરેખિત થયા, જે વાસ્તવિક પ્રશ્નો ઉત્પન્ન કરવા અને ચોક્કસ તર્ક કરવા વચ્ચેના અંતરને દર્શાવે છે.
મનોચાએ આ સંશોધનને પ્રેક્ટિકલ ઘરેલું રોબોટિક્સ અને સંદર્ભ-જાગૃત AI તરફનું મહત્વનું પગલું ગણાવ્યું, ભારપૂર્વક જણાવ્યું કે સિચ્યુએશનલ જાગૃતિ સિસ્ટમોને માનવ-કેન્દ્રિત વાતાવરણમાં વધુ વિશ્વસનીય રીતે કાર્ય કરવા સક્ષમ બનાવી શકે છે.
તેમનું પેપર, “ઇઝ ધ હાઉસ રેડી ફોર સ્લીપટાઇમ? જનરેટિંગ એન્ડ ઇવેલ્યુએટિંગ સિચ્યુએશનલ ક્વેરીઝ ફોર એમ્બોડીડ ક્વેસ્ચન આન્સરિંગ,” 2025માં ચીનના હેંગઝોઉમાં યોજાનાર IEEE/RSJ ઇન્ટરનેશનલ કોન્ફરન્સ ઓન ઇન્ટેલિજન્ટ રોબોટ્સ એન્ડ સિસ્ટમ્સ (IROS)માં રજૂ કરવામાં આવશે.
Comments
Start the conversation
Become a member of New India Abroad to start commenting.
Sign Up Now
Already have an account? Login