• Meta એ નવા AI મોડલ્સની બેચ બહાર પાડી છે.

  • નવા મોડલ પૈકી એક “સ્વ-શિક્ષિત મૂલ્યાંકનકર્તા” છે.

  • Meta AIનું નવું મોડલ AI વિકાસમાં માનવ સંડોવણી ઘટાડવામાં મદદ કરી શકે છે.

Facebookને માલિક Metaએ શુક્રવારે જણાવ્યું હતું કે તે તેના સંશોધન વિભાગમાંથી નવા AI મોડલ્સની બેચ બહાર પાડી રહી છે, જેમાં “સ્વ-શિક્ષિત મૂલ્યાંકનકર્તા”નો સમાવેશ થાય છે જે AI વિકાસ પ્રક્રિયામાં ઓછી માનવ સંડોવણી તરફનો માર્ગ પ્રદાન કરી શકે છે.

આ પ્રકાશન ઑગસ્ટના પેપરમાં Meta દ્વારા ટૂલની રજૂઆતને અનુસરે છે, જેમાં વિગતવાર દર્શાવવામાં આવ્યું છે કે કેવી રીતે તે મોડલના પ્રતિભાવો વિશે વિશ્વસનીય નિર્ણયો લેવા માટે OpenAI દ્વારા બહાર પાડવામાં આવેલ o1 મોડેલ દ્વારા કેવી રીતે ઓળખાય છે તે સમાન “વિચારોની સાંકળ” પર આધારિત છે.

તે તકનીકમાં જટિલ સમસ્યાઓને નાના તાર્કિક પગલાઓમાં તોડી નાખવાનો સમાવેશ થાય છે અને તે વિજ્ઞાન, કોડિંગ અને ગણિત જેવા વિષયોમાં પડકારરૂપ સમસ્યાઓ પરના પ્રતિભાવોની ચોકસાઈમાં સુધારો કરતી દેખાય છે.

Metaના સંશોધકોએ મૂલ્યાંકનકર્તા મોડેલને તાલીમ આપવા માટે સંપૂર્ણપણે AI-જનરેટેડ ડેટાનો ઉપયોગ કર્યો, તે તબક્કે માનવ ઇનપુટને પણ દૂર કર્યો.

પ્રોજેક્ટ પાછળની કંપની Metaના બે સંશોધકોએ રોઇટર્સને જણાવ્યું કે AI નું મૂલ્યાંકન કરવા માટે AI નો ઉપયોગ કરવાની ક્ષમતા સ્વાયત્ત AI એજન્ટો બનાવવા તરફના સંભવિત માર્ગની ઝલક આપે છે જે તેમની પોતાની ભૂલોમાંથી શીખી શકે છે.

AI ક્ષેત્રમાં ઘણા લોકો આવા એજન્ટોને ડિજિટલ સહાયક તરીકે જુએ છે જે માનવ હસ્તક્ષેપ વિના વિવિધ કાર્યો કરવા માટે પૂરતા બુદ્ધિશાળી છે.

સ્વ-સુધારણા મોડેલો આજે ઉપયોગમાં લેવાતી ઘણી વખત ખર્ચાળ અને બિનકાર્યક્ષમ પ્રક્રિયાની જરૂરિયાતને ઘટાડી શકે છે જેને માનવ પ્રતિસાદથી મજબૂતીકરણ શીખવવામાં આવે છે, જેને માનવ ટીકાકારો પાસેથી ઇનપુટની જરૂર હોય છે જેઓ ડેટાને ચોક્કસ રીતે લેબલ કરવાની ક્ષમતા ધરાવતા હોય છે અને તે જવાબોને ચકાસવા માટે વિશેષ કુશળતાની જરૂર હોય છે જટિલ ગણિત અને લેખન પ્રશ્નો સાચા છે.

Google અને એન્થ્રોપિક સહિતની અન્ય કંપનીઓએ પણ RLAIF ની વિભાવના પર સંશોધન પ્રકાશિત કર્યું છે, અથવા AI પ્રતિસાદમાંથી મજબૂતીકરણ શિક્ષણ. જો કે, Metaથી વિપરીત, તે કંપનીઓ જાહેર ઉપયોગ માટે તેમના મોડલને રિલીઝ કરતી નથી.

Meta દ્વારા શુક્રવારે બહાર પાડવામાં આવેલા અન્ય AI ટૂલ્સમાં કંપનીના ઈમેજ-ઓડેન્ટિફિકેશન સેગમેન્ટ એનિથિંગ મોડલનો સમાવેશ થાય છે, જે LLM પ્રતિક્રિયા બનાવવાના સમયને ઝડપી બનાવે છે અને નવી અકાર્બનિક સામગ્રી શોધવામાં મદદ કરવા માટે ઉપયોગમાં લેવાતા ડેટાસેટનો સમાવેશ થાય છે.

© 2011 - 2024 Abtak Media. Developed by ePaper Solution.