સ્પીચ રેકોગ્નિશન માટેનું એક નોંધપાત્ર પગલું ૧૯૭૧માં મંડાયું. સ્પીચ અંડરસ્ટેંડિંગ રિસર્ચ પ્રોગ્રામમાં આઇબીએમ, કારનેજી મેલોન યુનિવર્સિટી અને સ્ટાંફોર્ડ રિસર્ચ સંસ્થાએ જુસ્સાભેર ભાગ લીધો, પરિણામે હાર્પીનો જન્મ થયો: આ હાર્પી પાસે હવે ૧૦૦૦ જેટલા શબ્દોનું ભંડોળ હતું
અલેક્સા.. પ્લે સમ મ્યુઝિક… જેમની પાસે હશે એને ખબર હશે કે રોજ ઓફિસ થી ઘરે થાકેલા આવી ને મગજ ને આરામ આપવા આજ ઉદગાર નીકળે છે. દરેક ને મન માં એક એવી મહત્વાકાંક્ષા હોય કે કોઈ એના હુકમો નું પાલન કરે. જે લોકો ઓફિસ માં હુકમ ના ચલાવી શકતા હોય તેઓ ઘરે આવી ને અલેક્સા, ગૂગલ અસિસ્ટેંટ કે પછી સિરી પાસે પોતાનો હુકમ ચલાવતા હોય છે. ખબર જ છે કે એ કોઈ દિવસ સામે હાકલ નહીં પાડે. કોઈ વાર એવી રમુજ થઈ જાય જ્યારે આ વર્ચુયલ અસિસ્ટેંટ ને આપણી વાત માં ગતાગમ ના પડી હોય. કોઈ વાર અર્થ નો અનર્થ પણ થઈ જાય! મુખ્ય વસ્તુ તો એ છે કે આ બધી વાતો એના ડેટા-બેસ માં સ્ટોર થાય છે.
એક સમય એવો હતો કે સવારે છાપું હાથ માં લઈ ને કે ટેબલ જેવડા રેડિયો માં આકાશવાણી ના પ્રોગ્રામ ની રાહ જોવાતી. એકદમ ચીવટ વડે રેડિયો ના નોબ ને ખરર… ખરર… ના અવાજ માથી લતા મંગેશકર ના અવાજ માં બદલવાની એક અલગ જ મજા હતી. એ સમયે સૌથી સ્માર્ટ એ રેડિયો જ હતો. સવાર-સાંજ દૂર બેઠેલા વ્યક્તિ ના અવાજ ને આ પાસે પડેલ ડબ્બો સંભળાવે તો તેના કરતાં સ્માર્ટ બીજું શું હોય?
પરંતુ જે મિડાસ નો સ્પર્શ દરેક વસ્તુ ને સોનું બનાવી દેતો તેમ મનુષ્ય ને દરેક વસ્તુ માં જીવ પૂરવો બહુ ગમે. આ કારણે આ પોતાની ઇચ્છા મુજબ વગડ્યા કરે તેવો રેડિયો કે સ્પીકર જામે નહીં. આપણે તો કઈક એવું જોઈએ જે આપણું સાંભળે ખરી અને સામો જવાબ પણ આપે. સામાજિક પ્રાણી એવા મનુષ્ય ને વાત કરવા માણસ નહીં તો મશીન જોઈએ. આ સાથે એક એવા અસિસ્ટેંટ ની જરૂર જણાઈ જે ઘર ના ઉપકરણો સાથે આપડી વાત કરાવે.
મશીન આપણી ભાષા સમજી શકે એવા સ્માર્ટ બનાવવા ની શરૂઆત ૧૯૬૧ માં આઇબીએમ એ કરી. તેમનું આ અસિસ્ટેંટ આઇબીએમ શૂબોક્સ પહેલું ડિજિટલ સ્પીચ રેકોગ્નિશન ટૂલ બન્યું. આ શૂ બોક્સ ૧૬ શબ્દો અને અંકો ને સમજી શકતું. આઇબીએમ ના ઇજનેર વિલિયમ સી. દેર્ષ એ આ મશીન બનાવ્યું હતું. આઇબીએમ શૂબોક્સ આંકડાઓ સાથે પ્લસ, માઇનસ એવા શબ્દો ને સમજી ને સામાન્ય ગણતરીઓ કરી શકતું. પણ ૧ મિનટ… આ સ્પીચ રેકોગ્નિશન નો ખ્યાલ આવ્યો ક્યાથી?
વોઇસ ઇસ ધ ફ્યુચર જોર્રિટ વન દર મેઉલેન (જે એમેઝોન ડિવાઇસ અને અલેક્સા યુરોપ ના વાઇસ પ્રેસિડેંટ છે) એવું માને છે કે અવાજ થી ઓપરેટ થતાં મશીન વાપરવા સૌથી સરળ છે. આ જ ખ્યાલ માં ભવિષ્ય વસેલું છે. તેમના આ વિચાર ને લાગતો આવે એવો વિચાર ૧૭૭૩ માં પણ થયો હતો. કલ્પના કરો કે એવો સમય જ્યારે ઇન્ટરનેટ કે કમ્પ્યુટર નું નામ નહોતું ત્યારે રુસ ના વૈજ્ઞાનિક શ્રી ક્રિશ્ચિયન ક્રત્જેન્સ્ટેન એ એક એવું વિચિત્ર મશીન બનાવ્યું હતું જે મનુષ્ય ના અવાજ જેવા સ્વરો ઉત્પન્ન કરી શકતું હતું. રેઝોનન્સ ટ્યૂબ અને ઓર્ગન પાઇપ દ્વારા બનાવેલ તે વિશ્વ નું સૌથી પહેલું બોલતું મશીન હતું. જો એ સમય પ્રમાણે વિચારીએ તો કેવી કળા કે એક નિર્જીવ મશીન પણ અવાજ કાઢે છે! ત્યાર બાદ વર્ષ ૧૯૦૭ માં ગ્રેહામ બેલ દ્વારા ડિક્ટાફોન બનાવવા માં આવ્યો જે મનુષ્ય ના અવાજ ને રેકોર્ડ કરી શકતો હતો. પરંતુ આ બધા મશીન પેસીવ હતા. જેમ આગળ કહ્યું તેમ મનુષ્ય ને તો વાત કરવા જોઈએ! અને તેના માટે મશીન એ માણસ નું બોલેલું સાંભળી ને સમજવું પણ પડે.
સમજણા કહી શકાય એવા મશીન ની શરૂઆત ૧૯૫૨ માં થઈ. બેલ લેબોરેટરી દ્વારા ઔડરે નામનું મશીન બન્યું. છ ફૂટ ઊંચી રેક માં મઢેલ આ મશીન ધ્વનિ ના મૂળભૂત અંકો જેને અંગ્રેજી માં ફોનેમ્સ કહેવાય તેને ઓળખી શકતું. એક વાસ્તવિક ઢબે પહેલું એવું મશીન બન્યું જે મનુષ્ય ના અવાજ ને ફક્ત રેકોર્ડ નહીં પરંતુ ઓળખતું. એ સમય માં કમ્પ્યુટર તો રજવાડા નો વટ હતા અને આજ ની જેમ આમતેમ સહેલાઈ થી ફેરવી શકાય તેમ પણ નહોતા. તેમછતાં, ઔડરે એક એવું મશીન બન્યું જે શૂન્ય થી નવ સુધી ના અંકો ને ૯૦ ટકા ચોકસાઇ થી ઓળખી શકતું. તે સમયે આ આંકડાઓ ઓળખતું મશીન ફક્ત ફોન માં નંબર લગાવવા ઉપયોગ માં લઈ શકાતું. બોલી ને ફોન લગાવવા કરતાં નંબર ના બટન દબાવવા સહેલા પડે. આ કારણે એક મહત્વ નું ગણી શકાય તેવું સંશોધન પણ એટલું ઉપયોગી ન બની શક્યું.
આ બાદ ૧૯૬૦ માં જાપાન ના વૈજ્ઞાનિકો એ મનુષ્ય ની બોલી ને ઓળખી શકે એવા મશીન માટે પ્રયોગો શરૂ કર્યા. ક્રમશ: આઇબીએમ શૂબોક્સ બન્યું જેમાં પ્લસ અને માઇનસ બોલવાથી સરવાળા બાદબાકી થતાં હતા. સ્પીચ રેકોગ્નિશન માટે નું એક નોંધપાત્ર પગલું ૧૯૭૧ માં મંડાયું. યુએસ ની ડિફેન્સ રિસર્ચ એજન્સિ દરપાએ સ્પીચ અંડરસ્ટેંડિંગ રિસર્ચ પ્રોગ્રામ માટે નાણાં રોક્યા. આ પ્રોગ્રામ માં આઇબીએમ, કારનેજી મેલોન યુનિવર્સિટી અને સ્ટાંફોર્ડ રિસર્ચ સંસ્થા એ જુસ્સાભેર ભાગ લીધો. પરિણામે હાર્પીનો જન્મ થયો. આ હાર્પી પાસે હવે ૧૦૦૦ જેટલા શબ્દો નું ભંડોળ હતું. આ હાર્પી એટલું સફળ હતું કે તે આપણે બોલેલા શબ્દો ને સ્પીચ ટુ ટેક્સ્ટ અને ટેક્સ્ટ ટુ મશીન ટ્રાન્સલેશન કરી શકતું. ત્યાર બાદ આ રેલગાડી પુર પાટે દોડી.
અલેક્સા બેન… વાત તો કરો..
વર્ષ ૨૦૧૭ માં અમઝોન એ સૌપ્રથમ ભારત માં સ્માર્ટ સ્પીકર નું વહેચાણ શરૂ કર્યું. વર્ષ ૨૦૨૦ ના અંત સુધી માં ભારત માં ૭,૫૦,૦૦૦ સ્માર્ટ સ્પીકર વહેચાયા. હવે સ્માર્ટ સ્પીકર ફક્ત સંગીત જ નથી સંભળાવતા, પરંતુ ઘર ના લાઇટ – પંખા તથા બીજા ઉપકરણો ને પણ કંટ્રોલ કરે છે. આજ નું વાતાવરણ, તાપમાન, તમારી સમયસારણી, અલાર્મ અને બીજું શું નહીં… આ સ્માર્ટ વર્ચુયલ અસિસ્ટેંટ ફક્ત સ્પીકરમાથી ખૂબ આગળ વધી ને આર્ટિફિશ્યલ ઇન્ટેલીજન્સ ના ઘડતર હેઠળ આપણને નવી નવી સુવિધાઓ આપતા થયા છે. હવે તો આ સ્માર્ટ સ્પીકર લોકલ ભાષા પણ સમજવા માંડ્યા છે. અહી એક વાત નોંધવી ખરી કે જો તમારા ઘર માં સ્વિચ ઓન કરેલ સ્માર્ટ સ્પીકર હોય તો તેના કાન હમેશા ખુલ્લા હોય છે. તમે તેને જે પણ કહો છો તે બધુ જ તે અમેઝોન ના ક્લાઉડ સર્વર માં સ્ટોર કરે છે. આ તમારી ઓડિઓ ફાઇલ તમારી પસંદ ની વસ્તુઓ પીરસવા માટે વપરાઇ છે. તમે રોજ જે પણ વાત અલેક્સા કે ગૂગલ અસિસ્ટેંટ ને કહો છો તે સંગ્રહી ને પ્રોસેસ થાય છે. આ કારણે જ તમારી પસંદ વિશે તમારી વર્ચુયલ અસિસ્ટેંટ અચૂક વાકેફ હશે.
આપણે હમેશા જ્યારે ભવિષ્ય ના વિકસિત વિજ્ઞાન થી સભર વર્ષ ૨૦૫૦ કે ૨૦૬૦ વિશે કલ્પના કરીએ છીએ ત્યારે આપણને સાંભળી ને જવાબ દેતા મશીનની જરૂર થી કલ્પના કરીએ છીએ. ઘર ના બધા જ ઉપકરણો થી માંડી ને આપણાં દરેક કામ એક અવાજ કરતાં કોઈ મશીન કરી દે એવી સહુ ને ઇચ્છા થાય છે. જો ભવિષ્ય માં આર્ટિફિશ્યલ ઇન્ટેલીજન્સ ખૂબ જ વિકસિત થઈ ગયું તો કદાચ આપણે આપની સંવેદનાઓ પણ એક માનવસર્જિત સજીવ પાસે વ્યક્ત કરી શકીશું.
લે સાચ્ચે માં?
- અલેક્સા તમારા હુકમ થી છીંક પણ ખાઈ શકે છે. ફક્ત કહો કે ‘અલેક્સા, કેન યૂ સ્નીઝ?’
- અલેક્સા તમને સુવડવા માટે સ્નોર પણ કરી શકે છે.
- ગૂગલ અસિસ્ટેંટ ની મદદ થી તમે ખોવાયેલ વસ્તુ ને શોધી શકો છો. વારંવાર ભૂલી જતી વસ્તુ પર ફક્ત એક ટાઇલ ટ્રેકર નામનું ડિવાઇસ લગાવી દો.