जाहिरात बंद करा

2017 हे वर्ष आहे जेव्हा ते पूर्णत: उतरले स्मार्ट व्हॉइस असिस्टंटची लढाई, ज्यामध्ये आमचे आवश्यक सहाय्यक बनण्याची क्षमता आहे. ऍपल, ऍमेझॉन, मायक्रोसॉफ्ट आणि गुगल आगीत त्यांचे लोखंडी आहेत, प्रत्येक भिन्न आहेत. तथापि, सर्वात महत्वाच्या घटकांपैकी एकामध्ये, Apple च्या Siri ने आघाडी घेतली आहे – ती सर्वात जास्त भाषा बोलू शकते.

झेक वापरकर्त्याला कदाचित यात फारसा रस नसेल, कारण दुर्दैवाने सिरी अजूनही त्याच्यासाठी सर्वात महत्त्वाची भाषा बोलत नाही, परंतु अन्यथा सफरचंद सहाय्यक 21 देशांसाठी स्थानिकीकृत 36 भाषा बोलतो आणि समजतो, ज्या स्पर्धकांपैकी कोणीही नाही जुळू शकते.

मायक्रोसॉफ्टच्या कॉर्टानाला तेरा देशांत आठ भाषा बोलायला शिकवल्या जातात, गुगल असिस्टंट चार भाषा बोलू शकतो आणि ॲमेझॉनचा अलेक्सा आतापर्यंत फक्त इंग्रजी आणि जर्मन बोलू शकतो. अशा वेळी जेव्हा बहुतेक स्मार्टफोन युनायटेड स्टेट्सच्या बाहेर विकले जातात, तेव्हा त्यांच्या व्हॉइस असिस्टंटचे स्थानिकीकरण करणे सर्व टेक कंपन्यांसाठी अत्यंत महत्त्वाचे आहे. आणि Apple ची सुरुवात येथे झाली आहे, हे देखील धन्यवाद की ते सिरीसह आलेले पहिले होते.

आता बाजुला जायचे की नाही याबाबतचे सगळे वाद ॲपलने ही आघाडी थोडीही वाया घालवली नाही आणि सहाय्यक कौशल्यांच्या बाबतीत स्पर्धा त्याला पकडू लागली आहे किंवा त्याला मागे टाकू लागली आहे. एजन्सी रॉयटर्स किंबहुना, सिरी प्रत्यक्षात नवीन भाषा कशा शिकते याबद्दल तिने मनोरंजक माहिती आणली, जी शेवटी अनेक बाजारपेठांसाठी काही कार्यांपेक्षा थोडी अधिक महत्त्वाची असू शकते.

सहाय्यकांना

जर व्हॉईस असिस्टंट्स खरोखरच शक्य तितके पसरवायचे आणि केवळ स्मार्टफोनमध्येच नव्हे तर जगभरातील स्मार्ट मदतनीस बनायचे असतील, तर शक्य तितक्या भाषा जाणून घेणे अत्यंत महत्त्वाचे आहे. यामुळेच सिरी ही चीनी वू भाषा कुटुंबातील विशेष बोली शिकत आहे, जी केवळ शांघायच्या आसपास बोलली जाते, तथाकथित "शांघाय भाषा".

जेव्हा सिरी नवीन भाषा शिकण्यास प्रारंभ करणार आहे, तेव्हा लोक Apple च्या प्रयोगशाळेत वेगवेगळ्या उच्चार आणि बोलींमधील परिच्छेद वाचण्यासाठी प्रवेश करतात. हे नंतर मॅन्युअली ट्रान्स्क्राइब केले जातात जेणेकरून संगणकाला मजकूर नेमका काय आहे हे कळेल. ऍपलच्या स्पीच टीमचे प्रमुख, ॲलेक्स एसेरो, स्पष्ट करतात की वेगवेगळ्या आवाजांमधील आवाजांची श्रेणी देखील कॅप्चर केली जाते, ज्यामधून एक ध्वनिक मॉडेल तयार केले जाते, जे नंतर शब्द अनुक्रमांचा अंदाज लावण्याचा प्रयत्न करते.

या प्रक्रियेनंतर, श्रुतलेखन मोड येईल, जे iOS आणि macOS दोन्ही वापरकर्त्यांद्वारे सामान्यतः वापरले जाऊ शकते आणि Siri पेक्षा बऱ्याच भाषांमध्ये कार्य करते. Apple नंतर नेहमी या ऑडिओ रेकॉर्डिंगची एक लहान टक्केवारी कॅप्चर करते, त्यांना अनामित करते आणि नंतर त्यांना पुन्हा मजकूरात लिप्यंतर करते जेणेकरून संगणक शिकू शकेल. हे रूपांतरण मानवांद्वारे देखील केले जाते, जे लिप्यंतरण त्रुटीची संभाव्यता निम्म्याने कमी करते.

एकदा पुरेसा डेटा संकलित केला गेला आणि सिरी नवीन भाषेत बोलली गेली की, Apple संभाव्य प्रश्नांची उत्तरे देऊन एक सहाय्यक जारी करेल. सिरी नंतर वापरकर्ते तिला काय विचारतात यावर आधारित वास्तविक जगात शिकते आणि दर दोन आठवड्यांनी सतत सुधारले जाते. वापरकर्ते वापरतील अशा सर्व संभाव्य परिस्थिती आगाऊ लिहिणे Apple किंवा इतर कोणाच्याही अधिकारात नाही.

“तुम्हाला प्रत्येक भाषेसाठी आवश्यक असलेली प्रणाली तयार करण्यासाठी तुम्ही पुरेसे लेखक नियुक्त करू शकत नाही. तुम्हाला उत्तरांचे संश्लेषण करावे लागेल,” प्रो स्पष्ट केले रॉयटर्स चार्ल्स जोली, ज्याने बुद्धिमान सहाय्यक ओझलो तयार केला. डॅग किटलॉस, बॉस आणि आणखी एक स्मार्ट असिस्टंट, विवचे सह-संस्थापक, जे गेल्या वर्षी देखील सहमत होते सॅमसंगने विकत घेतले.

स्मार्ट असिस्टंटच्या स्केलिंग समस्येचे निराकरण करण्यासाठी Viv अचूकपणे तयार केले गेले. आजच्या मर्यादित कार्यक्षमतेला सामोरे जाण्याचा एकमेव मार्ग म्हणजे सिस्टम उघडणे आणि जगाला ते शिकवणे,” किटलॉस म्हणतात.

झेक सिरीबद्दल बर्याच काळापासून बोलले जात आहे, परंतु नजीकच्या भविष्यात सफरचंद सहाय्यक आपली मूळ भाषा शिकेल अशी अपेक्षा करणे कदाचित अशक्य आहे. मूळ भाषिकांची संख्या लक्षात घेता, चेक अजूनही तुलनेने लहान आणि रसहीन आहे, अगदी उपरोक्त "शांघाय" देखील अंदाजे 14 दशलक्ष लोक बोलतात.

परंतु नवीन भाषा शिकण्याच्या प्रक्रियेबद्दल मनोरंजक गोष्ट म्हणजे ऍपल ते करण्यासाठी श्रुतलेखन डेटा वापरते. म्हणजे जास्त आम्ही आयफोन, आयपॅड किंवा मॅकमध्ये चेक लिहू, एकीकडे, फंक्शन जितके अधिक सुधारेल, आणि दुसरीकडे, ऍपलकडे डेटाचा वाढत्या प्रमाणात मोठा नमुना असेल, ज्यामधून सिरी एक दिवस चेक शिकण्यास सक्षम असेल. ते किती दिवस टिकणार हा प्रश्न आहे.

स्त्रोत: रॉयटर्स
.