हमने देखा है कि अधिकांश वार्तालाप सहायक गति के लिए अनुकूलित हैं।
वे सवालों के जवाब देते हैं, कार्रवाई पूरी करते हैं और लेन-देन बंद करते हैं।
वे अधिकतर कुशल, पूर्वानुमानित होते हैं और अक्सर पिछली बातचीत को भूल जाते हैं।
कई मामलों में, यह काम करता है. लेकिन हमेशा नहीं.
कई निर्णय पूर्णतः कार्यात्मक नहीं होते हैं. चश्मे का एक जोड़ा, कपड़े का एक टुकड़ा, या व्यक्तिगत देखभाल उत्पाद चुनना केवल एक कार्य पूरा करना नहीं है; यह आत्म-अभिव्यक्ति का कार्य है। फिर भी, कई डिजिटल अनुभव इन विकल्पों को अनुकूलित किए जाने वाले माइक्रो-ऑपरेशंस के रूप में मानते हैं: कम क्लिक, कम समय और अधिक रूपांतरण।
हमने बातचीत को घर्षण रहित, लेकिन अक्सर सतही भी बनाया है।
परिणाम विरोधाभासी है. निर्णय तेजी से होते हैं, लेकिन जरूरी नहीं कि बेहतर हों।
हम जो चाहते हैं उसे समझने में मदद करने के बजाय, सिस्टम हमें जल्दी निर्णय लेने में मदद करते हैं।
जो एक सरल प्रश्न उठाता है: क्या हम सही वेरिएबल का अनुकूलन कर रहे हैं?
धीमी खरीदारी का दर्शन
टीम के भीतर, हमने इस विचार को कॉल करना शुरू कर दिया धीमी खरीदारी: ऐसी प्रणालियाँ डिज़ाइन करना जो प्रतिबिंब, संदर्भ और इरादे को प्रोत्साहित करने के लिए पर्याप्त धीमी हों। कम कुशल नहीं, बल्कि अधिक जागरूक।
इस विचार की जड़ें हैं धीमी खाद्य गतिविधिजो 1980 के दशक में इटली में औद्योगिक फास्ट फूड और दैनिक जीवन में तेजी के प्रति सांस्कृतिक प्रतिक्रिया के रूप में उभरा। स्लो फूड ने खाने को स्वाद लेने के अनुभव के रूप में फिर से परिभाषित किया, जो समुदाय, उत्पत्ति और अर्थ के साथ जुड़ा हुआ है। स्लो शॉपिंग खरीदारी के लिए भी कुछ ऐसा ही करती है। यह खरीदारी के निर्णय को पूरा करने के कार्य के रूप में नहीं, बल्कि एक ऐसी प्रक्रिया के रूप में मानता है जो भावनात्मक और प्रासंगिक गहराई की हकदार है। खरीदारी का अच्छा अनुभव बस इतना ही नहीं होना चाहिए तेज़. यह होना चाहिए जान-बूझकर.
व्यवहारिक अर्थशास्त्र में इसके लिए एक उपयोगी लेंस है। डेनियल कन्नमन सोच के दो तरीकों के बीच अंतर करता है: सिस्टम 1, जो तेज़, सहज और स्वचालित है, और सिस्टम 2, जो धीमा, विचारशील और प्रयासपूर्ण है।
अधिकांश डिजिटल कॉमर्स को सिस्टम 1 का फायदा उठाने के लिए डिज़ाइन किया गया है, जो कमी के संकेतों, उलटी गिनती टाइमर और एक-क्लिक चेकआउट के माध्यम से आवेग को ट्रिगर करता है। स्लो शॉपिंग एक अलग प्रश्न पूछती है: क्या होगा यदि हम इसके बजाय सिस्टम 2 के लिए डिज़ाइन करें? क्या होगा अगर हम लोगों को खरीदने से पहले सोचने की जगह दें?
यह इसके लिए घर्षण बढ़ाने के बारे में नहीं है। यह बेहतर निर्णयों के लिए परिस्थितियाँ बनाने के बारे में है, जिस तरह से लोग न केवल उस क्षण में, बल्कि उसके बाद भी अच्छा महसूस करते हैं।
पिछले वर्ष में, हम पर वर्डलिफ्ट एक अलग परिकल्पना का पता लगाना शुरू कर दिया है।
क्या होगा यदि कोई एजेंट अलग ढंग से सोच सके, धीमा हो, और केवल प्रतिक्रिया न दे?
क्या होगा यदि यह एक बहु-मोड़ बातचीत में शामिल हो सकता है, समय के साथ इरादे को समझ सकता है, और लोगों को कार्रवाई में जल्दबाजी करने के बजाय सूचित निर्णय लेने में मदद कर सकता है?
इसी ने एक आंतरिक अनुसंधान एवं विकास परियोजना को जन्म दिया जिसे हमने नाम दिया सारा (शॉपिंग एआई रिसर्च असिस्टेंट)।
एक प्रश्न से शुरू
हमारी कई परियोजनाओं की तरह, हमने किसी उत्पाद के बजाय अनुसंधान से शुरुआत की। कोई व्यावसायिक रोडमैप या ऐसा कुछ भी नहीं था। इसकी शुरुआत चार मुख्य अवधारणाओं द्वारा निर्देशित, विचारों का पता लगाने और परीक्षण करने के स्थान के रूप में हुई।
- आवाज इंटरफेस: हम यह समझना चाहते थे कि कैसे बोली जाने वाली बातचीत खरीदारी की गतिशीलता को बदल देती है। आवाज आदान-प्रदान को अधिक स्वाभाविक महसूस कराती है और मेनू पर क्लिक करने की तुलना में उत्पाद सुविधाओं को नेविगेट करने के संज्ञानात्मक भार को कम करती है।
- मल्टी-टर्न बातचीत. एकल सवाल-जवाब के आदान-प्रदान के बजाय, हम निरंतर संवाद में रुचि रखते थे जहां एजेंट संदर्भ को याद रखता है और समय के साथ पिछले बदलावों पर निर्माण करता है।
- तर्क श्रृंखला. हम चाहते थे कि एजेंट किसी सिफ़ारिश पर पहुंचने से पहले चरण दर चरण सोचें, उपयोगकर्ता की ज़रूरतों, उनकी बाधाओं और उनके भावनात्मक संकेतों पर विचार करें।
- मानव-केंद्रित इंटरैक्शन डिज़ाइनजिसका अर्थ है कि हमने रूपांतरण मेट्रिक्स पर उपयोगकर्ता की भलाई, प्रतिबिंब और संतुष्टि को प्राथमिकता दी है।
लेकिन हम कोई दूसरा चैटबॉट नहीं बनाना चाहते थे; हम और गहराई तक जाना चाहते थे.
लक्ष्य स्पष्ट था: वास्तव में मददगार होने के लिए एजेंट को बातचीत में काफी देर तक व्यस्त रखना।
प्रारंभिक इंटरैक्शन जानबूझकर न्यूनतम थे, उनके पीछे कुछ भी जटिल नहीं था, इसलिए हमने वाक् पहचान, बुनियादी संवाद प्रबंधन और हल्के तर्क चरणों का उपयोग किया। अभी तक कुछ भी पॉलिश नहीं किया गया था.
हम किसी को प्रभावित करने की कोशिश नहीं कर रहे थे। हम देखना चाहते थे कि पहले क्या टूटेगा.
वहां से, हमने संदर्भ, इरादे पर नज़र रखना और बातचीत की निरंतरता को दोगुना कर दिया। हम सिर्फ स्वचालित नहीं करना चाहते थे; हम और अधिक तर्क और विचार चाहते थे।
सिद्धांत जो सारा का मार्गदर्शन करते हैं
मेरे स्नातक की थीसिस, “सारा इज़ ऑल यू नीड” में प्रारंभिक, छोटे पैमाने पर परीक्षण के माध्यम से, वास्तुकला, परिकल्पना और मूल्यांकन विधियों को औपचारिक रूप दिया गया, जिसने सारा को न केवल एक वार्तालाप एजेंट के रूप में बल्कि एक तर्क प्रणाली के रूप में भी स्थापित किया। इसने अंतःविषय सिद्धांत पर आधारित, भावात्मक कंप्यूटिंग, व्यवहारिक अर्थशास्त्र, नैतिक डिजाइन और उपभोक्ता मनोविज्ञान से विचारों को एक साथ खींचा।
तब से, हमें चार सिद्धांतों द्वारा निर्देशित किया गया है।
रूपांतरण पर व्यस्तताजिसका अर्थ है सफलता को संवाद की गुणवत्ता से मापना, न कि चेकआउट की गति से। मल्टी-टर्न ओवर एकल प्रतिक्रियाकई आदान-प्रदानों के बीच बातचीत को बनाए रखना ताकि एजेंट अलग-अलग प्रश्नों पर प्रतिक्रिया करने के बजाय उभरती जरूरतों को समझ सके। अनुनय पर समर्थनउपयोगकर्ताओं को यह स्पष्ट करने में मदद करता है कि वे वास्तव में क्या चाहते हैं बजाय उन्हें उस ओर प्रेरित करने के जो सबसे अधिक लाभदायक है। और मूल दर्शन के रूप में धीमी खरीदारीप्रतिबिंब, भावनात्मक जागरूकता और जानबूझकर निर्णय लेने को प्रोत्साहित करने के लिए प्रत्येक इंटरैक्शन को डिज़ाइन करना।
यह अंतिम बिंदु SARA को पारंपरिक संवादात्मक AI से मौलिक रूप से अलग बनाता है। अधिकांश सहायक कार्रवाई में लगने वाले समय को कम करने के लिए बनाए गए हैं। SARA को निर्णय की गुणवत्ता को अधिकतम करने के लिए बनाया गया है। जबकि कई सहायक त्वरित, आवेगपूर्ण निर्णयों को प्रोत्साहित करते हैं, SARA को अधिक विचारशील प्रक्रिया का समर्थन करने के लिए डिज़ाइन किया गया है, एक ऐसी बातचीत जो पूर्वानुमान लगाने के बजाय इरादे को स्पष्ट करने में मदद करती है।
इस फ़्रेमिंग ने SARA को एक ऐसी चीज़ में बदल दिया जिसे हम माप सकते हैं और सुधार सकते हैं, न कि केवल प्रदर्शित कर सकते हैं। 45 सत्रों में प्रारंभिक पायलट परीक्षण से पता चला कि जब सिस्टम अच्छी तरह से काम करता है, तो बातचीत 11 एक्सचेंजों के मध्य तक पहुंचती है और एक मिनट से अधिक समय तक चलती है। यह एक मजबूत संकेत है कि उपयोगकर्ता उस तरह के चिंतनशील संवाद में शामिल होने के इच्छुक थे जिसकी स्लो शॉपिंग रूपरेखा मांग करती है। जब सत्र विफल हुआ, तो इसका कारण अत्यधिक तकनीकी था, प्रेरक नहीं। लोग वांछित बातचीत करना। प्रौद्योगिकी को बस बनाए रखने की जरूरत है।
प्रयोगशाला से जीवन तक: वास्तविक दुनिया के प्रयोग
इसके तुरंत बाद, यह विचार वास्तविक दुनिया के संदर्भों और वास्तविक दुनिया की सीमाओं के साथ परीक्षण करने के लिए हमारी आंतरिक प्रयोगशाला से आगे बढ़ गया।
सारा एक प्रौद्योगिकी बनने लगी, जिसे हम “सारा द्वारा संचालित” का लेबल दे सकते हैं। पहले प्रयोग में एक प्रमुख आईवियर रिटेल पार्टनर के लिए प्रारंभिक प्रोटोटाइप विकसित करना शामिल था।
चुनौती ठोस थी: एक एजेंट मौजूदा उत्पाद सूची और इन-स्टोर अनुभव के साथ कैसे एकीकृत होता है? जानबूझकर किया गया घर्षण, जो चिंतन को प्रोत्साहित करता है, वास्तव में निर्णय लेने की प्रक्रिया में कितना सहायक होता है? और मार्गदर्शन कहां झुंझलाहट में बदल जाता है?
हमने जो बनाया वह था एक संवादी सहायक जो संपूर्ण खुदरा यात्रा का समर्थन कर सकता है, आरंभिक ऑनलाइन खोज से लेकर इन-स्टोर सहभागिता तक। उस ग्राहक के बारे में सोचें जो ड्राइविंग के लिए स्टाइलिश, उच्च प्रदर्शन वाले ध्रुवीकृत धूप के चश्मे की तलाश में दुकान में जा रहा है। अकेले दर्जनों विकल्प ब्राउज़ करने के बजाय, वे SARA से बात कर सकते हैं, वैयक्तिकृत स्टाइल सलाह प्राप्त कर सकते हैं, और फिर ब्रांड, कीमत और ध्रुवीकरण और लेंस रंग जैसी प्रमुख विशेषताओं के आधार पर फ़िल्टर कर सकते हैं। एजेंट ने डिजिटल और भौतिक अनुभव के बीच के अंतर को पाट दिया, जिसे उद्योग “भौतिक” (भौतिक+डिजिटल). ग्राहकों और कर्मचारियों दोनों को तत्काल, सटीक उत्पाद मार्गदर्शन प्रदान करना संरचित डेटा.
ब्रांड के लिए, इसका मतलब कुछ व्यावहारिक था: अपने किसी भी मौजूदा सिस्टम को बदले बिना एक समृद्ध, अधिक निर्देशित खरीदारी अनुभव प्रदान करने की क्षमता। एजेंट ने पहले से मौजूद बातों के अलावा बातचीत संबंधी बुद्धिमत्ता को भी शामिल किया, ग्राहक अनुभव में सुधार किया और कर्मचारियों को एक उपकरण दिया, जिस पर वे सभी टचप्वाइंट पर वास्तविक समय, सटीक उत्पाद जानकारी के लिए भरोसा कर सकते थे।
नतीजा
संवादात्मक मॉडल प्रयोगशाला के बाहर भी कायम रह सकता है: उपयोगकर्ता एजेंट के साथ जुड़े रहे, विकल्प तलाशे और बातचीत में बने रहे। साथ ही, वास्तविक इन्वेंट्री, वास्तविक बाधाओं और वास्तविक ग्राहक अपेक्षाओं के साथ एकीकरण ने आंतरिक परीक्षण की तुलना में बहुत तेजी से सीमाएं उजागर कीं। और शायद सबसे महत्वपूर्ण बात यह है कि मल्टी-टर्न रीजनिंग, इंटेंट ट्रैकिंग और रिफ्लेक्टिव पेसिंग के अंतर्निहित सिद्धांत वास्तव में लाइव रिटेल वातावरण में हस्तांतरणीय साबित हुए हैं।
SARA अब केवल एक प्रयोग नहीं रह गया था.
एक सहायक से परे: सारा एक मंच के रूप में
कुछ बिंदु पर हमने आंतरिक रूप से SARA का उपयोग करने के तरीके में बदलाव देखा। हम एक स्टैंडअलोन उत्पाद के रूप में “शिपिंग SARA” से लगभग हर चीज में इसके घटकों का पुन: उपयोग करने के लिए चले गए थे: संवाद तर्क, तर्क मॉड्यूल, ऑर्केस्ट्रेशन परतें। अलग-अलग परियोजनाओं के लिए अलग-अलग एजेंटों की आवश्यकता होती है, लेकिन वे सभी एक ही नींव पर बने होते हैं। फोकस एक सहायक से हटकर पर केंद्रित हो गया था एक बुनियादी ढांचा, SARA द्वारा संचालित प्रणालियों का एक सेट।
SARA एक उत्पाद अवधारणा से एक आंतरिक बुनियादी ढांचे में विकसित हुआ, जो एजेंटिक अनुभव बनाने के लिए एक पुन: प्रयोज्य परत है। सहायक से प्लेटफ़ॉर्म तक का यह परिवर्तन संभवतः वर्डलिफ्ट लैब के लिए एक महत्वपूर्ण मोड़ साबित हुआ।
रिटेल से परे एजेंट एआई
फिर हमने यह पता लगाना शुरू किया कि समान सिद्धांत बाहर कैसे लागू हो सकते हैं ई-कॉमर्स. सांस्कृतिक और गैर-लाभकारी सेटिंग्स में सहयोग के माध्यम से, हमने लेनदेन के बजाय मार्गदर्शन, शिक्षा और बातचीत पर केंद्रित एजेंटिक अनुभवों को प्रोटोटाइप किया।
सांस्कृतिक क्षेत्र में, हमने पता लगाया कि कैसे एक तर्कशील एजेंट आगंतुकों को जटिल प्रदर्शनियों को नेविगेट करने में मदद कर सकता है। इसका विचार संदर्भ-जागरूक स्पष्टीकरण प्रदान करना था जो आगंतुक की जिज्ञासा और गति के अनुरूप हो, एक जानकार मार्गदर्शक की तरह जो बोलने से पहले सुनता है।
गैर-लाभकारी क्षेत्र में, हमने सामाजिक प्रभाव पहल के लिए एजेंटिक दृष्टिकोण पर काम किया। यहां चुनौती रिटेल से बहुत अलग थी. यह किसी उत्पाद को बेचने के बारे में नहीं था। यह लोगों को जानकारी तक पहुंचने, उनके विकल्पों को समझने और महत्वपूर्ण निर्णय लेने में समर्थन महसूस करने में मदद करने के बारे में था।
हमने क्या सीखा? वही मूल क्षमताएं, बहु-मोड़ संवाद, प्रासंगिक तर्क और एक धैर्यवान, गैर-धमकाने वाली बातचीत शैली, उतनी ही मूल्यवान साबित हुई जब लक्ष्य बिक्री के बजाय सामाजिक प्रभाव था।
इन परियोजनाओं ने एक प्रमुख अंतर्दृष्टि को सुदृढ़ किया: एक एजेंट का मूल्य जो तर्क करता है और संदर्भ बनाए रखता है वह खुदरा तक ही सीमित नहीं है। चाहे कोई व्यक्ति चश्मा चुन रहा हो या किसी सामाजिक सेवा में काम कर रहा हो, विचारशील, बहु-मोड़ बातचीत की आवश्यकता समान है।
पैटर्न सुसंगत है: जब कोई एजेंट तर्क कर सकता है और संदर्भ बनाए रख सकता है, तो यह केवल एक उपकरण नहीं, बल्कि एक इंटरफ़ेस बन जाता है।
सारा टुडे: मानव-केंद्रित एआई के लिए एक फाउंडेशन
पीछे मुड़कर देखें तो पता चलता है कि SARA का इरादा कभी भी अंतिम उत्पाद बनने का नहीं था। यह एक शुरुआती बिंदु था.
आज, वर्डलिफ्ट लैब हमने उन प्रयोगों से जो सीखा है उसे एक साथ लाती है: तर्क करने वाले एजेंटों का निर्माण करना, कई मोड़ों तक चलने वाली बातचीत को डिजाइन करना, वास्तविक भागीदारों के साथ प्रोटोटाइप का परीक्षण करना और शुद्ध स्वचालन के बजाय मानव-केंद्रित परिणामों पर ध्यान केंद्रित करना।
व्यापक परिदृश्य तेजी से आगे बढ़ रहा है। आने वाले वर्षों में वॉयस कॉमर्स में उल्लेखनीय वृद्धि होने का अनुमान है, और एजेंटिक कॉमर्स, जहां एआई एजेंट खोज से भुगतान तक पूर्ण खरीदारी चक्र में भाग लेते हैं, एक वास्तविकता बन रहा है। प्रमुख खिलाड़ी पहले से ही सुरक्षित टोकनयुक्त भुगतान प्रणालियों के साथ सीधे संवादी इंटरफेस के भीतर खरीदारी को सक्षम कर रहे हैं जो एजेंटों को उपयोगकर्ताओं की ओर से लेनदेन करने की अनुमति देता है।
लेकिन केवल गति ही समाधान नहीं है। हमारा मानना है कि SARA एक तीसरे रास्ते की ओर इशारा करता है: वाणिज्य जो तेज़ है पर्याप्त लेकिन नैतिक रूप से स्थिर रहता है, वाणिज्यिक गतिविधि को उपयोगकर्ता कल्याण और स्थिरता लक्ष्यों से जोड़ता है।
एक ऐसे एजेंट की कल्पना करें, जो खरीदारी पूरी करने से पहले, उत्पाद की उत्पत्ति, कीमत और पर्यावरणीय प्रभाव का सारांश देता है, और बस पूछता है: “क्या आप जारी रखना चाहेंगे, या आपको और समय चाहिए?” वह एक प्रश्न चेकआउट को एक सजगता से एक सचेत प्रतिज्ञान में बदल देता है। यह एजेंटिक कॉमर्स की वह सीमा है जिसमें हमारी सबसे अधिक रुचि है।
SARA नींव बनी हुई है, इसलिए नहीं कि यह उत्तम है, बल्कि इसलिए क्योंकि इसने हमें अन्वेषण करने के लिए जगह दी है। और वह अन्वेषण अभी भी जारी है।
वाणिज्य का भविष्य न केवल तेज़ है बल्कि यह अधिक जानबूझकर है। पर वर्डलिफ्ट इनोवेशन लैबहम धीमी खरीदारी के दर्शन को वास्तविकता में बदल रहे हैं। एजेंटिक एआई में हमारे नवीनतम प्रयोगों का अन्वेषण करें और देखें कि कैसे सारा इंसानों और मशीनों के बीच संबंधों को फिर से परिभाषित कर रहा है।