एक ऐसी स्थिति की कल्पना करें जहाँ एक फील्ड इंजीनियर किसी कमर्शियल मैन्युफैक्चरिंग फैसिलिटी के कंक्रीट बेसमेंट में खड़ी है, जो सेलुलर और वायरलेस नेटवर्क से पूरी तरह से कटी हुई है। उसे मोबाइल पीडीएफ एडिटर का उपयोग करके 500 पृष्ठों के जटिल मैनुअल से विशिष्ट इलेक्ट्रिकल सुरक्षा क्लॉज निकालने हैं, एक जटिल डायग्नोस्टिक रूटीन को निष्पादित करना है, और प्रारंभिक डेटा को एंटरप्राइज सीआरएम सिस्टम में लॉग करना है। उसके पास कंपनी द्वारा दिया गया iPhone 11 है। उससे तीन मंजिल ऊपर, साइट मैनेजर iPhone 14 Pro पर इनकमिंग डेटा स्ट्रीम की निगरानी कर रहा है और सिस्टम के सिंक्रोनाइज़ होने का इंतज़ार कर रहा है। यह वातावरण आधुनिक आर्टिफिशियल इंटेलिजेंस के लिए वास्तविक ऑपरेशनल टेस्ट है। यह इस बारे में नहीं है कि प्रयोगशाला की आदर्श स्थितियों में एल्गोरिदम क्या हासिल कर सकते हैं; यह इस बारे में है कि वे दैनिक व्यवसाय की कठोर, नेटवर्क-विहीन वास्तविकताओं में क्या निष्पादित कर सकते हैं।
एज-इनेबल्ड एंटरप्राइज एआई (Edge-enabled enterprise AI) बाहरी नेटवर्क कनेक्टिविटी की परवाह किए बिना निरंतर कंप्यूटेशनल प्रोसेसिंग सुनिश्चित करने के लिए सीधे स्थानीय हार्डवेयर पर ऑप्टिमाइज्ड न्यूरल नेटवर्क चलाने की प्रक्रिया है। एक एआई इंजीनियर के रूप में अपने छह वर्षों के अनुभव में, ऐसी आर्किटेक्चर बनाते समय जो वास्तव में फील्ड में काम करती है, मैंने महसूस किया है कि उपयोगिता पूरी तरह से इस स्थानीय लचीलेपन (resilience) पर निर्भर करती है। एंटरप्राइज टेक्नोलॉजी लीडर्स और ऑपरेशंस डायरेक्टर्स—जो इन डिजिटल ईकोसिस्टम के प्राथमिक आर्किटेक्ट हैं—जल्द ही महसूस कर रहे हैं कि रॉ प्रोसेसिंग पावर की तुलना में एक्सेसिबिलिटी (पहुंच) कहीं अधिक मायने रखती है। जब हम फील्ड के लिए सिस्टम बनाते हैं, तो हम सिर्फ कोड नहीं लिख रहे होते; हम स्थानीय स्वायत्तता (localized autonomy) का निर्माण कर रहे होते हैं।
हार्डवेयर फ्रैगमेंटेशन: डिप्लॉयमेंट की सबसे बड़ी चुनौती
एंटरप्राइज टेक्नोलॉजी की सबसे बड़ी वास्तविकताओं में से एक 'मिक्स्ड-हार्डवेयर फ्लीट' (मिश्रित हार्डवेयर बेड़ा) है। संगठन शायद ही कभी हर डिवाइस को एक साथ अपग्रेड करते हैं। एक कॉर्पोरेट ईकोसिस्टम में पुराने एंट्री-लेवल डिवाइस, मिड-टियर वर्कहॉर्स और प्रीमियम फ्लैगशिप सभी एक साथ काम कर सकते हैं। ऐसा सॉफ्टवेयर बनाना जो अधिकतम हार्डवेयर क्षमता मानकर चलता है, ऑपरेशनल विफलता का एक निश्चित रास्ता है।

जब हम AI-पावर्ड मोबाइल समाधान विकसित करते हैं, तो आर्किटेक्चर को इस हार्डवेयर स्पेक्ट्रम के साथ लचीले ढंग से स्केल करना चाहिए। एक पुराना डिवाइस, जो अपने न्यूरल इंजन और थर्मल सीमाओं से बंधा है, उसे भी बीस मिनट में बैटरी खत्म किए बिना मुख्य मशीन लर्निंग कार्यों को निष्पादित करने की आवश्यकता होती है। इसके विपरीत, जब एप्लिकेशन नए हार्डवेयर पर चलता है, जैसे कि मानक iPhone 14 या बड़े स्क्रीन वाला iPhone 14 Plus, तो इसे अधिक जटिल स्थानीय निष्कर्षों (inferences) को प्रोसेस करने के लिए विस्तारित मेमोरी बैंडविड्थ और तेज़ यूनिफाइड मेमोरी आर्किटेक्चर का उपयोग करना चाहिए। सॉफ्टवेयर को गतिशील रूप से उस हार्डवेयर का आकलन करना चाहिए जिस पर वह चल रहा है और उसके अनुसार अपने कंप्यूटेशनल भार को समायोजित करना चाहिए।
यह डायनामिक स्केलिंग महत्वपूर्ण है क्योंकि डिवाइस चाहे जो भी हो, एंड-यूज़र का वर्कफ़्लो समान रहता है। तकनीशियन अपने उपकरणों पर निर्भर रहता है कि वे भरोसेमंद तरीके से काम करें। यदि किसी दस्तावेज़ को संक्षेप में प्रस्तुत करने के लिए अनुबंध विश्लेषण टूल को क्लाउड प्रोसेसिंग की आवश्यकता है, और तकनीशियन कनेक्टिविटी खो देता है, तो वह एप्लिकेशन प्रभावी रूप से काम करना बंद कर देता है। ऑप्टिमाइज्ड, टास्क-स्पेसिफिक मॉडल्स को सीधे 'एज' पर भेजकर, हम यह सुनिश्चित करते हैं कि नेटवर्क खराब होने पर भी बुनियादी कार्य चलते रहें।
संगठन बना रहे हैं स्थानीय प्रोसेसिंग इकोसिस्टम
इंडस्ट्री अब इस धारणा से दूर जा रही है कि सारा आर्टिफिशियल इंटेलिजेंस दूर, केंद्रीकृत सर्वर फार्मों में रहना चाहिए। एंटरप्राइज डेटा के हर टुकड़े को सर्वर पर भेजने और वापस लाने का लॉजिस्टिक और वित्तीय खर्च अब अवहनीय होता जा रहा है, खासकर जैसे-जैसे डेटा की मात्रा बढ़ रही है। हम कंपनियों के इंफ्रास्ट्रक्चर के प्रति दृष्टिकोण में एक बुनियादी बदलाव देख रहे हैं।
MIT स्लोन मैनेजमेंट रिव्यू में प्रकाशित एक हालिया विश्लेषण ने इसी बदलाव पर प्रकाश डाला है। कॉलमिस्ट थॉमस एच. डेवनपोर्ट और रैंडी बीन ने उल्लेख किया कि बड़े डेटा सेंटर बनाने के बजाय—जो काम आम तौर पर वेंडरों के लिए छोड़ दिया जाता है—इन तकनीकों का उपयोग करने वाली कंपनियां आंतरिक "AI फैक्ट्रियां" बना रही हैं। ये फैक्ट्रियां टेक्नोलॉजी प्लेटफॉर्म, ऑप्टिमाइज्ड विधियों, प्रोप्रायटरी डेटा और पहले से विकसित एल्गोरिदम का एक संयोजन हैं जो बड़े पैमाने पर इंटेलिजेंट सिस्टम बनाना और तैनात करना अत्यधिक कुशल बनाती हैं। पाइपलाइन को मानकीकृत करके, संगठन तेजी से ऑप्टिमाइज्ड न्यूरल मॉडल को 'एज' पर भेज सकते हैं।
यह स्थानीय इंफ्रास्ट्रक्चर बड़े आर्थिक बदलाव ला रहा है। हालिया मार्केट रिपोर्टों के अनुसार, न्यूरल नेटवर्क सॉफ्टवेयर बाजार 2023 में 31.2 बिलियन डॉलर से बढ़कर 2024 में 38.5 बिलियन डॉलर होने का अनुमान है, जो काफी हद तक एंटरप्राइज ऑटोमेशन प्रयासों और एज-कैपेबल सॉफ्टवेयर के प्रसार से प्रेरित है। इस क्षेत्र में गहराई से काम करने वाली फर्म के रूप में, NeuralApps इस रुझान को प्रत्यक्ष रूप से देख रही है। एंटरप्राइजेस अब रिमोट इंटेलिजेंस किराए पर लेने से संतुष्ट नहीं हैं; वे अपनी स्थानीय इंटेलिजेंस के मालिक बनना चाहते हैं और उसे सीधे अपने फ्लीट डिवाइसों पर तैनात करना चाहते हैं।
टास्क-स्पेसिफिक एजेंट: सामान्य सिस्टम से कहीं बेहतर
एआई फैक्ट्री बनाने के लिए यह कड़े निर्णय लेने की आवश्यकता होती है कि वास्तव में कौन से मॉडल आवश्यक हैं। फोन पर एक विशाल, सामान्यीकृत भाषा मॉडल (generalized language model) डालना बेहद अक्षम है। सामान्यीकृत मॉडल बहुत भारी होते हैं क्योंकि उन्हें क्वांटम भौतिकी से लेकर प्राचीन इतिहास तक सब कुछ के बारे में सवालों के जवाब देने के लिए प्रशिक्षित किया जाता है। एक फील्ड तकनीशियन को कविता लिखने के लिए अपने डिवाइस की आवश्यकता नहीं है; उसे मेंटेनेंस रिकॉर्ड को सटीक रूप से वर्गीकृत करने के लिए इसकी आवश्यकता है।

इसके बजाय, इंडस्ट्री अब अत्यधिक विशिष्ट, स्वायत्त एजेंटों (autonomous agents) की ओर बढ़ रही है। ये छोटे, बेहद ऑप्टिमाइज्ड न्यूरल नेटवर्क हैं जिन्हें एक बहुत ही विशिष्ट कार्य को असाधारण रूप से अच्छी तरह से करने के लिए प्रशिक्षित किया गया है। गार्टनर के एक हालिया अनुमान के अनुसार, 2025 के अंत तक, 40% एंटरप्राइज एप्लिकेशन में एम्बेडेड टास्क-स्पेसिफिक एआई एजेंट होंगे। चूंकि ये मॉडल कंप्यूटेशनल रूप से हल्के होते हैं, वे सिस्टम संसाधनों को खत्म किए बिना उपयोगकर्ता की समस्याओं को हल करने के लिए बैकग्राउंड में चुपचाप काम करते हुए, मानक हार्डवेयर की मेमोरी सीमाओं के भीतर आसानी से रह सकते हैं।
जब आप इन छोटे मॉडलों को मिलाते हैं, तो आप एक जटिल, उत्तरदायी वातावरण बनाते हैं। एक एजेंट डॉक्यूमेंट स्कैनिंग के लिए ऑप्टिकल कैरेक्टर रिकग्निशन (OCR) संभाल सकता है, जबकि दूसरा निकाले गए डेटा को उपयुक्त डेटाबेस फील्ड में भेज सकता है। मेरे सहयोगी उमुत बायराक ने इस विषय पर विस्तार से चर्चा की है, जहाँ उन्होंने मोबाइल हार्डवेयर आर्किटेक्चर में कुशल न्यूरल नेटवर्क और स्थानीय एजेंटों को एकीकृत करने के तकनीकी पहलुओं की खोज की है। लक्ष्य हमेशा उपयोगकर्ता के इरादे और पूरी की गई कार्रवाई के बीच की दूरी को कम करना होता है।
टिकाऊ इंफ्रास्ट्रक्चर के लिए सख्त प्रोडक्ट डिसिप्लिन की आवश्यकता
पारंपरिक क्लाउड-निर्भर आर्किटेक्चर से एज-फर्स्ट एआई फैक्ट्री में संक्रमण के लिए विकास में कठोर अनुशासन की आवश्यकता होती है। हर फीचर को अपनी कंप्यूटेशनल लागत को न्यायोचित सिद्ध करना चाहिए। ऐसे एप्लिकेशन बनाना आसान है जो बोर्डरूम प्रदर्शन में प्रभावशाली दिखते हैं, लेकिन सॉफ्टवेयर का मूल्यांकन यह देखने के लिए किया जाना चाहिए कि वह बारिश वाली मंगलवार की दोपहर में एक तनावपूर्ण शिफ्ट के दौरान कैसा प्रदर्शन करता है।
इन प्लेटफार्मों का चयन या विकास करते समय, तकनीकी नेताओं को एक सख्त मूल्यांकन ढांचा लागू करना चाहिए। सबसे पहले, ऑफलाइन क्षमता निर्धारित करें: इंटरनेट कनेक्शन के बिना एप्लिकेशन के मूल मूल्य प्रस्ताव का कितना प्रतिशत कार्य करता है? दूसरा, हार्डवेयर इलास्टिसिटी का मूल्यांकन करें: क्या एप्लिकेशन पुराने डिवाइसों पर अपनी प्रोसेसिंग तीव्रता को कम करता है और नए डिवाइसों की न्यूरल क्षमता को अधिकतम करता है? अंत में, वर्कफ़्लो एकीकरण का आकलन करें: क्या इंटेलिजेंस स्वाभाविक रूप से उपयोगकर्ता के मौजूदा रास्ते के भीतर बैठती है, या इसके लिए उन्हें एक अलग इंटरफ़ेस के साथ बातचीत करने के लिए अपनी वर्तमान स्क्रीन को छोड़ना पड़ता है?
इन आर्किटेक्चर में विशेषज्ञता रखने वाली एक सॉफ्टवेयर डेवलपमेंट फर्म के रूप में, NeuralApps में हमारा दर्शन इसी व्यावहारिक वास्तविकता पर आधारित है। हमारा मानना है कि अभिनव डिजिटल अनुभव इस बात से परिभाषित नहीं होते कि उनके अंतर्निहित एल्गोरिदम कितने जटिल हैं, बल्कि इस बात से परिभाषित होते हैं कि वे कितनी शांति से उपयोगकर्ता की समस्या को हल करते हैं। जब हम ऐसे सिस्टम बनाते हैं जो हार्डवेयर सीमाओं का सम्मान करते हैं, क्लाउड निर्भरता को कम करते हैं और स्थानीय निष्पादन को प्राथमिकता देते हैं, तो हम ऐसा सॉफ्टवेयर प्रदान करते हैं जो वास्तव में तब काम करता है जब उसकी सबसे अधिक आवश्यकता होती है।