इंफोसिस लिमिटेड और टेक महिंद्रा लिमिटेड ग्राहकों को लागत बचाने में मदद करने के लिए अपने स्वयं के छोटे एआई मॉडल का निर्माण कर रहे हैं, जबकि टाटा कंसल्टेंसी सर्विसेज लिमिटेड, विप्रो लिमिटेड और एचसीएल टेक्नोलॉजीज लिमिटेड उन मूलभूत एआई उपकरणों का निर्माण करना चाहते हैं जो पहले से ही बाजार में मौजूद हैं।
एआई मॉडल का आकार उनमें फीड किए गए डेटा पर निर्भर करता है। छोटे एआई मॉडल को छोटे डेटा सेट पर प्रशिक्षित किया जाता है, जबकि बड़े मॉडल, जिन्हें बड़े भाषा मॉडल (एलएलएम) के रूप में जाना जाता है, को बड़ी मात्रा में डेटा पर प्रशिक्षित किया जाता है। चूंकि छोटे भाषा मॉडल (एसएलएम) को कम डेटा पर प्रशिक्षित किया जाता है, वे बड़े एआई टूल की तुलना में कम लेकिन अधिक विशिष्ट कार्य कर सकते हैं।
अधिकांश कंपनियां आंतरिक डेटा सेट पर भरोसा करती हैं जो उनके लिए आसानी से उपलब्ध होते हैं, जिससे उन्हें छोटे मॉडल बनाने में मदद मिलती है। भारत की दूसरी सबसे बड़ी सॉफ्टवेयर सेवा प्रदाता इंफोसिस, जिसने पिछले वित्त वर्ष में 18.6 अरब डॉलर के राजस्व के साथ समापन किया था, अपने ग्राहकों को सेवा देने के लिए छोटे भाषा मॉडल का निर्माण कर रही है।
यह भी पढ़ें | चार्ट में: भारत के आईटी दिग्गजों ने अपनी सबसे कमजोर तिमाही में कैसा प्रदर्शन किया
16 जनवरी को कंपनी की कमाई के बाद की प्रेस कॉन्फ्रेंस में मुख्य कार्यकारी सलिल पारेख ने कहा, “जेनरेटिव एआई में, हमने बैंकिंग, आईटी संचालन, साइबर सुरक्षा और मोटे तौर पर उद्यमों के लिए चार छोटे भाषा मॉडल बनाए हैं।”
बेंगलुरु स्थित कंपनी के प्रबंधन ने पहली बार पिछले साल अक्टूबर में अपनी दूसरी तिमाही के नतीजों के बाद मीडिया के साथ कंपनी की कमाई के बाद की बातचीत में इस विकास का उल्लेख किया था।
“हम मानते हैं कि छोटे भाषा मॉडल का कारण, हमारे पास इंफोसिस के भीतर कुछ बहुत अच्छे डेटा सेट हैं। और हम कुछ ले रहे हैं, मान लीजिए हम इसे उद्योग के बाहर से स्वच्छ डेटा सेट इत्यादि कहते हैं। इसके बाद ये छोटे भाषा मॉडल को प्रशिक्षित करने में मदद करते हैं,” 17 अक्टूबर 2024 को विश्लेषकों के साथ कॉन्फ्रेंस कॉल के दौरान एक सवाल के जवाब में पारेख ने कहा।
एक महीने से भी कम समय के बाद इंफोसिस के अध्यक्ष नंदन नीलेकणि ने अपनी टिप्पणियों का समर्थन किया।
“बहुत विशिष्ट डेटा पर प्रशिक्षित छोटे भाषा मॉडल वास्तव में काफी प्रभावी हैं। . . 27 नवंबर 2024 को प्रकाशित फाइनेंशियल टाइम्स के साथ एक साक्षात्कार में नीलेकणि ने कहा, हर कोई मॉडल बनाएगा, लेकिन मुझे लगता है कि उन्हें इतने विशाल मॉडल बनाने की ज़रूरत नहीं है।
यह भी पढ़ें | Q3 भारत के सबसे बड़े आईटी सेवा प्रदाताओं के लिए डील चक्र, कार्यकाल पर ध्यान केंद्रित करता है
नीलेकणि ने कहा कि उन्हें “इस बात पर यकीन नहीं” था कि कंपनियां ओपनएआई के चैटजीपीटी जैसे लोकप्रिय अनुप्रयोगों के पीछे उच्च लागत, डेटा के संभावित “ब्लैक बॉक्स” और बड़े भाषा मॉडल से जुड़ी कॉपीराइट देनदारियों को वहन करना चाहेंगी।
एसएलएम बैंडवैगन पर चढ़ने के लिए तीसरी तिमाही में इंफोसिस छोटे प्रतिद्वंद्वी टेक महिंद्रा से जुड़ गई।
17 जनवरी को विश्लेषकों के साथ कंपनी की कमाई के बाद की कॉल में टेक महिंद्रा के मुख्य कार्यकारी मोहित जोशी ने कहा, “तब से हम इन एलएलएम से छोटे भाषा मॉडल और छोटे भाषा मॉडल बनाने की ओर बढ़ गए हैं।” “ग्राहक वास्तव में इनकी प्रासंगिकता पाते हैं।” छोटे उपयोग के मामलों में मॉडल। वे (छोटी भाषा मॉडल) ग्राहकों को बहुत अधिक गणना या कार्बन का उपयोग किए बिना काफी विशिष्ट समस्याओं को हल करने की अनुमति देते हैं।”
भारत के पांचवें सबसे बड़े सॉफ्टवेयर सेवा प्रदाता, टेक महिंद्रा ने पिछले वित्त वर्ष में पूरे साल के राजस्व में 6.3 बिलियन डॉलर के साथ समाप्त किया, जो कि इंफोसिस की रिपोर्ट का एक तिहाई था।
यह भी पढ़ें | भारतीय आईटी के शीर्ष 5 इस वित्तीय वर्ष का अंत पिछले वित्तीय वर्ष से थोड़ा बेहतर हो सकता है
एक उदाहरण का हवाला देते हुए, जोशी ने कहा कि छोटा भाषा मॉडल चैटजीपीटी जैसे बाहरी एजेंट पर भरोसा किए बिना किसी कार्यकारी के डेस्कटॉप पर खोज कार्यक्षमता का पता लगा सकता है।
देश की सबसे बड़ी सॉफ्टवेयर सेवा कंपनी टाटा कंसल्टेंसी सर्विसेज ने विजडमनेक्स्ट नाम से अपना खुद का जेन एआई मॉडल बनाया है, जिसे उसने पिछले साल जून में लॉन्च किया था। फिर भी कंपनी ने इसे बड़ा या छोटा मॉडल नहीं बताया है।
नाम न छापने की शर्त पर इसके एक अधिकारी ने कहा कि बड़े भाषा मॉडल डेटा सुरक्षा के लिए जोखिम पैदा करते हैं।
“बड़े एआई मॉडल का उपयोग करने में सबसे बड़ी समस्या यह है कि इससे डेटा सुरक्षा संबंधी समस्याएं पैदा होती हैं। यदि कंपनी एलएलएम में संवेदनशील डेटा फीड कर रही है, तो इसके किसी तीसरे पक्ष द्वारा लीक होने की बहुत अधिक संभावना है, “टीसीएस के एक वरिष्ठ अधिकारी ने नाम न छापने की शर्त पर कहा।
अधिकारी ने कहा, “यही कारण है कि ग्राहक छोटे इन-हाउस एआई मॉडल पसंद करते हैं क्योंकि ये बड़े मॉडलों की तुलना में काफी सस्ते होते हैं और इन-हाउस बनाए जाते हैं ताकि डेटा सुरक्षित रहे।”
जेएम फाइनेंशियल के विश्लेषक अभिषेक कुमार के अनुसार, ग्राहक विशिष्ट समस्याओं के लिए छोटे भाषा मॉडल चाहते हैं। उन्होंने कहा, “एसएलएम को कुछ मिलियन से कुछ अरब मापदंडों पर प्रशिक्षित किया जाता है और उपयोग के मामलों के लिए अनुकूलित किया जा सकता है,” उन्होंने कहा, एलएलएम को सैकड़ों अरब मापदंडों पर प्रशिक्षित किया जाता है। “यहां तक कि इन छोटे मॉडलों के लिए परीक्षण और कंप्यूटिंग की कीमत भी बड़े AI मॉडल की तुलना में सस्ता।”
यह भी पढ़ें | मिंट प्राइमर: क्या होगा यदि चैटजीपीटी का एआई खोज इंजन उपयोगकर्ताओं के साथ क्लिक करता है?
आईबीएम रिसर्च एआई के उपाध्यक्ष श्रीराम राघवन ने पहले समझाया था, “वे (छोटी भाषा मॉडल) महत्वपूर्ण हैं क्योंकि एआई के लिए हार्डवेयर आवश्यकताएं ग्राहकों के लिए सबसे बड़े लागत बिंदुओं में से एक हैं, इसलिए छोटे मॉडल और उद्देश्य के लिए फिट मॉडल अनुमति देते हैं फिर आप निवेश का रिटर्न अधिक प्रभावी ढंग से निकाल सकेंगे।”
राघवन के साथ बातचीत में पुदीना पिछले साल, यह जोड़ा गया था कि छोटे भाषा मॉडल ग्राहकों को किसी विशिष्ट उपयोग के मामले में उनकी लागत को 50 गुना तक बचाने में मदद कर सकते हैं। “मेरा कहना यह है कि हम बचत में 5%, 10% की बात नहीं कर रहे हैं, हम वास्तविक अंतर के क्रम की बात कर रहे हैं।”
अभी के लिए, देश के सबसे बड़े सॉफ्टवेयर सेवा प्रदाताओं में से कोई भी जनरल एआई से राजस्व नहीं मांगता है, जिसने नवंबर 2022 में चैटजीपीटी के लॉन्च के बाद तेजी हासिल की है। जनरल एआई अपनी मानव-जैसी क्षमताओं के लिए जाना जाता है, विशेष रूप से ऑडियो, विजुअल और सामग्री उत्पादन में लिखित रूप.
इसके विपरीत, एक्सेंचर पीएलसी, जो दुनिया की सबसे बड़ी सॉफ्टवेयर सेवा कंपनी है, ने पिछले वित्तीय वर्ष में जनरल एआई राजस्व में $900 मिलियन की सूचना दी। नई तकनीक से इसका राजस्व $64.9 बिलियन के कुल राजस्व का 1.4% था।
और पढ़ें | भारत के जेनेरिक एआई स्टार्टअप चैटजीपीटी जैसे मॉडल बनाने से परे हैं
Source link