पूर्व Google और Apple शोधकर्ताओं ने AI के मिसिंग फीडबैक लूप के निर्माण के लिए एक स्टार्टअप लॉन्च किया

Google DeepMind, Apple, OpenAI और Meta Superintelligence Labs में काम कर चुके AI शोधकर्ताओं के एक समूह ने बुधवार को घोषणा की कि वे ट्रैजेक्टरी नामक एक नया स्टार्टअप लॉन्च कर रहे हैं, जिसका उद्देश्य कंपनियों को वास्तविक दुनिया के उपयोगकर्ता इंटरैक्शन पर प्रशिक्षण देकर अपने AI उत्पादों को नियमित रूप से बेहतर बनाने में मदद करना है।

ट्रैजेक्टरी एआई के लिए एक ऐसा मंच बनाना चाहता है जो लगातार सीख सके, एक ऐसी क्षमता जिसे शोधकर्ताओं ने लंबे समय से एआई की प्रगति में एक बड़ी बाधा के रूप में माना है। ओपनएआई, गूगल और एंथ्रोपिक ने विशेष रूप से कोडिंग, गणित और विज्ञान जैसे डोमेन के लिए एआई मॉडल के तेजी से सक्षम संस्करणों को प्रशिक्षित करने में सफलता पाई है। हालाँकि, प्रशिक्षण पूरा होने के बाद ये प्रणालियाँ स्मार्ट होना बंद कर देती हैं। जबकि निरंतर सीखने में हाल ही में कुछ सफलताएँ हुई हैं, तकनीकी कंपनियों को आम तौर पर एआई उत्पाद बनाने के लिए संघर्ष करना पड़ा है जो वास्तविक समय में उनकी त्रुटियों से सीखते हैं। दिसंबर 2025 में, सबसे बड़े वार्षिक एआई अनुसंधान सम्मेलनों में से एक, न्यूरआईपीएस में, ट्यूरिंग पुरस्कार विजेता रिचर्ड सटन ने तर्क दिया कि सुपरइंटेलिजेंट एजेंटों के निर्माण के लिए निरंतर सीखना आवश्यक है।

बेसेमर वेंचर पार्टनर्स, रेडिकल वीसी और बॉक्सग्रुप की भागीदारी के साथ, वेंचर कैपिटल फर्म कन्विक्शन के नेतृत्व में ट्रैजेक्टरी ने $115 मिलियन पोस्ट-मनी वैल्यूएशन पर $15 मिलियन का सीड राउंड जुटाया है। व्यक्तिगत निवेशकों ने भी इस दौर में भाग लिया, जिसमें Google डीपमाइंड के मुख्य वैज्ञानिक, जेफ डीन, साथ ही तथाकथित “एआई की गॉडमदर”, स्टैनफोर्ड प्रोफेसर और वर्ल्ड लैब्स के सीईओ फी-फी ली भी शामिल थे।

ट्रैजेक्टरी के सीईओ और सह-संस्थापक रोनक मालदे पहले विंडसर्फ में एआई शोधकर्ता थे, और बाद में वह उन मुट्ठी भर कर्मचारियों में से एक बन गए, जो Google डीपमाइंड में काम करने गए थे, जब पिछले साल 2.4 बिलियन डॉलर के सौदे में कोडिंग स्टार्टअप की शीर्ष प्रतिभा को काम पर रखा गया था। ट्रैजेक्टरी के अन्य सह-संस्थापकों में ऐप्पल के पूर्व एआई शोधकर्ता अर्जुन करणम शामिल हैं, जिन्होंने विज़न प्रो पर काम किया था, और माइकल एलाबड, जो पहले Google डीपमाइंड के रोबोटिक्स डिवीजन में काम करते थे।

माल्दे ने WIRED को बताया कि कुछ प्रमुख एआई कोडिंग उत्पाद, जैसे कि कर्सर, पहले से ही निरंतर सीखने का एक प्रारंभिक संस्करण कर रहे हैं – प्रशिक्षण के बाद और नियमित रूप से मॉडल सुधार भेजने के लिए लोग अपने उत्पादों के साथ कैसे बातचीत करते हैं, इसके बारे में वास्तविक डेटा का उपयोग कर रहे हैं। उनका तर्क है कि यह एक मुख्य कारण है कि एआई कोडिंग उत्पादों ने इतनी तेजी से लोकप्रियता हासिल की है, और यही कारण है कि प्रमुख एआई प्रयोगशालाएं अपने स्वयं के वाइब कोडिंग अनुप्रयोगों को विकसित करने के लिए दौड़ पड़ी हैं। ट्रैजेक्टरी के साथ, माल्दे और उनकी 11 शोधकर्ताओं और इंजीनियरों की टीम कोडिंग स्पेस के बाहर एआई-संचालित टूल को बेहतर बनाने के लिए एक समान तकनीक लागू करने की उम्मीद करती है।

माल्दे कहते हैं, “आज भी सबसे शक्तिशाली एआई अभी भी स्थिर है। जिस एआई मॉडल का आपने कल उपयोग किया था, वह आज भी वही गलतियाँ करने जा रहा है।” “कुछ कंपनियाँ निरंतर सीखने की उस दुनिया में जाना शुरू कर रही हैं। हम जो कर रहे हैं वह हर एक कंपनी के लिए निरंतर सीखने के लिए मंच का निर्माण कर रहा है।”

इस तर्क को अन्य डोमेन पर लागू करने में चुनौती यह है कि कोडिंग को आसानी से सत्यापित किया जा सकता है – कोड या तो चलता है या नहीं चलता है – लेकिन कुछ उद्योगों में सफलता की कमजोर परिभाषाएँ हैं। करनम का कहना है कि ट्रैजेक्टरी का प्लेटफ़ॉर्म जो पेशकश करता है उसका एक हिस्सा व्यवसाय की विशिष्ट आवश्यकताओं के लिए एआई मॉडल को अनुकूलित करने में मदद करना है।

ओपनएआई या एंथ्रोपिक के ऑफ-द-शेल्फ मॉडल से शुरू करने के बजाय, ट्रैजेक्टरी के ग्राहक एक ओपन-सोर्स मॉडल से शुरुआत करते हैं जिसे कंपनी के दिमाग में एक विशिष्ट एआई उत्पाद के लिए पोस्ट-प्रशिक्षित किया गया है। डेकागन के लिए, एक ग्राहक जो एआई ग्राहक सहायता एजेंटों का निर्माण करता है, ट्रैजेक्टरी तब लॉग करता है जब उसका एआई कम हो जाता है – मान लीजिए, रिटर्न करने की कोशिश करने वाले ग्राहक को उनकी क्वेरी एक मानव के पास बाउंस हो जाती है – और उन उदाहरणों का उपयोग हर हफ्ते एक नए मॉडल को पोस्ट-ट्रेन करने के लिए करता है। ट्रैजेक्टरी का दावा है कि ये पोस्ट-प्रशिक्षित मॉडल सीमित कार्यों में फ्रंटियर लैब के मॉडल को मात देते हैं जो किसी कंपनी के उत्पाद के लिए सबसे ज्यादा मायने रखते हैं।

पूर्व Google और Apple शोधकर्ताओं ने AI के मिसिंग फीडबैक लूप के निर्माण के लिए एक स्टार्टअप लॉन्च किया

BySapna Rastogi

By Sapna Rastogi

Related Post

ईबे को अपने निर्बाध उत्पीड़न अभियान के निपटान के लिए $55.7 मिलियन का भुगतान करना होगा

क्या न्यूयॉर्क टाइम्स पत्रकारिता को हमारे एआई अधिपतियों से बचा सकता है?

‘यह एक आधुनिक समय का मसौदा है’: क्यों स्टैनफोर्ड के छात्र सुंदर पिचाई के प्रारंभिक भाषण पर बाहर चले गए

Leave a Reply Cancel reply

You missed

ईबे को अपने निर्बाध उत्पीड़न अभियान के निपटान के लिए $55.7 मिलियन का भुगतान करना होगा

हांगकांग के आभूषण कलाकार वालेस चैन अपनी ‘वेसल्स ऑफ अदर वर्ल्ड्स’ प्रदर्शनी वेनिस से शंघाई लेकर आए हैं

सिलिकॉन वैली का अगला आईपीओ अरबपति आ रहे हैं। गैर-लाभकारी संस्थाएँ उनके लिए तैयार हैं

क्या न्यूयॉर्क टाइम्स पत्रकारिता को हमारे एआई अधिपतियों से बचा सकता है?