Google DeepMind, Apple, OpenAI और Meta Superintelligence Labs में काम कर चुके AI शोधकर्ताओं के एक समूह ने बुधवार को घोषणा की कि वे ट्रैजेक्टरी नामक एक नया स्टार्टअप लॉन्च कर रहे हैं, जिसका उद्देश्य कंपनियों को वास्तविक दुनिया के उपयोगकर्ता इंटरैक्शन पर प्रशिक्षण देकर अपने AI उत्पादों को नियमित रूप से बेहतर बनाने में मदद करना है।
ट्रैजेक्टरी एआई के लिए एक ऐसा मंच बनाना चाहता है जो लगातार सीख सके, एक ऐसी क्षमता जिसे शोधकर्ताओं ने लंबे समय से एआई की प्रगति में एक बड़ी बाधा के रूप में माना है। ओपनएआई, गूगल और एंथ्रोपिक ने विशेष रूप से कोडिंग, गणित और विज्ञान जैसे डोमेन के लिए एआई मॉडल के तेजी से सक्षम संस्करणों को प्रशिक्षित करने में सफलता पाई है। हालाँकि, प्रशिक्षण पूरा होने के बाद ये प्रणालियाँ स्मार्ट होना बंद कर देती हैं। जबकि निरंतर सीखने में हाल ही में कुछ सफलताएँ हुई हैं, तकनीकी कंपनियों को आम तौर पर एआई उत्पाद बनाने के लिए संघर्ष करना पड़ा है जो वास्तविक समय में उनकी त्रुटियों से सीखते हैं। दिसंबर 2025 में, सबसे बड़े वार्षिक एआई अनुसंधान सम्मेलनों में से एक, न्यूरआईपीएस में, ट्यूरिंग पुरस्कार विजेता रिचर्ड सटन ने तर्क दिया कि सुपरइंटेलिजेंट एजेंटों के निर्माण के लिए निरंतर सीखना आवश्यक है।
बेसेमर वेंचर पार्टनर्स, रेडिकल वीसी और बॉक्सग्रुप की भागीदारी के साथ, वेंचर कैपिटल फर्म कन्विक्शन के नेतृत्व में ट्रैजेक्टरी ने $115 मिलियन पोस्ट-मनी वैल्यूएशन पर $15 मिलियन का सीड राउंड जुटाया है। व्यक्तिगत निवेशकों ने भी इस दौर में भाग लिया, जिसमें Google डीपमाइंड के मुख्य वैज्ञानिक, जेफ डीन, साथ ही तथाकथित “एआई की गॉडमदर”, स्टैनफोर्ड प्रोफेसर और वर्ल्ड लैब्स के सीईओ फी-फी ली भी शामिल थे।
ट्रैजेक्टरी के सीईओ और सह-संस्थापक रोनक मालदे पहले विंडसर्फ में एआई शोधकर्ता थे, और बाद में वह उन मुट्ठी भर कर्मचारियों में से एक बन गए, जो Google डीपमाइंड में काम करने गए थे, जब पिछले साल 2.4 बिलियन डॉलर के सौदे में कोडिंग स्टार्टअप की शीर्ष प्रतिभा को काम पर रखा गया था। ट्रैजेक्टरी के अन्य सह-संस्थापकों में ऐप्पल के पूर्व एआई शोधकर्ता अर्जुन करणम शामिल हैं, जिन्होंने विज़न प्रो पर काम किया था, और माइकल एलाबड, जो पहले Google डीपमाइंड के रोबोटिक्स डिवीजन में काम करते थे।
माल्दे ने WIRED को बताया कि कुछ प्रमुख एआई कोडिंग उत्पाद, जैसे कि कर्सर, पहले से ही निरंतर सीखने का एक प्रारंभिक संस्करण कर रहे हैं – प्रशिक्षण के बाद और नियमित रूप से मॉडल सुधार भेजने के लिए लोग अपने उत्पादों के साथ कैसे बातचीत करते हैं, इसके बारे में वास्तविक डेटा का उपयोग कर रहे हैं। उनका तर्क है कि यह एक मुख्य कारण है कि एआई कोडिंग उत्पादों ने इतनी तेजी से लोकप्रियता हासिल की है, और यही कारण है कि प्रमुख एआई प्रयोगशालाएं अपने स्वयं के वाइब कोडिंग अनुप्रयोगों को विकसित करने के लिए दौड़ पड़ी हैं। ट्रैजेक्टरी के साथ, माल्दे और उनकी 11 शोधकर्ताओं और इंजीनियरों की टीम कोडिंग स्पेस के बाहर एआई-संचालित टूल को बेहतर बनाने के लिए एक समान तकनीक लागू करने की उम्मीद करती है।
माल्दे कहते हैं, “आज भी सबसे शक्तिशाली एआई अभी भी स्थिर है। जिस एआई मॉडल का आपने कल उपयोग किया था, वह आज भी वही गलतियाँ करने जा रहा है।” “कुछ कंपनियाँ निरंतर सीखने की उस दुनिया में जाना शुरू कर रही हैं। हम जो कर रहे हैं वह हर एक कंपनी के लिए निरंतर सीखने के लिए मंच का निर्माण कर रहा है।”
इस तर्क को अन्य डोमेन पर लागू करने में चुनौती यह है कि कोडिंग को आसानी से सत्यापित किया जा सकता है – कोड या तो चलता है या नहीं चलता है – लेकिन कुछ उद्योगों में सफलता की कमजोर परिभाषाएँ हैं। करनम का कहना है कि ट्रैजेक्टरी का प्लेटफ़ॉर्म जो पेशकश करता है उसका एक हिस्सा व्यवसाय की विशिष्ट आवश्यकताओं के लिए एआई मॉडल को अनुकूलित करने में मदद करना है।
ओपनएआई या एंथ्रोपिक के ऑफ-द-शेल्फ मॉडल से शुरू करने के बजाय, ट्रैजेक्टरी के ग्राहक एक ओपन-सोर्स मॉडल से शुरुआत करते हैं जिसे कंपनी के दिमाग में एक विशिष्ट एआई उत्पाद के लिए पोस्ट-प्रशिक्षित किया गया है। डेकागन के लिए, एक ग्राहक जो एआई ग्राहक सहायता एजेंटों का निर्माण करता है, ट्रैजेक्टरी तब लॉग करता है जब उसका एआई कम हो जाता है – मान लीजिए, रिटर्न करने की कोशिश करने वाले ग्राहक को उनकी क्वेरी एक मानव के पास बाउंस हो जाती है – और उन उदाहरणों का उपयोग हर हफ्ते एक नए मॉडल को पोस्ट-ट्रेन करने के लिए करता है। ट्रैजेक्टरी का दावा है कि ये पोस्ट-प्रशिक्षित मॉडल सीमित कार्यों में फ्रंटियर लैब के मॉडल को मात देते हैं जो किसी कंपनी के उत्पाद के लिए सबसे ज्यादा मायने रखते हैं।