IIIT-HYDERABAD ने वीडियो प्रस्तुतियों में शोध पत्रों को बदलने के लिए SARAL AI को लॉन्च किया hindi

शिक्षाविदों, छात्रों और विश्लेषकों की सहायता के लिए डिज़ाइन किया गया, मंच दस्तावेजों को संक्षेप में प्रस्तुत करने के लिए मिथुन और क्लाउड जैसे मॉडल का उपयोग करता है, और वॉयसओवर उत्पन्न करने के लिए सरवम के पाठ-से-भाषण इंजन।

शिक्षाविदों, छात्रों और विश्लेषकों की सहायता के लिए डिज़ाइन किया गया, मंच दस्तावेजों को संक्षेप में प्रस्तुत करने के लिए मिथुन और क्लाउड जैसे मॉडल का उपयोग करता है, और वॉयसओवर उत्पन्न करने के लिए सरवम के पाठ-से-भाषण इंजन।

इंटरनेशनल इंस्टीट्यूट ऑफ इंफॉर्मेशन टेक्नोलॉजी (IIIT-HYDERABAD) के शोधकर्ताओं की एक टीम ने एक AI प्लेटफॉर्म, Saral AI विकसित किया है, जो शोध पत्रों को संक्षेपित वीडियो प्रस्तुतियों में बदल सकता है।

मंच शिक्षाविदों, छात्रों, शोधकर्ताओं और विश्लेषकों के लिए आसान होगा, जो पावरपॉइंट प्रस्तुतियों के निर्माण के लिए अनुसंधान और शैक्षणिक पत्रों से जानकारी निकालते हैं। यद्यपि एक वीडियो-आधारित प्रस्तुति भी पेश की जाती है, यह अभी भी अपने शुरुआती चरणों में है, जिसमें छवियों और एनीमेशन की कमी है।

नोटबुकलम से प्रेरित, उदार एआई के साथ बनाया गया

टीम का नेतृत्व करने वाले प्रो। पोनुरंगन कुमारगुरु ने कहा कि स्लाइड स्थिर हैं। उन्होंने कहा, “छवियों और वीडियो सहित संवर्द्धन का एक बड़ा दायरा है। पोस्टर का उत्पादन, शैक्षणिक दुनिया में एक सामान्य विशेषता, भी एक संभावना हो सकती है,” उन्होंने कहा।

उन्होंने कहा कि Google का नोटबुकल्म, जो दस्तावेजों को सारांशित करने में मदद करता है और ऑडियो वार्तालापों का उत्पादन करता है, टीम को उत्पाद विकसित करने में प्रेरित करता है।

टीम में लक्ष्मणन नटराज, राहुल सुंदर, इमांडी साई गणेश, अरिहंत रस्तोगी और विष्णु सतविक भी शामिल थे। “हम एक एप्लिकेशन बनाना चाहते थे जो स्वचालित रूप से अपने इनपुट के रूप में एक शोध पत्र लेगा और 11 भारतीय भाषाओं में स्लाइड के आधार पर 3-4 मिनट का संक्षिप्त वीडियो उत्पन्न करेगा,” उन्होंने कहा।

कागज संरचना के आधार पर अनुकूलन योग्य आउटपुट

प्लेटफ़ॉर्म सारांश उत्पन्न करने के लिए मिथुन और क्लाउड जैसे जेनेरिक एआई इंजनों का उपयोग करता है।

कुमारगुरु ने कहा कि एक बार स्क्रिप्ट स्लाइड प्रारूप में होने के बाद, सर्वाम के टेक्स्ट-टू-स्पीच इंजन का उपयोग वांछित आवाज (पुरुष या महिला) और भाषा में ऑडियो उत्पन्न करने के लिए किया जाता है।

समाधान के चारों ओर स्लाइड बनाने के लिए प्रासंगिक जानकारी को बाहर निकालता है – परिचय, कार्यप्रणाली, परिणाम, चर्चा और एक निष्कर्ष, किसी भी शोध पत्र में विशिष्ट सूचकांक आइटम। आउटपुट उपयोगकर्ता को प्रत्येक स्लाइड में बुलेट बिंदुओं को अनुकूलित करने की अनुमति देता है। उपयोगकर्ता, तब, एक वीडियो और ऑडियो (एक वॉयसओवर के साथ) बनाने के लिए आगे बढ़ सकते हैं।

आगे क्या

उन्होंने कहा कि सराल डोमेन नाम डेमोक्रेटिसरसर्च.इन के तहत विकसित पहले उपकरणों में से एक है। टीम एक ऐसे उपकरण पर विचार कर रही है जो उद्योग और वैज्ञानिक समुदाय के बीच की खाई को पाट सकता है, जिससे नए ज्ञान और पेटेंट के हस्तांतरण की सुविधा हो सकती है।

उन्होंने कहा कि एक मंच शोधकर्ताओं के बीच अंतर को कम करके बेहतर प्रौद्योगिकी हस्तांतरण की सुविधा प्रदान करेगा जो कागजात और एक उद्योग का उत्पादन करते हैं जो अक्सर इन प्रगति से अनजान होते हैं।

सराल टीम ने इसे बढ़ावा देने के लिए ‘शोध के लोकतंत्रीकरण’ की अवधारणा के आसपास हैकथॉन और प्रतियोगिताओं को व्यवस्थित करने का फैसला किया है।

Leave a comment