Google ने लॉन्च किया नया Gemini 3.1 TTS, 70+ भाषाओं को मिलेगा समर्थन

गूगल ने अपनी तकनीकी दिशा में एक नया कदम बढ़ाते हुए new Gemini 3.1 Flash TTS मॉडल लॉन्च किया है, जो टेक्स्ट को और अधिक natural आवाज में बदलने में सक्षम है। यह मॉडल डेवलपर्स और बिजनेस उपयोगकर्ताओं के लिए बनाया गया है, जो अपने ऐप्स और सेवाओं में अधिक वास्तविक AI आवाजें जोड़ना चाहते हैं। इसका सबसे बड़ा फायदा यह है कि यह 70 से अधिक languages को सपोर्ट करता है, जिससे वैश्विक उपयोग की संभावना बढ़ जाती है।

इस मॉडल की सबसे खास विशेषता उन्नत voice control क्षमता है। अब डेवलपर्स केवल टेक्स्ट के माध्यम से आवाज के टोन, गति और शैली को बदल सकते हैं। इसके साथ ही, स्पेशल ऑडियो टैग्स की मदद से आवाज में पॉज, जोर और बोलने के तरीके को precisely तरीके से नियंत्रित किया जा सकता है। इससे बिना जटिल सेटिंग्स के इंसानी जैसी आवाज तैयार करना संभव हो जाता है।

एक और महत्वपूर्ण अपडेट यह है कि इसमें multi-speaker समर्थन भी जोड़ा गया है। इसका अर्थ है कि एक ही सिस्टम में अलग-अलग आवाजों के साथ बातचीत या संवाद तैयार किया जा सकता है। हर आवाज की अपनी विशिष्ट पहचान और शैली हो सकती है, जिससे यह कहानी सुनाने, ग्राहक सहायता और कंटेंट निर्माण के लिए बेहद उपयोगी बन जाता है। इसके अलावा, ऑडियो की quality में भी काफी सुधार किया गया है।

सुरक्षा के मद्देनजर, गूगल ने इसमें SynthID नामक तकनीक शामिल की है, जो AI द्वारा उत्पन्न आवाजों में एक अदृश्य वॉटरमार्क जोड़ती है। इससे यह identify जा सकता है कि ऑडियो AI द्वारा बनाया गया है। फिलहाल, यह मॉडल प्रीव्यू मोड में है और डेवलपर्स Google AI Studio या Gemini API के माध्यम से इसका उपयोग कर सकते हैं। बिजनेस उपयोगकर्ता Vertex AI प्लेटफॉर्म पर इस तक पहुँच सकते हैं।

कंपनी के अनुसार, उपयोगकर्ताओं के feedback के आधार पर सुधार करने के बाद इसे जल्द ही वैश्विक स्तर पर सभी के लिए लॉन्च किया जाएगा। यह कदम न केवल तकनीकी innovation को बढ़ावा देता है, बल्कि बहुभाषी दुनिया में संचार की दूरियाँ कम करने में भी मदद कर सकता है।

प्रतिक्रियाएँ 6

  • राहुल_जी

    70+ भाषाओं का support वाकई बड़ी बात है। छोटे ऐप डेवलपर्स के लिए भी यह काफी फायदेमंद हो सकता है।

  • सोनम_पाटिल

    आवाज में जोर और पॉज को नियंत्रित करने की feature बहुत दिलचस्प है। अब AI बोलते समय भावनाएँ भी दिखा पाएगा।

  • विकास_एम

    SynthID के बारे में अच्छा लगा। झूठे ऑडियो के जमाने में, trust बनाए रखना जरूरी है।

  • नीरज_डी

    इतनी साफ आवाज, पर क्या यह अभी भी बहुत robotic लगती है? नेचुरल बोलचाल जैसा अभी तक मुश्किल लगता है।

  • प्रिया_शर्मा

    अगर यह Vertex AI पर आ गया, तो बड़े बिजनेस के लिए तो game changer होगा। कस्टमर केयर बिल्कुल बदल जाएगा।

  • अमित_कुमार

    Google हर बार नया update लाता है, पर क्या छोटे डेवलपर्स के लिए यह वाकई सस्ता होगा?

यह लेख तथ्यों पर आधारित है और अंग्रेज़ी सीखने के लिए पुनर्रचित किया गया है; पाठक प्रतिक्रियाएँ विविध दृष्टिकोणों के उदाहरण हैं।

[email protected]