Google ने लॉन्च किया नया Gemini 3.1 TTS, 70+ भाषाओं को मिलेगा समर्थन
गूगल ने अपनी तकनीकी दिशा में एक नया कदम बढ़ाते हुए new Gemini 3.1 Flash TTS मॉडल लॉन्च किया है, जो टेक्स्ट को और अधिक natural आवाज में बदलने में सक्षम है। यह मॉडल डेवलपर्स और बिजनेस उपयोगकर्ताओं के लिए बनाया गया है, जो अपने ऐप्स और सेवाओं में अधिक वास्तविक AI आवाजें जोड़ना चाहते हैं। इसका सबसे बड़ा फायदा यह है कि यह 70 से अधिक languages को सपोर्ट करता है, जिससे वैश्विक उपयोग की संभावना बढ़ जाती है।
इस मॉडल की सबसे खास विशेषता उन्नत voice control क्षमता है। अब डेवलपर्स केवल टेक्स्ट के माध्यम से आवाज के टोन, गति और शैली को बदल सकते हैं। इसके साथ ही, स्पेशल ऑडियो टैग्स की मदद से आवाज में पॉज, जोर और बोलने के तरीके को precisely तरीके से नियंत्रित किया जा सकता है। इससे बिना जटिल सेटिंग्स के इंसानी जैसी आवाज तैयार करना संभव हो जाता है।
एक और महत्वपूर्ण अपडेट यह है कि इसमें multi-speaker समर्थन भी जोड़ा गया है। इसका अर्थ है कि एक ही सिस्टम में अलग-अलग आवाजों के साथ बातचीत या संवाद तैयार किया जा सकता है। हर आवाज की अपनी विशिष्ट पहचान और शैली हो सकती है, जिससे यह कहानी सुनाने, ग्राहक सहायता और कंटेंट निर्माण के लिए बेहद उपयोगी बन जाता है। इसके अलावा, ऑडियो की quality में भी काफी सुधार किया गया है।
सुरक्षा के मद्देनजर, गूगल ने इसमें SynthID नामक तकनीक शामिल की है, जो AI द्वारा उत्पन्न आवाजों में एक अदृश्य वॉटरमार्क जोड़ती है। इससे यह identify जा सकता है कि ऑडियो AI द्वारा बनाया गया है। फिलहाल, यह मॉडल प्रीव्यू मोड में है और डेवलपर्स Google AI Studio या Gemini API के माध्यम से इसका उपयोग कर सकते हैं। बिजनेस उपयोगकर्ता Vertex AI प्लेटफॉर्म पर इस तक पहुँच सकते हैं।
कंपनी के अनुसार, उपयोगकर्ताओं के feedback के आधार पर सुधार करने के बाद इसे जल्द ही वैश्विक स्तर पर सभी के लिए लॉन्च किया जाएगा। यह कदम न केवल तकनीकी innovation को बढ़ावा देता है, बल्कि बहुभाषी दुनिया में संचार की दूरियाँ कम करने में भी मदद कर सकता है।
70+ भाषाओं का support समर्थन वाकई बड़ी बात है। छोटे ऐप डेवलपर्स के लिए भी यह काफी फायदेमंद हो सकता है।
आवाज में जोर और पॉज को नियंत्रित करने की feature विशेषता बहुत दिलचस्प है। अब AI बोलते समय भावनाएँ भी दिखा पाएगा।
SynthID के बारे में अच्छा लगा। झूठे ऑडियो के जमाने में, trust भरोसा बनाए रखना जरूरी है।
इतनी साफ आवाज, पर क्या यह अभी भी बहुत robotic रोबोटिक लगती है? नेचुरल बोलचाल जैसा अभी तक मुश्किल लगता है।
अगर यह Vertex AI पर आ गया, तो बड़े बिजनेस के लिए तो game changer गेम चेंजर होगा। कस्टमर केयर बिल्कुल बदल जाएगा।
Google हर बार नया update अपडेट लाता है, पर क्या छोटे डेवलपर्स के लिए यह वाकई सस्ता होगा?