उसे जितने तरह के डाटा मिलेंगे उन्ही से सीख कर इस तरह के प्लेटफोर्म के जवाबों की सटीकता बढ़ती जायेगी |चैट जी पी टी और ओपन ए आई के चैट जी पी टी की बढ़ती प्रतिस्पर्धा ने आंकड़ों के खेल को और ज्यादा दिलचस्प बना दिया है |ध्यान रहे कि भारत इंटरनेट का दुनिया का दूसरा सबसे बड़ा बाजार है |इसी बीच, गूगल ने अपनी गोपनीयता नीति में परिवर्तन किए हैं, जिससे यह स्पष्ट हो जाता है कि वह सब कुछ रख सकता है जो कुछ भी हम ऑनलाइन डालते हैं, ताकि वह अपनी कृत्रिम बुद्धिमत्ता (AI) प्रौद्योगिकियों को ज्यादा बेहतर तरीके से विकसित कर सके। इसका सीधा अर्थ है कि गूगल हर उस सामाग्री को पढ़ने में सक्षम है जो आपने गूगल के किसी उत्पाद पर पोस्ट की है , और वह सारी सामाग्री अब कंपनी की संपत्ति हैं और उन सारी सामाग्रियों को वह एक चैटबॉट को भी भेज रही है | संशोधित गूगल नीति में यह साफ़ बताया गया है कि "गूगल जानकारी का उपयोग अपनी सेवाओं को सुधारने और नए उत्पादों, सुविधाओं और प्रौद्योगिकियों को विकसित करने के लिए करता है जो उसके उपयोगकर्ताओं और सार्वजनिक कल्याण के लिए फायदेमंद होते हैं। यह नीति आगे बताती है कि वे (गूगल )सार्वजनिक रूप से उपलब्ध जानकारी का उपयोग एआई मॉडल्स को प्रशिक्षित करने और गूगल ट्रांसलेट, बार्ड और क्लाउड एआई क्षमताओं से लैस जैसे उत्पादों और सुविधाओं को बेहतर बनाने में मदद कर सकें |गूगल अपनी प्राइवेसी पॉलिसी को समय समय पर परिवर्तित करता रहता है|यह वाक्यांश स्पष्ट करता है कि इंटरनेट की दिग्गज कम्पनी के एआई सिस्टम अपनी पिछली नीति में संशोधन करते हुए आपके ऑनलाइन पोस्ट किये गए विचारों का उपयोग कर सकते हैं। यह नया वाक्यांश हमें बताता है कि पिछली नीति में जहाँ ऑनलाइन पोस्ट की गयी सामाग्री का उपयोग केवल गूगल अनुवाद, बार्ड और क्लाउड AI के लिए ही था लेकिन अब यह उल्लेख किया गया है कि डेटा का उपयोग AI मॉडल के बजाय भाषा मॉडल के लिए किया जाएगा। गोपनीयता नीति में यह प्रावधान थोड़े विचित्र है। आमतौर पर ये नीतियाँ बताती हैं कि कोई कंपनी आपके द्वारा ऑनलाइन पोस्ट किये गए डाटा का उपयोग कैसे करती है। पर इस मामले में ऐसा लगता है कि गूगल को सार्वजनिक रूप से उपलब्ध डाटा को इकट्ठा करने और उसका उपयोग कृत्रिम बुद्धिमत्ता (AI) परीक्षण क्षेत्र में करने का एकाधिकार मिला हुआ है |
यद्यपि नीति कई मामलों को स्पष्ट करती है, लेकिन यह कुछ रोचक सवाल भी उठाती है। जब हम इंटरनेट पर कुछ पोस्ट या लेखन करने के लिए सक्रिय होते हैं, , तो हम ये मानकर चलते हैं कि जो कुछ सार्वजनिक रूप से पोस्ट होता है, वही सार्वजनिक रूप से उपलब्ध भी होता है। लेकिन अब हमें यह भी समझना होगा कि प्रश्न केवल एक सार्वजनिक पोस्ट के बारे में नहीं है, बल्कि यह है कि ऑनलाइन कुछ भी लिखने का क्या अर्थ है। अब यह भी संभव है कि आपके द्वारा दस साल की उम्र में लिखी गई लंबे समय से भूला दी गयी कोई ब्लॉग पोस्ट या शायद आपके द्वारा दिए गए किसी रेस्टोरेंट की समीक्षा का इस्तेमाल भी बार्ड और चैट जीपीटी जैसे बड़े AI मॉडल भाषा मॉडल्स को विकसित करने में किया जा रहा हो |
अब यहाँ ये पश्न उठना भी लाजिमी है कि ये मॉडल अपनी जानकारी कहां से प्राप्त करते हैं। इसका जवाब ये है कि गूगल के बार्ड या ओपनएआई के चैटजीपीटी ने अपनी भाषा मॉडल्स को प्रशिक्षित करने के लिए इंटरनेट पर ऑनलाईन पोस्ट की गयी विशाल सामाग्री का इस्तेमाल किया है। लेकिन अभी भी स्पष्ट नहीं है कि ऐसी प्रक्रिया कानूनी है या नहीं, और इस सामाग्री पर कॉपी राईट किसका होगा |यहाँ एक और महत्वपूर्ण सवाल यह भी है कि कृत्रिम बुद्धिमत्ता (AI) प्रौद्योगिकी आधारित भाषा मोडल के सारे जवाब किसी न किसी साहित्यिक चोरी से निकले हैं |ऐसे बहुत से सारे सवालों के जवाब अभी दिए जाने हैं उम्मीद की जानी चाहिए कि व्यक्तिगत डेटा और निजता कानून में इन मुद्दों पर भी ध्यान दिया जाएगा |
अमर उजाला में 10/07/2023 को प्रकाशित
No comments:
Post a Comment