सारांश

Encyclopedia Britannica और शब्दकोश प्रकाशक Merriam-Webster ने OpenAI के खिलाफ मुकदमा दायर किया है। उनके अनुसार OpenAI ने उनकी कॉपीराइट वाली कंटेंट को AI प्रशिक्षण के लिए बिना अनुमति उपयोग किया और GPT-4 कभी-कभी बहुत हद तक उन्हीं शब्दों को दुहरा देता है। यह निर्माता और प्रकाशक के बीच बढ़ती कानूनी लड़ाई का नया मोड़ है।

क्या आरोप हैं?

मुख्य आरोप यह है कि OpenAI ने Britannica और Merriam-Webster की सामग्री को बार-बार कॉपी किया और उसे अपने मॉडल्स को प्रशिक्षित करने में इस्तेमाल किया। मुकदमे में कहा गया है कि GPT-4 ने कई बार ऐसा आउटपुट दिया जो मूल लेख के बहुत करीब था, यानी शब्दशः मिलते-जुलते अंश उत्पन्न हुए।

कॉर्पोरेट दावा ये भी है कि ये "याद किए गए" उदाहरण अनधिकृत प्रतियां हैं जिन्हें OpenAI ने अपने मॉडल को सिखाने के लिए इस्तेमाल किया।

मुकदमे में क्या सबूत दिए गए हैं?

शिकायत में OpenAI के मॉडल्स के जवाब और Britannica के मूल टेक्स्ट को साथ रखा गया है। मुकदमे का कहना है कि कई मामलों में पूरी पंक्तियाँ एक जैसी लगती हैं। इसके अलावा Britannica का आरोप है कि OpenAI ऐसे उत्तर दे कर उनके वेब ट्रैफिक को कम कर रहा है क्योंकि यूजर सीधे जवाब ले लेते हैं और पारंपरिक सर्च की तरह वेबसाइट पर नहीं आते।

यह अकेला मामला नहीं है

यह मामला उन अनेक कॉपीराइट मुकदमों में से नया है जो कुछ सालों से AI कंपनियों के खिलाफ दाखिल हो रहे हैं।

  • The New York Times का भी OpenAI के खिलाफ एक लंबित मुकदमा है जिसमें वे बड़े पैमाने पर अपनी कॉपीराइट सामग्री की नकल होने का आरोप लगा रहे हैं।
  • Anthropic ने पहले ही कुछ किताबों के लेखकों के साथ वर्गीय समझौता किया था और उस समझौते की रकम 1.5 अरब डॉलर बताई गई थी।

असर और आगे क्या हो सकता है

यह मुकदमा कई अहम सवाल उठाता है: क्या AI मॉडल्स को सार्वजनिक वेब से सामग्री सीखने की पूरी छूट होनी चाहिए? अगर नहीं, तो अनुमति और मुआवजे के कौन से नए नियम बनेंगे? अदालत के फैसले से यह साफ होगा कि भविष्य में AI प्रशिक्षण और प्रकाशक अधिकारों के बीच संतुलन किस तरह तय होगा।

सरल शब्दों में, यह मामला बताता है कि टेक्नोलॉजी के तेजी से बदलते रास्ते और पारंपरिक सामग्री के अधिकारों के बीच तनातनी अब कानूनी मंच पर अधिक साफ़ तौर पर दिखाई दे रही है।