উইকিপিডিয়া কি ধ্বংস হয়ে যাবে! না এআইকে নির্ভুল তথ্য প্রদান করে টিকে থাকবে?
প্রশ্নের ধরনের কারণে চ্যাটবটগুলো বিভ্রান্ত হতে পারে। যদি প্রশ্ন করা হয়, প্রথম চন্দ্র অভিযানে কোন পাঁচজন ব্যক্তি চন্দ্রপৃষ্ঠে পা রাখেন? তখন চ্যাটবট চাইবে পাঁচজনের নামই খুঁজে বের করতে। অথচ ১৯৬৯ সালে কেবল দুইজন চাঁদে পা রাখেন। এসব ক্ষেত্রে চ্যাটজিপিটি দ্বিধায় থাকলে উইকিপিডিয়ার এই সংক্রান্ত লিঙ্ক যুক্ত করে দিতে পারে। এতে নির্ভুল তথ্য প্রদান সম্ভব হবে।
প্রযুক্তির জগতে অনেক কিছুই বদলে দিয়েছে চ্যাটজিপিটির মতো জেনারেটিভ এআই। কৃত্রিম বুদ্ধিমত্তা রাতারাতি বিপ্লব এনেছে কন্টেন্ট তৈরিতে। কয়েক শব্দ বসিয়ে নির্দেশনা দিলেই মুহূর্তে এখন গল্প লেখা সম্ভব, ছবি সম্পদনা হয়ে যাচ্ছে নিমিষেই। কোন কিছু জানতে চাইলেই এসে যাচ্ছে উত্তর। লেখায় ভাষাগত সৌন্দর্য্য আনতেও অনেকে ব্যবহার করছেন এআই।
তথ্য প্রাপ্তী যেহেতু এতই সহজলভ্য, তাহলে প্রশ্ন আসতেই পারে যে, উইকিপিডিয়ার মতো অনলাইন বিশ্বকোষগুলোর অস্বিস্ত থাকবে তো? এই প্রশ্নের উত্তর খুঁজতে যেতে হবে অনেক গভীরে। প্রথমেই জানতে হবে আসলে কীভাবে কাজ করে এআই। এ যে চট করেই মিলে যায় জবাব, তথ্যগুলো আসে কোথা থেকে? উইকিপিডিয়ার মতো প্লাটফর্ম তাদের জন্য কতটা জরুরী। কেনই বা মানব সৃষ্ট তথ্যের সংকট প্রশ্ন তুলছে এআই-এর নির্ভরযোগ্যতা নিয়ে? উইকিপিডিয়া কি পারবে এআই চ্যাটবটকে নির্ভুল তথ্যপ্রদান শিখিয়ে একই সঙ্গে নিজেও টিকে থাকতে? সমস্ত বিষয়গুলোই খতিয়ে দেখা হয়েছে এই প্রতিবেদনে।
উইকিপিডিয়া এখন শুধু বিশ্বকোষ হিসেবে সীমাবদ্ধ নয়। আমরা গুগল বা বিং সার্চে কোন কিছু অনুসন্ধান করলে, সিরি বা অ্যালেক্সার কাছে জানতে চাইলে- যেমন জো বাইডেনের বয়স কত? বা সাবমেরিন কি?- তখন উইকিপিডিয়ার ডাটা থেকেই সেগুলো জবাব দেওয়া হয় বা উত্তর দেখানো হয়। তারজন্য অর্থও পায় উইকিপিডিয়া কর্তৃপক্ষ।
একইভাবে উইকিপিডিয়ার তথ্য কাজে লাগায় এআই-ও। গুগল সার্চ ও অন্যান্য তথ্য ব্যবসায় উইকিপিডিয়া কীভাবে সাহায্য করছে এ বিষয়ে গবেষণা করা নিকোলাস ভিনসেন্ট বলেন, উইকিপিডিয়া ছাড়া জেনারেটিভ এআই-এর অস্তিত্বই থাকত না।
উইকিপিডিয়ায় এআই-এর হুমকি ও সম্ভাব্য উপকার নিয়ে গত মার্চে আয়োজিত এক সম্মেলনে সম্পাদকরা একই সঙ্গে আশা এবং আশঙ্কার কথা তুলে ধরেছেন। অনেকে আত্মবিশ্বাসী ছিলেন যে, উইকিপিডিয়ার অগ্রগতিতে সহায়তা করবে এআই। আর কেউ কেউ এই আশঙ্কা করেন যে, গ্রাহক হয়তো চ্যাটজিপিটি বেছে নিবে।
২০১৭ সালে উইকিমিডিয়া ফাউন্ডেশন এবং তার স্বেচ্ছাসেবক সম্প্রদায় মিলে উইকিপিডিয়া, উইকিডাটা এবং উইকিমিডিয়া কমন্স এর কর্মপন্থা ও তথ্য সংগ্রহ নিয়ে ব্যাপক আলোচনা চালায়। তাদের এক গবেষণায় উঠে আসে এআই এর কথা। তখনকার ধারণা ছিল এমন যে, এই প্রযুক্তি বদলে দিতে পারে তথ্য সংগ্রহ ও একত্রিত করার পন্থা। এ কারণেই চ্যাটজিপিটির উত্থান উইকিপিডিয়া সম্প্রদায়কে অতটা অবাক করেনি। তবে অনেকে এর দ্রুত গতিতে ছড়িয়ে পড়া দেখে কিছুটা বিচলিত হয়েছেন। চ্যাটজিপিটির নতুন সংস্করণ বাজারে আসার মাত্র দুই মাসের মধ্যে ১০০ মিলিয়ন গ্রাহক পায়।
মজার বিষয় হলো, উইকিপিডিয়া সাইট দেখতে সাদামাটা হলেও এতে কিন্তু এআই-এর মতো উন্নত প্রযুক্তির ব্যবহার হয়। সেমিঅটোমেটির সফ্টওয়ারের মাধ্যমে লাখো নিবন্ধের মধ্যে বানান ভুল এবং ইচ্ছাকৃতভাবে বসানো ভুল তথ্য শনাক্ত করা হয়। উইকিমিডিয়ার প্রধান প্রযুক্তি কর্মকর্তা সেলেনা ডেকেলম্যান বলেন, ২০০২ সাল থেকেই আমাদের কাছে এআই টুল এবং বট আছে। ২০১৭ সাল থেকে শুধুই মেশিন লার্নিং নিয়ে কাজ করা পৃথক দল আছে। দলটি সেমিঅটোমেটিক সফ্টওয়ারে কন্টেন্ট রিভিউ এবং অনুবাদের ক্ষেত্রে বিশেষ অবদান রাখে।
উইকিপিডিয়ার বট ব্যবহার এবং চ্যাটবটগুলোর উইকিপিডিয়া ব্যবহারে অবশ্য বিশাল পার্থক্য আছে। বিপুল পরিমাণ তথ্য মজুতের জন্য বিভিন্ন ওয়েবসাইট থেকে ডাটা নিতে বছরের পর বছর ধরে জেনারেটিভ এআই এর লার্জ লেঙ্গুয়েজ মডেলগুলোকে (এল. এল.এম) প্রশিক্ষণ দেওয়া হয়েছে। ডাটার বৃহদাংশ নেওয়া হয় উইকিপিডিয়া থেকেই। এই এল.এল.এম-ই চ্যাটজিপিটি ও গুগল বার্ডের মতো চ্যাটবটগুলোকে শক্তিশালী করে। এগুলো ট্রিলিয়ন ট্রিলিয়ন শব্দ মজুত করেছে। উইকিপিডিয়া ছাড়াও গুগলের ডাটাবেজ, সরকারি নথি, অনলাইন লাইব্রেরির বই, রেডিট ও ওয়েবে থাকা বিপুল পরিমাণ সংবাদ প্রতিবেদন থেকে এগুলো ডাটা মজুত করে।
সিয়াটলের অ্যালেন ইনস্টিটিউট ফর এআই-এর কম্পিউটার বিজ্ঞানী জেসি ডজ জানান, বর্তমানে ডাটাগুলোর ৩-৫ শতাংশ নেওয়া হয়েছে উইকিপিডিয়া থেকে। কোনো একক সোর্স হিসেবে উইকপিডিয়া থেকেই সর্বোচ্চ ডাটা নেওয়া হয়েছে। আগামীতেও উইকিপিডিয়া অত্যন্ত মূল্যবান হয়ে থাকবে।
উইকিপিডিয়ার মূল লক্ষ্য হল যে কোনো উপায়ে হোক জ্ঞান যতটা সম্ভব বিস্তৃতভাবে এবং অবাধে ছড়িয়ে দেওয়া। ১০ বছর আগে সাইট অ্যাডমিনিস্ট্রেটররা গুগলের উইকিপিডিয়া ব্যবহার বিবেচনা করেই জেনারেটিভ এআই-এর ক্ষমতা সম্পর্কে ধারণা পান।
যেমন, যদি গুগলে সার্চ করা হয় ‘রাশিয়া-ইউক্রেন যুদ্ধ কি?’ তখন গুগলে শুরুতে দেখানো হয় ঘটনার সংক্ষিপ্ত বিবরণ। আর উইকিপিডিয়ার লিঙ্ক দেওয়া থাকে নিচে। এটি উইকিপিডিয়ার লিঙ্কে প্রবেশ করার সম্ভাবনা কমিয়ে দেয়।
২০১৭ সালের গবেষণাতেও এই কথা উঠে এসেছে। তখনই উইকিপিডিয়ার পাঠক সংখ্যা কমার কথা বলা হয়েছে। এটাকে নাম দেওয়া হয়েছে ‘প্যারাডক্স অব রিইউজ’। উইকিপিডিয়ার নিবন্ধগুলি আরো অন্যান্য মাধ্যমে যত বেশি ব্যবহার হওয়া শুরু হয়েছে, উইকিপিডিয়ায় প্রবেশ করা পাঠক সংখ্যা ততটাই কমছে।
জেনারেটিভ এআই-এর কারণে এই ঝুঁকি আরো বাড়ছে। কারণ সার্চ ইঞ্জিনগুলো সংক্ষিপ্ত বর্ণনা দিলেও সেগুলো অন্তত লিঙ্ক জুড়ে দেয় এবং সাইটেশন ব্যবহার করে। কিন্তু এআই-এর ক্ষেত্রে এসব বদলে গেছে। চ্যাটজিপিটির দেওয়া উত্তরে কোন সাইটেশন থাকে না। কোন জায়গা থেকে তথ্য নেওয়া হয়েছে তার কোন উল্লেখ থাকে না। আর এটাই গুগল, বিং সার্চ এবং এআই-এর মধ্যে বড় পার্থক্য। এ কারণেই অন্তত উইকিপিডিয়ার প্রেক্ষাপট থেকে এআই-কে বেশি ক্ষতিকর বলা যেতে পারে। তবে তথ্যের নির্ভুলতার ক্ষেত্রে আসলেই পিছিয়ে থাকছে এআই।
এআই নিয়ে কাজ করা এক কম্পিউটার বিজ্ঞানী নাম প্রকাশ না করার শর্তে বলেন, এই প্রযুক্তিগুলো (এআই) স্ব-ধ্বংসাত্মক। তারা প্রশিক্ষণের জন্য যে বিষয়বস্তুগুলোর উপর নির্ভর করে সেগুলোকেই বিলুপ্ত করার হুমকি তৈরি করছে।
কিছু ত্রুটি থাকলেও অনেক শিক্ষাবিদ উইকিপিডিয়াকে ‘সত্যের সমন্বয়’ বলে মন্তব্য করেছেন। কারণ তথ্যের উৎস জুড়ে দেওয়ার মাধ্যমে বাস্তবতা যাচাই করার সুযোগ দেয় উইকিপিডিয়া। যেমন কোভিড-১৯ মহামারি নিয়ে প্রতিনিয়ত নতুন তথ্য আর ফ্যাক্ট সামনে আসছে। অনেকগুলো নিয়ে বিতর্ক হচ্ছে। উইকিপিডিয়ার স্বচ্ছতার কারণেই সত্যতা যাচাই করা যাচ্ছে। উইকিপিডিয়ার বেশিরভাগ নিবন্ধে ফুটনোট, লিঙ্ক বা তথ্যসূত্র উল্লেখ থাকে। আগে কতবার এটি সম্পাদনা হয়েছে সেটিও উল্লেখ থাকে। এই কারণে অন্তত ফ্যাক্ট-চেক করার সুযোগ থাকে।
উইকিপিডিয়ার সম্পাদকদের নির্দেশনা দেওয়া আছে তারা যাতে নিরপেক্ষ থাকে যে কোন বিষয়ে। এমনকি উইকিপিডিয়া কীভাবে ধোঁকার শিকার হয়েছে সে বিষয়েও বিশাল লম্বা নিবন্ধ আছে।
উইকিপিডিয়াতে স্বাস্থ্য সম্পর্কিত তথ্য অনেক বেশি পড়া হয়। একই বিষয় এআই-এর ক্ষেত্রে হলে অত্যন্ত উদ্বিগ্ন হওয়া উচিত। গত মার্চে আয়োজিত এক সম্মেলনে বলা হয়, আমরা মানুষের জীবন প্রযুক্তির হাতে ছেড়ে দিয়েছি। মানুষ হয়তো এই প্রযুক্তির কাছে স্বাস্থ্য সংক্রান্ত পরামর্শ চাইবে। আর পরামর্শ ভুলও হতে পারে। তখন মানুষ মারা যাবে।
এই আশঙ্কা শুধু চ্যাটবট নয়, এআই-এর সঙ্গে সম্পৃক্ত নতুন সব সার্চ ইঞ্জিনের ক্ষেত্রেও সম্পর্কযুক্ত। এপ্রিলে স্ট্যান্ডফোর্ড ইউনিভার্সিটির বিজ্ঞানীরা বিং চ্যাট, নিভাএআই, পারপ্লেক্টিটি ডট এআই এবং ইউচ্যাট নিয়ে গবেষণা করে দেখেছেন, প্রশ্নের উত্তরে আসা বাক্যগুলোর কেবল অর্ধেক প্রকৃত সাইটেশন দ্বারা সমর্থিত। বিজ্ঞানীরা মন্তব্য করেন, প্রাথমিক তথ্য পেতে এসব প্রযুক্তি ব্যবহার করা গ্রাহকদের জন্য এই ফলাফল উদ্বিগ্ন হওয়ার মত।
এআই-এর নৈতিকতা নিয়ে কাজ করা মার্গারেট মিশেল বলেন, বাজারে প্রতিযোগিতার কারণে নির্ভরযোগ্যতার চেয়ে বাজারে দ্রুত নিজস্ব চ্যাটবট নিয়ে আসাকে অগ্রাধিকার দিচ্ছে কোম্পানিগুলো। সামনে এআই উন্নত হবে। যত বেশি ভালো ডাটা ব্যবহার করবে তত সঠিক উত্তর দেওয়া সম্ভব হবে।
তথ্য সঠিক কিনা; রিয়েল টাইমে যাচাই করার জন্য ‘রিট্রাইবাল’ কৌশল ব্যবহারের পরামর্শ দিচ্ছেন সংশ্লিষ্ট অনেকে। এই কৌশলে, রিয়েল টাইমে উত্তরের সত্যতা যাচাই করতে ওয়েবে একটি ভালো উৎস খুঁজে দেখা হবে। এতে সুনির্দিষ্ট লিঙ্ক জুড়ে দেওয়ার সুযোগ থাকবে। কিছু এআই যুক্ত সার্চ ইঞ্জিন এখন এটি ব্যবহার করছে। তারপরও চ্যাটবটগুলো ফ্যাক্ট সরবরাহে উইকিপিডিয়া এবং এনসাইক্লোপিডিয়া ব্রিটানিকার মতো সমপর্যায়ে আসতে পারবে কিনা সে বিষয়ে সন্দেহ আছে বিশেষজ্ঞদের।
এআই-তে তথ্যের সত্যতা নিয়ে গবেষণা করা ওয়াইন ইভান্স বলেন, বাজারে প্রতিদ্বন্দ্বিতার কারণে এআই-এর উন্নতি হবে। ওপেনএআই এখন নির্ভুলতার জন্য কিছু কোম্পানির সাথে কাজ করছে। গুগল রীতিমত চিকিৎসকদের সঙ্গে ঘনিষ্টভাবে কাজ করছে রোগ শনাক্তকরণ এবং চিকিৎসা নিয়ে।
চ্যাটজিপিটি বাজারে আনা ওপেনএআই-এর দুই গবেষক সন্ধিনী আগারওয়াল ও গিরিশ শাস্ত্রি বলেন, সর্বশেষ সংস্করণ জিপিটি-৪ তথ্যের সত্যতার ক্ষেত্রে উল্লেখযোগ্য অগ্রগতি করেছে। তবে এই প্রযুক্তি একই সাথে দ্রুততর হওয়া ও নির্ভুল হওয়ার দ্বন্দ্বের মধ্যে পড়বে। কারণ প্রশিক্ষণ দেওয়া ডাটাগুলোকে একইরকমভাবে তুলে ধরা লক্ষ্য ছিল না চ্যাটবটগুলোর। বরং সাবলীল ভাষায় উত্তরগুলো প্রকাশ করাই ছিল উদ্দেশ্য। তবে ভবিষ্যতে প্রশ্নের উত্তরে সাইটেশন প্রয়োজন হলে তা দেওয়া যাবে বলে আশা করেন এই দুই গবেষক।
এ ক্ষেত্রে সমাধান হল প্লাগ ইন সুবিধা। ২০২১ সালের সেপ্টেম্বর পর্যন্ত প্রশিক্ষণ দেওয়ানো ডাটার মধ্যে সীমাবদ্ধ জিপিটি-৪। এক্ষেত্রে উইকিপিডিয়া প্লাগ ইন করলে সাম্প্রতিক তথ্যও পাওয়া সম্ভব। তখন উইকিপিডিয়ার তথ্যের যথার্থতা ও চ্যাটবটের সাবলীল ভাষা মিলে গ্রাহক আরো ভালো সেবা পান।
যেমন মহাসাগরে ধ্বংস হওয়া সাবমেরিন টাইটান নিয়ে প্রশ্ন করা হলে চ্যাটবটে সাধারণত এমন উত্তর আসবে ‘আমার তথ্য ২০২১ সাল পর্যন্ত সীমাবদ্ধ’। কিন্তু এখানে উইকিপিডিয়া প্লাগ ইন করলে, প্রশ্ন পেয়ে বটগুলো সংশ্লিষ্ট নিবন্ধ থেকে তথ্য নিয়ে সেগুলো সংক্ষেপ করে উত্তর হিসেবে প্রকাশ করে। এ ক্ষেত্রে কিছুটা দেরি হয়। প্লাগ ইন এর ক্ষেত্রে চ্যাটজিপিটি সব সময় উৎসের তথ্য যুক্ত করে দেয়। এভাবে উইকিপিডিয়া ডটকমে না ঢুকেও উইকিপিডিয়া থেকে তথ্য পাওয়া সম্ভব। তবে সব সময় যে উইকিপিডিয়ার তথ্য সংক্ষেপ করার ক্ষেত্রে নির্ভুল হবে, বিষয়টি এমন হয়। তবে অবশ্যই এটি চ্যাটজিপিটির মতো প্লাটফর্মকে উন্নত করছে।
তবে অনেক বিশেষজ্ঞ প্রত্যাশা করেন, প্লাগ ইন নয়, চ্যাটবটগুলো স্বয়ংক্রিয়ভাবে উইকিপিডিয়া বা অন্যান্য প্রয়োজনীয় নিবন্ধ থেকে ফ্যাক্ট-চেক করে উত্তর দেবে। কারণ প্রশ্নের ধরনের কারণে চ্যাটবটগুলো বিভ্রান্ত হতে পারে। যদি প্রশ্ন করা হয়, প্রথম চন্দ্র অভিযানে কোন পাঁচজন ব্যক্তি চন্দ্রপৃষ্ঠে পা রাখেন? তখন চ্যাটবট চাইবে পাঁচজনের নাম খুঁজে বের করতে। অথচ ১৯৬৯ সালে কেবল দুইজন চাঁদে পা রাখেন। এসব ক্ষেত্রে চ্যাটজিপিটি দ্বিধায় থাকলে বলতে পারবে উত্তর জানা নেই এবং সেই সাথে উইকিপিডিয়ার এই সংক্রান্ত লিঙ্ক যুক্ত করে দিতে পারে।
প্লাগ ইন-এর মাধ্যমে চ্যাটজিপিটিতে সৃজনশীল এবং প্রায় নির্ভুল উত্তর আসলেও সবক্ষেত্রে যে তা যথার্থ হবে তার নিশ্চয়তা নেই। এই কারণেই উইকিপিডিয়া সম্প্রদায়ের মধ্যে মৃদু আশার আলো হলো, যদি সঠিকভাবে ব্যবহার করা যায় তাহলে এআই-এর সঙ্গে সাংঘর্ষিক অবস্থান নয়, বরং সাইটের উন্নয়নে তা ব্যবহার করা যেতে পারে।
সবচেয়ে বেশি আশাবাদীদের কাতারে আছেন উইকিপিডিয়ার প্রধান প্রযুক্তি কর্মকর্তা সেলেনা ডেকেলম্যান। তিনি বলেন, আমরা ২২ বছর ধরে প্রমাণ করে আসছি যে, স্বেচ্ছাসেবীদের মাধ্যমে কাজ করা আমাদের মডেলটি টেকসই। আমি বলব এখন কিছু হুমকি বিদ্যমান, তবে সে হুমকি কি অনতিক্রম্য? আমার মনে হয় না।
এ ক্ষেত্রে প্লাগ ইন-কে মনে করা হচ্ছে উইকিপিডিয়ার ভবিষ্যৎ রক্ষার প্রাথমিক পদক্ষেপ হিসেবে। উইকিপিডিয়ার অভ্যন্তরে এআই ব্যবহারের প্রকল্পেও বেশ অগ্রগতি হয়েছে। যাতে নিজেদের কাজে এআই ব্যবহার করা যায়। এর প্রাথমিক উদ্দেশ্য হলো নতুন সম্পাদকদের সাহায্য করা। কারণ নতুন নিবন্ধ শুরুর জটিল প্রক্রিয়ায় নতুনরা অনেক সময় ঝামেলায় পড়েন। আবার কোন সম্পাদক যদি সাইটেশন করতে না পারেন তাহলে এ ক্ষেত্রে সাহায্য করবে এআই। কোন নতুন নিবন্ধ বা সম্পাদনা বাতিল করার মতো হলে তা স্বয়ংক্রিয়ভাবে বাতিল করবে এআই। এভাবে এআই ব্যবহারের ফলে নিরপেক্ষ অবস্থান বজায় রাখা সম্ভব কিনা এমন প্রশ্নের উত্তরে উইকিপিডিয়া ফাউন্ডেশনের গবেষণা প্রধান লেয়লা জিয়া বলেন, অবশ্যই সম্ভব।
এদিকে এআই মানুষের লেখার ধরন নকল করতে পারায় নিবন্ধের কোন অংশ প্রযুক্তির সাহায্যে লেখা তা খুঁজে বের করা কষ্টকর হচ্ছে। তাই শঙ্কা হচ্ছে, এখন হয়তো কিছু কৃত্রিম বুদ্ধিমত্তা সম্পাদকদের সাহায্য করছে। কিন্তু শেষ পর্যন্ত যদি যন্ত্রেরই জয় হয়?
আবার এদিকে ক্রমবর্ধমান জনপ্রিয়তার সাথে সাথে বাধারও সম্মুখিন হচ্ছে এআই। আরো বাধার মুখোমুখিও হতে পারে। সে প্রতিবন্ধকতা হতে পারে সামাজিক এবং প্রযুক্তিগত উভয়ই। ইউরোপীয় ইউনিয়ন পার্লামেন্ট বর্তমানে নতুন নিয়ন্ত্রণ কাঠামোর কথা বিবেচনা করছে যেখানে এআই থেকে উৎপন্ন ছবি, লেখা, ভিডিওতে স্বতন্ত্র চিহ্ন বসাতে হবে। মার্কিন কংগ্রেস ইতোমধ্যে এআই নিয়ন্ত্রণে বেশ কয়েকটি বিল বিবেচনা করছে। আইনি বাধার সম্মুখিনও হচ্ছে এআই। যেমন, অনুমতি ছাড়া গেটি ইমেজেসের ছবি ব্যববহার এবং ক্যালিফোর্নিয়ার একটি মামলায় ওপেনএআই-এর বিরুদ্ধে ইন্টারনেট থেকে লাখ লাখ মানুষের ব্যক্তিগত তথ্য চুরির অভিযোগ আছে।
উইকিপিডিয়া যদিও তার লেখাগুলো সবার জন্য উন্মুক্ত রেখেছে তবে সেগুলো কোথাও ব্যবহারের ক্ষেত্রে তথ্য ঠিক রাখা এবং উৎস উল্লেখ করার শর্ত আছে। জানা গেছে, উইকিপিডিয়া কমিউনিটির মধ্যে এখন আইনি দিক নিয়ে চিন্তাভাবনা চলছে।
ডেটা প্রদানকারীরা অন্যান্য ধরনের চাপ প্রয়োগেও সক্ষম। গত এপ্রিলে, রেডিট ঘোষণা করে যে, ক্ষতিপূরণ ছাড়া প্রযুক্তি প্রতিষ্ঠানগুলো তার ডাটা মজুত করতে দেওয়া হবে না। উইকিপিডিয়া ফাউন্ডেশনও একই ধরনের আদেশ জারি করার সম্ভাবনা আছে। যাকে বলা হচ্ছে ‘ডাটা স্ট্রাইক’ হিসেবে। উইকিপিডিয়া বর্তমানে যেভাবে ডাটা ব্যবহারের জন্য গুগল থেকে অর্থ নিচ্ছে সেভাবে এআই থেকে নিতে পারে। অথবা উইকিপিডিয়াকে উদ্ধৃত যাতে করা হয় সেই ব্যবস্থা নিবে।
বিশেষজ্ঞরা বলছেন, মূলত স্বতন্ত্রভাবে এই কোম্পানিগুলো বিশ্বকোষ তৈরি করতে যাওয়া বোকামির কাজ হবে। কারণ উইকিপিডিয়া বা রেডিটের কোটি কোটি ডাটা ছাড়া এআই-কে প্রশিক্ষণ দেওয়া সম্ভব নয়। তাই মাঝামাঝি এক অবস্থানে এসে উইকিপিডিয়ার মতো তথ্য প্রদানকারী সংস্থাকে সাইটেশনে রাখা উচিত। এতে এআই-এর জন্য এগুলো কতটা গুরুত্বপূর্ণ সেটাও স্পষ্ট হবে। কারণ উইকিপিডিয়া ছাড়া কোন ভালো এআই মডেল তৈরি করা প্রায় অসম্ভব বলছেন প্রযুক্তি সংশ্লিষ্টরা।
এসব সোর্স থেকে ডাটা নেওয়ার বিষয়ে যদি এআই উতরেও যায় তারপরও বাধাগ্রস্ত হওয়ার মতো কারণ আছে। এক গবেষণায় মানব উৎপাদিত জ্ঞানের পরিবর্তে বিদ্যমান এআই মডেল থেকে উৎপন্ন ডাটা দিয়ে নতুন মডেল তৈরির চেষ্টা করা হয়। এসময় দেখা যায়, পুরো সিস্টেমে সমস্যা দেখা দেয়। যাকে বলা হচ্ছে ‘মডেল কলাপ্স’। অর্থাৎ বিদ্যমান এআই থেকে ডাটা নিয়ে নতুন এআই মডেলকে প্রশিক্ষণ দেওয়া এখনো সম্ভব নয়। তাই দেখা যাচ্ছে উইকিপিডিয়ার নিবন্ধ যদি এআই দিয়ে লেখা হয় তাহলে এসব উৎস থেকে তথ্য নিয়ে নতুন মডেলকে প্রশিক্ষণ দেওয়া সম্ভব নয়। অর্থাৎ সবকিছু একই বৃত্তে ঘুরতে থাকবে।
এই গবেষণার উপসংহারে বলা হয়, ভবিষ্যৎ এআই মডেলের জন্যও ‘প্রকৃত মানব উৎপন্ন’ ডাটার গুরুত্ব ক্রমাগতভাবে বাড়বে। অন্তত এখনকার ক্ষেত্রে উইকিপিডিয়ার সম্পাদকদের জন্য এটি উৎসাহজনক মতো একটি খবর।
এ কারণেই চ্যাটবটগুলো মুগ্ধ করার মতো, অত্যন্ত জনপ্রিয় এবং অনায়াসে ব্যবহার করা সম্ভব হলেও এখনো উইকিপিডিয়ার মতো বিনামূল্যে প্রাপ্য নির্ভরযোগ্য মাধ্যম টিকে থাকার পক্ষে আশাবাদী এর সম্পাদকগণ ও সংশ্লিষ্ট খাতের বিশেষজ্ঞরা। তবে প্রযুক্তির রকেট গতির উৎকর্ষতার জন্য আশার সাথে সাথে একটি প্রশ্নও ঝুলছে, আপাতত অনলাইন বিশ্বকোষ নিরাপদ, কিন্তু ঠিক কতদিন?