অনুবাদ বিষয়ক প্ৰবন্ধমালা - তৃষ্ণা বসাক
তৃষ্ণা বসাক
শুরু করা যাক লুই ক্যারলের একটি ননসেন্স রাইম দিয়ে
’Twas brillig, and the slithy toves
Did gyre and gimble in the wabe:
All mimsy were the borogoves,
And the mome raths outgrabe.
কবিতাটি কিন্তু শব্দার্থের ওপর নির্ভরশীল নয়। বরং অর্থবিপর্যয়টিই কৌতূকের মূল উপাদান। এই কবিতায় ব্যবহৃত শব্দগুলির কোনো প্রচলিত অর্থ নেই এর অনুবাদ করতে গিয়ে অনুবাদ সংক্রান্ত সমস্ত ধ্যানধারণা চুরমার করে দেন সত্যজিৎ রায়। তিনি ‘Jabberwocky’ অনুবাদ করে ফেলেন। নাম দেন – জবরখাকি।
বিল্লিগি আর শিঁথলে যত টোবে
গালুমগিরি করছে ভেউ-এর ধারে
আর যত সব মিমসে বোরোগোবে
মোমতারাদের গেবগেবিয়ে মারে
ল্যুইস ক্যারল বিরচিত ‘Jabberwocky’ কবিতার প্রথম স্তবক। একটি তথাকথিত ননসেন্স কবিতা। ১৮৭১ সালে Through the Looking-Glass গ্রন্থে প্রকাশ পায়। সত্য জিতের অনুবাদ যেন একটা চ্যালেঞ্জ। ননসেন্সের জবাবে ননসেন্স!
আবার লিয়ার অনুবাদের সময় সত্যজিত রায় শব্দ বা অর্থ নয়, বরং অনুসরণ করেছিলেন সঙ্গের অদ্ভুত চিত্রগুলো, সেই ছবির মধ্যেই এই আপাত অর্থহীন কবিতার স্রষ্টার মনের অভিপ্রায়টি লুকিয়ে।
ধরা যাক এই কবিতাটি এ আই কে অনুবাদ করতে দেওয়া হল। সে ডাহা ফেল করবে, কিংবা তা থেকে অর্থ খুঁজে কিছু একটা দাঁড় করাবে!
এ আই শব্দ ধরে ধরে অনুবাদ করতে পারে, কিন্তু স্রষ্টার মনের অভিপ্রায়কে ধরা তার পক্ষে দু;সাধ্য। যেমন সে ধরতে পারে না সাংস্কৃতিক নুয়েন্স, লেখকের নিজস্ব স্বর। এরকম একটা নেগেটভ দিক থেকে শুরু করলেও কৃত্রিম বুদ্ধিমত্তাকে কিন্তু দাবায়ে রাখা যায়নি। সে কী করছে না! যেদিকে তাকাই সেদিকেই তার দাপাদাপি। আগামী কুড়ি তিরিশ বছরে সে নাকি শাট থেকে সত্তর শতাংশ চাকরি খেয়ে নেবে। এখন দেখা যাক কৃত্রিম বুদ্ধিমত্তা আসলে কী।
যুক্তরাষ্ট্রের নর্থওয়েস্টার্ন বিশ্ববিদ্যালয়ের কম্পিউটার বিজ্ঞানের অধ্যাপক ল্যারি বার্নবাউমের কথায়, কৃত্রিম বুদ্ধিমত্তা হলো কম্পিউটার বিজ্ঞানের এমন একটি ক্ষেত্র, যেখানে বুদ্ধিদীপ্ত কাজ করতে যন্ত্র তৈরি ও প্রশিক্ষণের ওপর গুরুত্ব দেয়।
কয়েক দশক ধরে কৃত্রিম বুদ্ধিমত্তা মূলত বিশ্লেষণী কাজে ব্যবহৃত হয়ে আসছে। বিশাল ডেটা সেট বিশ্লেষণ করে কোনো বিষয়ের প্রশিক্ষণ দেওয়া বা ধরন চিহ্নিত করার কাজ করার সুবিধা পাওয়া যায়। ফলে ‘জেনারেটিভ এআই’ ক্ষেত্রটির ব্যাপক প্রসার ঘটেছে। জেনারেটিভ এআই হচ্ছে, কৃত্রিম বুদ্ধিমত্তার একটি রূপ যা কোনো কন্টেন্ট তৈরি করতে পারে। এই প্রযুক্তি কোনো শব্দ, ছবি, ভিডিওর মতো বিষয় সৃষ্টি করতে পারে। অনেক সময় এই পদ্ধতি মানুষের সৃজনশীলতার মতো জটিল বিষয়টি অনুকরণ করে থাকে। এখনকার জনপ্রিয় চ্যাটবট চ্যাটজিপিটি ও ছবি প্রস্তুতকারক ডাল-ইর মতো প্রোগ্রামে রয়েছে এ আই-র এই সক্ষমতা। এখানে প্রোগ্রামারকে আলাদা করে নির্দেশ দিতে হয় না, কম্পিউটারটি নিজে শেখে।বিশাল ডেটা ডেট পেলে সে বিভিন্ন প্যাটার্ন বা ধরন শণাক্ত করতে বা ফলাফলের পূর্বাভাস দিতে পারে। যা আসলে মানুষের ব্রেনের কর্ম পদ্ধতি ‘নিউরাল নেটওয়ার্ক’কে অনুসরণ করে। বিভিন্ন স্তরের কৃত্রিম নিউরনের মাধ্যমে এগুলো পরস্পরের সঙ্গে তথ্য দেওয়া-নেওয়া করে।
কৃত্রিম বুদ্ধিমত্তা-ভিত্তিক ক্লাউড সংগ্রহগুলি (যেমন, অ্যামাজ়ন আলেক্সা, গুগল গো, অ্যাপেল সিরি ইত্যাদি) এরা মূলত শহুরে দৈনন্দিন জীবনের খুঁটিনাটি অনেক সময় পরিবার বা কাছের মানুষের থেকেও বেশি ‘জেনে রাখছে’। ই-মেল পড়ে উত্তর দিচ্ছে, পছন্দের গান শোনাচ্ছে, অ্যাপয়েন্টমেন্ট মনে করাচ্ছে । এর ওপর প্রতিদিন সোশ্যাল মিডিয়ায় মানুষ নানান ফাঁদে পড়ে তার ব্যক্তিগত তথ্য শেয়ার করছে। একটা খুব সাধারণ উদাহরণ হল বিভিন্ন ফোটো অ্যাপ, যেমন ডিপ ফেক। এতে জালিয়াতি খুব সহজ হয়ে গেছে। একটা নিরীহ মেয়েকে পর্ন ছবির নায়িকা বানিয়ে ব্ল্যাকমেল করা হচ্ছে সহজেই। হঠাৎ হঠাৎ কেউ রাজকুমারী সেজে হাজির হচ্ছে, নিজের ছবির ওপর যে কোন ডেয়ারে সানন্দে সম্মত সে, এর ফল যে মারাত্মক হতে পারে ভাবছেই না। এদিকে ডিজিটাল সুরক্ষার ভয় এমন পর্যায়ে পৌঁছেছে যে একজন রাষ্টপ্রধান উঠে যাবার পর সঙ্গে সঙ্গে তাঁর চেয়ার মুছে দিচ্ছেন তাঁর নিরাপত্তা কর্মীরা, কোন রাষ্ট্রপ্রধান তাঁর বর্জ্যটুকুও অন্য দেশে ফেলে
আসছেন না, সেসব বয়ে নিয়ে আসার জন্য পুপ টয়লেট ব্যবহার করছেন।
এখানে আরও দুটো শব্দ শিখে রাখা ভাল- মেশিন লার্নিং বা এম এল এবং ডিপ লার্নিং বা ডি এল। জিপিটি অর্থ হচ্ছে ‘জেনারেটিভ প্রি-ট্রেইন্ড ট্রান্সফরমার’। জেনারেটিভ অর্থ হলো এটি কৃত্রিম বুদ্ধিমত্তার সাহায্যে কোনো কিছু তৈরি করে। প্রি-ট্রেইন্ড অর্থ একে আগে থেকেই বিশাল তথ্যভান্ডারের মাধ্যমে প্রশিক্ষণ দেওয়া হয়েছে। ট্রান্সফরমার অর্থ, এতে শক্তিশালী নিউরাল নেটওয়ার্ক ব্যবহার করা হয়েছে, যা ভাষাকে প্রক্রিয়াজাত করতে পারে।
জন ম্যাক্যার্থি সর্বপ্রথম Artificial Intelligence নামক টার্মটি ব্যবহার করেন ১৯৫৫ সালে। পরের বছর নিউ হ্যামশায়ারের হ্যানোভার শহরস্থ ডার্টমাউথ কলেজে অনুষ্ঠিত এক একাডেমিক কনফারেন্সে তিনি তা প্রথম প্রকাশ করেন। এজন্য জন ম্যাক্যার্থিকে কৃত্রিম বুদ্ধিমত্তার অন্যতম জনক বলা হয়। তার অন্যান্য সহযোগীরা হলেন- মার্ভিন মিনস্কি, অ্যালেন নিউয়েল এবং হার্বাট এ সায়মন।
অনুবাদে কৃত্রিম বুদ্ধিমত্তা মূলত তিন ধাপ বিবর্তনের মধ্যে দিয়ে এসেছে।
প্রথমে ছিল আর এম টি (রুল বেসড মেশিন ট্রান্সলেশন) পরে এস এম টি (স্ট্যাটিস্টিকাল মেশিন ট্রান্সলেশন) আর এখন নিউরাল মেশিন ট্রান্সলেশন (এন এম টি) এবং লার্জ ল্যাঙ্গুয়েজ মডেল (এলএলএম)। এটা হলো একধরনের নিউরাল নেটওয়ার্ক, যা লিখতে শেখে এবং ইউজারের সঙ্গে কথাবার্তা চালাতে জানে। এই ল্যাঙ্গুয়েজ মডেলের ওপর ভিত্তি করেই বর্তমানে জনপ্রিয় সব চ্যাটবট তৈরি করা হয়েছে। ভাষার অনুবাদে এখন এ আই যে অনেক কম ভুল করে মূলত এই এল এল এম র জন্যে। কৃত্রিম বুদ্ধিমত্তার ক্ষেত্রে বিবেচ্য বিষয় হচ্ছে, প্যারামিটার। বৃহৎ ভাষা মডেলের প্রশিক্ষণ তথ্যের সংখ্যাসূচক পয়েন্ট হচ্ছে এই প্যারামিটার। কোনো কাজে কৃত্রিম বুদ্ধিমত্তা কতটা দক্ষ, তা এই প্যারামিটারের ওপর নির্ভর করে। কোনো বাক্যে গঠনের ক্ষেত্রে একটি শব্দের পর আরেকটি শব্দ কী হবে, তা এই প্যারামিটারের ওপর নির্ভর করে ধারণা পায় এআই। তবে এআই র মূল দুর্বলতা হ্যালুসিনেশন, অর্থাৎ ভুল কিছু ভেবে বসা, আর আবেগ বোঝার অক্ষমতা।
এআই নির্ভর লেখার সহায়ক এদিন তো ছিলই- যেমন গ্রামারলি, প্রো রাইটিং এড, হেমিংওয়ে এডিটর ইত্যাদি। মানুষের মতো লেখার জন্যে আছে নানা কন্টেন্ট জেনারেটর টুল, যার মধ্যে সবচে বিখ্যাত জিপিটি। একে তৈরি করেছে ওপেন এ আই। এছাড়াও আছে কপি এ আই, রাইটসনিক, শর্টলিএআই।
২০১৬ সালে একটা জাপানিজ এ আই প্রোগ্রাম , যার নাম এ আই নভেলিস্ট, একটা আস্ত উপন্যাস লিখে ফেলল, যার নাম – ‘দ্য ডে আ কম্পিউটার রাইটস আ নভেল’। জাপানেই এআই ব্যবহার করে পুরস্কার জিতলেন লেখক রি কুদান, তা নিয়ে শুরু হয়ে গেল বিতর্ক।
কৃত্রিম বুদ্ধিমত্তা প্রযুক্তি অ্যাপলের সফটওয়্যার সিরির মতো ভার্চুয়াল সহকারীর ব্যবহার বাড়িয়ে দিয়েছে। এটি চিকিৎসকদের এমআরআইয়ের মাধ্যমে ক্যানসার শনাক্ত করতে সাহায্য করছে। এ ছাড়া কাজ করছে মুঠোফোনের মাধ্যমে চেহারা চিনে নিতে । সেসব ঠিক আছে, কিন্তু সে যখন মানুষের গর্ব, তার সৃজনশীলতা, তা কেড়ে নিতে চাইছে, তখন মনে হয় তার বিষয়ে একটু জেনে এগোনই ভাল।
এছাড়া আছে ভাষার অনুবাদের নানা টুল, যারা কাজ চালাবার মতো অনুবাদ করলেও, সাহিত্যের অনুবাদে প্রায়ই হাস্যকর পরিস্থিতির তৈরি করে।
কয়েকটি জনপ্রিয় অনুবাদ টুল হল- গুগল ট্রান্সলেট, ডিপএল, লিঙ্গুইক্স ইত্যাদি। ভারতের সংবিধানভুক্ত ২২টি ভারতীয় ভাষায় সমান্তরাল অনুবাদ প্রকল্প তৈরি হচ্ছে (‘ভাষিণী’ ও ‘এআইফরভারত’)। ডিজিটাল পেমেন্টের পরিভাষাও যাতে মাতৃভাষায় সম্পূর্ণ রূপে বদলে ফেলা যায়, সে জন্য বিভিন্ন রাজ্য ও জেলা থেকে মানুষের নানা উচ্চারণের নমুনা তুলে রেকর্ড করা হচ্ছে। সেগুলিকে কৃত্রিম বুদ্ধিমত্তার মান্য ও যোগ্য স্তরে নিয়ে আসার লক্ষ্যে প্রথম ধাপে চলছে অনুলিখন (ট্রান্সক্রিপশন)। পরে সেগুলির ব্যাকরণগত ত্রুটি-বিচ্যুতিকে চিহ্নিত করে নির্দিষ্ট ভাষাশৈলীসম্পন্ন অনুবাদক ঠিক ভাবে সবটা লিখছেন।
আবার, যা বিভ্রান্তির উদ্ভব ঘটাতে পারে, সেই দৃষ্টান্তগুলি যন্ত্রকে সরল উপায়ে বোঝানো হচ্ছে। যেমন, অঞ্চল্ভেদে কেউ বলে মুড়ি, কেউ বলে হুড়ুম।কেউ যেখানে বীভৎস মানে ভয়ংকর কিছু বোঝায় তখন তরুণ প্রজন্ম বীভৎস মানে সুন্দরকে বোঝায়। কেউ কুড়ি টাকা বলে, কোথাও আবার বিশ টাকা। সবজায়গায় টাকা টাকা নয়, ট্যাহা। পয়সা পয়হা বা পহা। অঞ্চলভেদে, আর্থিক শ্রেণি ভেদে, বয়স ভেদে, শিক্ষা ভেদে এক শব্দের মানে নানা রকম হতে পারে, তার উচ্চারণ হতে পারে অজস্র রকম। তাই বার বার পরীক্ষা করা হচ্ছে উন্নতির জায়গাগুলি। প্রচুর মানুষের দ্বারা ব্যবহৃত হতে হতে কৃত্রিম বুদ্ধিমত্তা ‘প্রায়’ জলজ্যান্ত মানুষের মতোই হয়ে উঠবে, এমন আশা করা হচ্ছে।


