১৪ : অনুবাদ ও কৃত্রিম বুদ্ধিমত্তা

This entry is part 14 of 14 in the series অনুবাদ বিষয়ক প্ৰবন্ধমালা - তৃষ্ণা বসাক

অনুবাদ বিষয়ক প্ৰবন্ধমালা - তৃষ্ণা বসাক

১ : অনুবাদের বাদ, বিসংবাদ ও সংবেদনা

৩ : অনুবাদ- ও সাংস্কৃতিক ঔপনিবেশিকতা

৪ : শাসকের ভাষা, শাসিতের ভাষা এবং অনুবাদকের অবস্থান

৭ : অনুবাদের বাদ, বিসংবাদ ও সংবেদনা

৮ : অনুবাদের বাদ, বিসংবাদ ও সংবেদনা

৯ : অনুবাদের স্বর্ণযুগ : মধ্যযুগ

১১ : অনুবাদের বাদ বিসংবাদ ও সংবেদনা

১২ : লেখক ও অনুবাদকের আন্তঃসম্পর্ক- অনুবাদক যখন নারী

১৩ : অনুবাদের বাদ বিসংবাদ ও সংবেদনা

১৪ : অনুবাদ ও কৃত্রিম বুদ্ধিমত্তা

তৃষ্ণা বসাক

শুরু করা যাক লুই ক্যারলের একটি ননসেন্স রাইম দিয়ে

’Twas brillig, and the slithy toves
Did gyre and gimble in the wabe:
All mimsy were the borogoves,
And the mome raths outgrabe.

কবিতাটি কিন্তু শব্দার্থের ওপর নির্ভরশীল নয়। বরং অর্থবিপর্যয়টিই কৌতূকের মূল উপাদান। এই কবিতায় ব্যবহৃত শব্দগুলির কোনো প্রচলিত অর্থ নেই এর অনুবাদ করতে গিয়ে অনুবাদ সংক্রান্ত সমস্ত ধ্যানধারণা চুরমার করে দেন সত্যজিৎ রায়। তিনি ‘Jabberwocky’ অনুবাদ করে ফেলেন। নাম দেন – জবরখাকি।

বিল্লিগি আর শিঁথলে যত টোবে
গালুমগিরি করছে ভেউ-এর ধারে
আর যত সব মিমসে বোরোগোবে
মোমতারাদের গেবগেবিয়ে মারে

ল্যুইস ক্যারল বিরচিত ‘Jabberwocky’ কবিতার প্রথম স্তবক। একটি তথাকথিত ননসেন্স কবিতা। ১৮৭১ সালে Through the Looking-Glass গ্রন্থে প্রকাশ পায়। সত্য জিতের অনুবাদ যেন একটা চ্যালেঞ্জ। ননসেন্সের জবাবে ননসেন্স!

আবার লিয়ার অনুবাদের সময় সত্যজিত রায় শব্দ বা অর্থ নয়, বরং অনুসরণ করেছিলেন সঙ্গের অদ্ভুত চিত্রগুলো, সেই ছবির মধ্যেই এই আপাত অর্থহীন কবিতার স্রষ্টার মনের অভিপ্রায়টি লুকিয়ে।

ধরা যাক এই কবিতাটি এ আই কে অনুবাদ করতে দেওয়া হল। সে ডাহা ফেল করবে, কিংবা তা থেকে অর্থ খুঁজে কিছু একটা দাঁড় করাবে!

এ আই শব্দ ধরে ধরে অনুবাদ করতে পারে, কিন্তু স্রষ্টার মনের অভিপ্রায়কে ধরা তার পক্ষে দু;সাধ্য। যেমন সে ধরতে পারে না সাংস্কৃতিক নুয়েন্স, লেখকের নিজস্ব স্বর। এরকম একটা নেগেটভ দিক থেকে শুরু করলেও কৃত্রিম বুদ্ধিমত্তাকে কিন্তু দাবায়ে রাখা যায়নি। সে কী করছে না! যেদিকে তাকাই সেদিকেই তার দাপাদাপি। আগামী কুড়ি তিরিশ বছরে সে নাকি শাট থেকে সত্তর শতাংশ চাকরি খেয়ে নেবে। এখন দেখা যাক কৃত্রিম বুদ্ধিমত্তা আসলে কী।

যুক্তরাষ্ট্রের নর্থওয়েস্টার্ন বিশ্ববিদ্যালয়ের কম্পিউটার বিজ্ঞানের অধ্যাপক ল্যারি বার্নবাউমের কথায়, কৃত্রিম বুদ্ধিমত্তা হলো কম্পিউটার বিজ্ঞানের এমন একটি ক্ষেত্র, যেখানে বুদ্ধিদীপ্ত কাজ করতে যন্ত্র তৈরি ও প্রশিক্ষণের ওপর গুরুত্ব দেয়।

কয়েক দশক ধরে কৃত্রিম বুদ্ধিমত্তা মূলত বিশ্লেষণী কাজে ব্যবহৃত হয়ে আসছে। বিশাল ডেটা সেট বিশ্লেষণ করে কোনো বিষয়ের প্রশিক্ষণ দেওয়া বা ধরন চিহ্নিত করার কাজ করার সুবিধা পাওয়া যায়। ফলে ‘জেনারেটিভ এআই’ ক্ষেত্রটির ব্যাপক প্রসার ঘটেছে। জেনারেটিভ এআই হচ্ছে, কৃত্রিম বুদ্ধিমত্তার একটি রূপ যা কোনো কন্টেন্ট তৈরি করতে পারে। এই প্রযুক্তি কোনো শব্দ, ছবি, ভিডিওর মতো বিষয় সৃষ্টি করতে পারে। অনেক সময় এই পদ্ধতি মানুষের সৃজনশীলতার মতো জটিল বিষয়টি অনুকরণ করে থাকে। এখনকার জনপ্রিয় চ্যাটবট চ্যাটজিপিটি ও ছবি প্রস্তুতকারক ডাল-ইর মতো প্রোগ্রামে রয়েছে এ আই-র এই সক্ষমতা। এখানে প্রোগ্রামারকে আলাদা করে নির্দেশ দিতে হয় না, কম্পিউটারটি নিজে শেখে।বিশাল ডেটা ডেট পেলে সে বিভিন্ন প্যাটার্ন বা ধরন শণাক্ত করতে বা ফলাফলের পূর্বাভাস দিতে পারে। যা আসলে মানুষের ব্রেনের কর্ম পদ্ধতি ‘নিউরাল নেটওয়ার্ক’কে অনুসরণ করে। বিভিন্ন স্তরের কৃত্রিম নিউরনের মাধ্যমে এগুলো পরস্পরের সঙ্গে তথ্য দেওয়া-নেওয়া করে।

কৃত্রিম বুদ্ধিমত্তা-ভিত্তিক ক্লাউড সংগ্রহগুলি (যেমন, অ্যামাজ়ন আলেক্সা, গুগল গো, অ্যাপেল সিরি ইত্যাদি) এরা মূলত শহুরে দৈনন্দিন জীবনের খুঁটিনাটি অনেক সময় পরিবার বা কাছের মানুষের থেকেও বেশি ‘জেনে রাখছে’। ই-মেল পড়ে উত্তর দিচ্ছে, পছন্দের গান শোনাচ্ছে, অ্যাপয়েন্টমেন্ট মনে করাচ্ছে । এর ওপর প্রতিদিন সোশ্যাল মিডিয়ায় মানুষ নানান ফাঁদে পড়ে তার ব্যক্তিগত তথ্য শেয়ার করছে। একটা খুব সাধারণ উদাহরণ হল বিভিন্ন ফোটো অ্যাপ, যেমন ডিপ ফেক। এতে জালিয়াতি খুব সহজ হয়ে গেছে। একটা নিরীহ মেয়েকে পর্ন ছবির নায়িকা বানিয়ে ব্ল্যাকমেল করা হচ্ছে সহজেই। হঠাৎ হঠাৎ কেউ রাজকুমারী সেজে হাজির হচ্ছে, নিজের ছবির ওপর যে কোন ডেয়ারে সানন্দে সম্মত সে, এর ফল যে মারাত্মক হতে পারে ভাবছেই না। এদিকে ডিজিটাল সুরক্ষার ভয় এমন পর্যায়ে পৌঁছেছে যে একজন রাষ্টপ্রধান উঠে যাবার পর সঙ্গে সঙ্গে তাঁর চেয়ার মুছে দিচ্ছেন তাঁর নিরাপত্তা কর্মীরা, কোন রাষ্ট্রপ্রধান তাঁর বর্জ্যটুকুও অন্য দেশে ফেলে

আসছেন না, সেসব বয়ে নিয়ে আসার জন্য পুপ টয়লেট ব্যবহার করছেন।

এখানে আরও দুটো শব্দ শিখে রাখা ভাল- মেশিন লার্নিং বা এম এল এবং ডিপ লার্নিং বা ডি এল। জিপিটি অর্থ হচ্ছে ‘জেনারেটিভ প্রি-ট্রেইন্ড ট্রান্সফরমার’। জেনারেটিভ অর্থ হলো এটি কৃত্রিম বুদ্ধিমত্তার সাহায্যে কোনো কিছু তৈরি করে। প্রি-ট্রেইন্ড অর্থ একে আগে থেকেই বিশাল তথ্যভান্ডারের মাধ্যমে প্রশিক্ষণ দেওয়া হয়েছে। ট্রান্সফরমার অর্থ, এতে শক্তিশালী নিউরাল নেটওয়ার্ক ব্যবহার করা হয়েছে, যা ভাষাকে প্রক্রিয়াজাত করতে পারে।

জন ম্যাক্যার্থি সর্বপ্রথম Artificial Intelligence নামক টার্মটি ব্যবহার করেন ১৯৫৫ সালে। পরের বছর নিউ হ্যামশায়ারের হ্যানোভার শহরস্থ ডার্টমাউথ কলেজে অনুষ্ঠিত এক একাডেমিক কনফারেন্সে তিনি তা প্রথম প্রকাশ করেন। এজন্য জন ম্যাক্যার্থিকে কৃত্রিম বুদ্ধিমত্তার অন্যতম জনক বলা হয়। তার অন্যান্য সহযোগীরা হলেন- মার্ভিন মিনস্কি, অ্যালেন নিউয়েল এবং হার্বাট এ সায়মন।

অনুবাদে কৃত্রিম বুদ্ধিমত্তা মূলত তিন ধাপ বিবর্তনের মধ্যে দিয়ে এসেছে।

প্রথমে ছিল আর এম টি (রুল বেসড মেশিন ট্রান্সলেশন) পরে এস এম টি (স্ট্যাটিস্টিকাল মেশিন ট্রান্সলেশন) আর এখন নিউরাল মেশিন ট্রান্সলেশন (এন এম টি) এবং লার্জ ল্যাঙ্গুয়েজ মডেল (এলএলএম)। এটা হলো একধরনের নিউরাল নেটওয়ার্ক, যা লিখতে শেখে এবং ইউজারের সঙ্গে কথাবার্তা চালাতে জানে। এই ল্যাঙ্গুয়েজ মডেলের ওপর ভিত্তি করেই বর্তমানে জনপ্রিয় সব চ্যাটবট তৈরি করা হয়েছে। ভাষার অনুবাদে এখন এ আই যে অনেক কম ভুল করে মূলত এই এল এল এম র জন্যে। কৃত্রিম বুদ্ধিমত্তার ক্ষেত্রে বিবেচ্য বিষয় হচ্ছে, প্যারামিটার। বৃহৎ ভাষা মডেলের প্রশিক্ষণ তথ্যের সংখ্যাসূচক পয়েন্ট হচ্ছে এই প্যারামিটার। কোনো কাজে কৃত্রিম বুদ্ধিমত্তা কতটা দক্ষ, তা এই প্যারামিটারের ওপর নির্ভর করে। কোনো বাক্যে গঠনের ক্ষেত্রে একটি শব্দের পর আরেকটি শব্দ কী হবে, তা এই প্যারামিটারের ওপর নির্ভর করে ধারণা পায় এআই। তবে এআই র মূল দুর্বলতা হ্যালুসিনেশন, অর্থাৎ ভুল কিছু ভেবে বসা, আর আবেগ বোঝার অক্ষমতা।

এআই নির্ভর লেখার সহায়ক এদিন তো ছিলই- যেমন গ্রামারলি, প্রো রাইটিং এড, হেমিংওয়ে এডিটর ইত্যাদি। মানুষের মতো লেখার জন্যে আছে নানা কন্টেন্ট জেনারেটর টুল, যার মধ্যে সবচে বিখ্যাত জিপিটি। একে তৈরি করেছে ওপেন এ আই। এছাড়াও আছে কপি এ আই, রাইটসনিক, শর্টলিএআই।

২০১৬ সালে একটা জাপানিজ এ আই প্রোগ্রাম , যার নাম এ আই নভেলিস্ট, একটা আস্ত উপন্যাস লিখে ফেলল, যার নাম – ‘দ্য ডে আ কম্পিউটার রাইটস আ নভেল’। জাপানেই এআই ব্যবহার করে পুরস্কার জিতলেন লেখক রি কুদান, তা নিয়ে শুরু হয়ে গেল বিতর্ক।

কৃত্রিম বুদ্ধিমত্তা প্রযুক্তি অ্যাপলের সফটওয়্যার সিরির মতো ভার্চুয়াল সহকারীর ব্যবহার বাড়িয়ে দিয়েছে। এটি চিকিৎসকদের এমআরআইয়ের মাধ্যমে ক্যানসার শনাক্ত করতে সাহায্য করছে। এ ছাড়া কাজ করছে মুঠোফোনের মাধ্যমে চেহারা চিনে নিতে । সেসব ঠিক আছে, কিন্তু সে যখন মানুষের গর্ব, তার সৃজনশীলতা, তা কেড়ে নিতে চাইছে, তখন মনে হয় তার বিষয়ে একটু জেনে এগোনই ভাল।

এছাড়া আছে ভাষার অনুবাদের নানা টুল, যারা কাজ চালাবার মতো অনুবাদ করলেও, সাহিত্যের অনুবাদে প্রায়ই হাস্যকর পরিস্থিতির তৈরি করে।

কয়েকটি জনপ্রিয় অনুবাদ টুল হল- গুগল ট্রান্সলেট, ডিপএল, লিঙ্গুইক্স ইত্যাদি। ভারতের সংবিধানভুক্ত ২২টি ভারতীয় ভাষায় সমান্তরাল অনুবাদ প্রকল্প তৈরি হচ্ছে (‘ভাষিণী’ ও ‘এআইফরভারত’)। ডিজিটাল পেমেন্টের পরিভাষাও যাতে মাতৃভাষায় সম্পূর্ণ রূপে বদলে ফেলা যায়, সে জন্য বিভিন্ন রাজ্য ও জেলা থেকে মানুষের নানা উচ্চারণের নমুনা তুলে রেকর্ড করা হচ্ছে। সেগুলিকে কৃত্রিম বুদ্ধিমত্তার মান্য ও যোগ্য স্তরে নিয়ে আসার লক্ষ্যে প্রথম ধাপে চলছে অনুলিখন (ট্রান্সক্রিপশন)। পরে সেগুলির ব্যাকরণগত ত্রুটি-বিচ্যুতিকে চিহ্নিত করে নির্দিষ্ট ভাষাশৈলীসম্পন্ন অনুবাদক ঠিক ভাবে সবটা লিখছেন।

আবার, যা বিভ্রান্তির উদ্ভব ঘটাতে পারে, সেই দৃষ্টান্তগুলি যন্ত্রকে সরল উপায়ে বোঝানো হচ্ছে। যেমন, অঞ্চল্ভেদে কেউ বলে মুড়ি, কেউ বলে হুড়ুম।কেউ যেখানে বীভৎস মানে ভয়ংকর কিছু বোঝায় তখন তরুণ প্রজন্ম বীভৎস মানে সুন্দরকে বোঝায়। কেউ কুড়ি টাকা বলে, কোথাও আবার বিশ টাকা। সবজায়গায় টাকা টাকা নয়, ট্যাহা। পয়সা পয়হা বা পহা। অঞ্চলভেদে, আর্থিক শ্রেণি ভেদে, বয়স ভেদে, শিক্ষা ভেদে এক শব্দের মানে নানা রকম হতে পারে, তার উচ্চারণ হতে পারে অজস্র রকম। তাই বার বার পরীক্ষা করা হচ্ছে উন্নতির জায়গাগুলি। প্রচুর মানুষের দ্বারা ব্যবহৃত হতে হতে কৃত্রিম বুদ্ধিমত্তা ‘প্রায়’ জলজ্যান্ত মানুষের মতোই হয়ে উঠবে, এমন আশা করা হচ্ছে।