কৃত্রিম বুদ্ধিমত্তা লাফিয়ে ও সীমানায় অগ্রসর হতে থাকে এবং এটি থামানো যায় না। আমরা যদি এমন প্রোগ্রামগুলির বিষয়ে কিছু আপলোড করতাম যা শুধুমাত্র পাঠ্যগুলি চিহ্নিত করার মাধ্যমে ভিডিও তৈরি করে, এখন মেটা অডিওবক্সের সাথে সবকিছু উড়িয়ে দিয়েছে, প্রোগ্রামটি ক্লোন করার এবং AI এর মাধ্যমে স্ক্র্যাচ থেকে নির্ভরযোগ্য শব্দ তৈরি করার জন্য।
আপনি যদি অডিওবক্স সম্পর্কে আরও জানতে চান, কীভাবে এআই ভয়েস তৈরি হয় এবং এই প্রযুক্তিতে কী কী ঝুঁকি থাকতে পারে, আমরা আপনাকে এই নিবন্ধটি পড়া চালিয়ে যাওয়ার পরামর্শ দিই।
অডিওবক্স কি?
অডিওবক্স সক্ষম হতে মেটা সেবা জেনারেটিভভাবে ভয়েস তৈরি করুন, আগে থেকেই বিদ্যমান অন্যদের অনুকরণ করা। অর্থাৎ, এটি একটি AI ভয়েস "ক্লোনার" যা বেশ নির্ভরযোগ্য।
এটি প্রথমবার নয় যে সংস্থাটি এই ধারণাটি নিয়ে ফ্লার্ট করেছে, যেহেতু কিছুক্ষণ আগে এটি ভয়েসবক্স চালু করেছে, তবে এটি সত্য যে এটি এই অন্যান্য সমাধানের মতো উন্নত বা সম্পূর্ণ ছিল না।
অডিওবক্সের সাথে, মেটা মন্তব্য করে যে আপনি স্ক্র্যাচ থেকে ভয়েস রেকর্ড করতে পারেন এবং কয়েক সেকেন্ডের মধ্যে তাদের ক্লোন করতে পারেন, কিন্তু এটি করার জন্য ব্যবহারকারীকে অবশ্যই একটি নির্দিষ্ট পাঠ্য আবৃত্তি করা রেকর্ড করতে হবে।
এটি করা হয়েছে কারণ এটি এমন একটি পাঠ্য যা অধ্যয়নের চেয়ে বেশি করা হয়েছে এবং এটি আমাদেরকে ভয়েসের নির্দিষ্ট সূক্ষ্মতা পেতে দেয়, পরিচয় চুরি এড়াতে একটি উপায় ছাড়াও যে কোনো প্রতিবেশীর শিশু এসে আপনার ভয়েস ক্লোন করে।
আজ, অডিওবক্স নিম্নলিখিত মাইলফলকগুলি অর্জন করতে সক্ষম:
- জেনারেট সাউন্ডস্কেপ পাঠ্য থেকে: যেমন "পটভূমিতে ভিনটেজ গাড়ি এবং পাখির সাথে একটি টাস্কান রাস্তা আবার তৈরি করুন"
- একটি টি দিয়ে অডিও তৈরি করাওনো এবং কংক্রিট ছন্দ: "একটি শিশুর কণ্ঠস্বর তৈরি করুন একটি উচ্চ কণ্ঠ এবং অনুনাসিক স্বর"
- একটি সঙ্গে একটি ভয়েস সংযুক্ত করুন পরিবেশের বৈশিষ্ট্য: "ভান করুন যে শিশুটি একটি প্রতিধ্বনি সহ একটি গুহার ভিতরে রয়েছে"
কিভাবে AI এর মাধ্যমে ভয়েস ক্লোন করা হয়?
কৃত্রিম বুদ্ধিমত্তা ব্যবহার করে ভয়েস ক্লোনিংয়ের প্রক্রিয়াটি ট্রান্সফরমার আর্কিটেকচারের উপর ভিত্তি করে আজকে বাজারে বিদ্যমান কোনো এআই পদ্ধতি থেকে দূরে নয়, যা আমরা আলোচনা করেছি। এই অন্যান্য নিবন্ধে.
ট্রান্সফরমার আর্কিটেকচার যা করে তা হল কাজ সম্পাদন করার সময় ইনপুটের নির্দিষ্ট অংশগুলিতে ফোকাস করার জন্য মডেলটিকে বিশ্লেষণ করার অনুমতি দেয়। মনোযোগ ইনপুটের বিভিন্ন অংশে নির্ধারিত ওজন দ্বারা গণনা করা হয় এবং এই ওজনগুলি প্রশিক্ষণের সময় শেখা হয়।
আসুন একটি অ্যাসেম্বলি লাইন কল্পনা করি, যেখানে একজন অপারেটর ভয়েস সংগ্রহ করে, অন্যটি এটিকে প্রক্রিয়া করে, অন্যজন এটি বিশ্লেষণ করে এবং একটি সঠিক ক্লোন তৈরি না হওয়া পর্যন্ত। ঠিক আছে, এইভাবে ট্রান্সফরমার আর্কিটেকচারটি AI এর সাথে স্পিচ জেনারেশনে প্রয়োগ করা হবে। আমরা যদি পদক্ষেপগুলিতে ফোকাস করি তবে সেগুলি এইগুলি হবে:
তথ্য সংগ্রহ
তারা প্রয়োজন যার ভয়েস ক্লোন করা হবে তার বিস্তৃত অডিও রেকর্ডিং. ডেটা সেটটি যত বড় এবং আরও বৈচিত্র্যময়, ফলাফলের মডেলটি তত ভাল।
এর প্রিপ্রসেসিং
অডিও রেকর্ডিং প্রাসঙ্গিক বৈশিষ্ট্য নিষ্কাশন প্রক্রিয়া করা হয়, যেমন স্বর, স্বর, গতি এবং অন্যান্য বৈশিষ্ট্য যা ভয়েসকে সংজ্ঞায়িত করে।
গভীর শিক্ষার মডেল:
ডিপ লার্নিং মডেল ব্যবহার করা হয়, যেমন পুনরাবৃত্ত নিউরাল নেটওয়ার্ক (RNN), ভয়েস ডেটাতে জটিল প্যাটার্ন শিখতে. এই মডেলগুলিকে ভয়েসের পরিবর্তনশীলতা এবং সূক্ষ্মতাগুলি ক্যাপচার করার জন্য প্রশিক্ষণ দেওয়া যেতে পারে।
মডেল প্রশিক্ষণ
মডেলটিকে সংগৃহীত ডেটা সেট ব্যবহার করে প্রশিক্ষণ দেওয়া হয়। প্রশিক্ষণের সময়, মডেল তার ওজন এবং পরামিতি সামঞ্জস্য করে জেনারেট করা ভয়েস এবং আসল ভয়েসের মধ্যে পার্থক্য কমিয়ে দিন লক্ষ্য স্পিকার এর.
ভয়েস প্রজন্ম
একবার প্রশিক্ষিত, মডেলটি সিন্থেটিক ভয়েস তৈরি করতে পারে যা আসল ভয়েস অনুকরণ করেl আপনি ইনপুট হিসাবে পাঠ্য সরবরাহ করতে পারেন এবং মডেলটি সংশ্লিষ্ট বক্তৃতা তৈরি করবে।
আমরা কিভাবে স্পেনে অডিওবক্স ব্যবহার করতে পারি?
স্পেনে এই নতুন পরিষেবাটি ব্যবহার করার জন্য আমাদের কেবল এটি করতে হবে অডিওবক্স ওয়েবসাইট অ্যাক্সেস করুন, নিবন্ধন করুন এবং আমরা এখন কম্পিউটার থেকে এটি ব্যবহার করতে পারি। অবশ্যই, আমাদের কিছু সংরক্ষণ থাকবে যা আমাদের জানা উচিত:
- এখন শুধুমাত্র ইংরেজি অডিওর সাথে কাজ করে, যেহেতু এটি একটি বিটা
- এটা সম্ভবত শেষ ফলাফল কিছু রোবোটিক হয়, যা স্বাভাবিক কারণ এটি এখনও সম্পূর্ণরূপে পালিশ করা হয়নি।
অডিওবক্সের মতো প্রোগ্রাম ব্যবহার করার ঝুঁকি আছে কি?
হ্যাকাররা অডিওবক্স ব্যবহার করে ডিজিটাল অপরাধ করতে পারে
কৃত্রিম বুদ্ধিমত্তা সহ ভয়েস ক্লোনিং বিভিন্ন ঝুঁকি এবং নৈতিক চ্যালেঞ্জ উপস্থাপন করে, সর্বোপরি মানুষের অবস্থার সাথে যুক্ত, যেহেতু সবাই এই ধরণের প্রযুক্তির সঠিক ব্যবহার করতে যাচ্ছে না, যা ভুল হাতে বিপজ্জনক। বিশেষত, এই ধরনের একটি প্রোগ্রাম ব্যবহার করার সময় আমরা যে বড় ঝুঁকিগুলি দেখতে পাই তা হল:
জালিয়াতি এবং পরিচয় চুরি
ভয়েস ক্লোন করার ক্ষমতা চালানোর জন্য ব্যবহার করা যেতে পারে জালিয়াতি এবং পরিচয় চুরি ফোন কল, ভয়েস মেসেজ বা অডিও রেকর্ডিংয়ে।
এটি নিরাপত্তা এবং বিশ্বাসের ক্ষেত্রে গুরুতর পরিণতি ঘটাতে পারে, বিশেষ করে এমন সময়ে যখন টেলিম্যাটিক পদ্ধতি বা টেলিফোনে পণ্য ক্রয় আরও জনপ্রিয় হয়ে উঠছে।
বিভ্রান্তি এবং ম্যানিপুলেশন
ভয়েস ক্লোনিং প্রযুক্তি ব্যবহার করে ভুয়া অডিও রেকর্ডিং তৈরি করা যেতে পারে ভুল তথ্য ছড়ানো বা জনমতকে চালিত করা. এটি ভুল তথ্য এবং বাস্তবতার হেরফের প্রসঙ্গে উদ্বেগ বাড়ায়।
এটি ব্যক্তি, কোম্পানি বা এমনকি জনসাধারণের ব্যক্তিত্বকে প্রভাবিত করতে পারে, যারা মিথ্যা এবং আগ্রহী বিষয়বস্তু তৈরি করতে তাদের কণ্ঠস্বর ব্যবহার করতে পারে, যেমন একজন রাষ্ট্রপতির ঘুষ স্বীকার করার একটি অডিও যখন তিনি বাস্তব জীবনে কখনও তা করেননি, উদাহরণস্বরূপ, এর প্রতিক্রিয়া আইনি এবং মিডিয়া যে এই প্রয়োজন হবে.
ফিশিং এবং সামাজিক প্রকৌশল
ভয়েস ক্লোনিং করা যেতে পারে ফিশিং এবং সামাজিক প্রকৌশল আক্রমণে ব্যবহৃত, যেখানে আক্রমণকারীরা অবৈধ জিনিসগুলির জন্য তাদের ডেটা পাওয়ার চেষ্টা করার জন্য লোকেদের বিশ্বাস করার জন্য প্রতারণা করার চেষ্টা করে যে তারা বিশ্বাসী কারো সাথে যোগাযোগ করছে।
আসুন কল্পনা করুন হ্যাকাররা একটি শিশুর কণ্ঠে একজন ব্যক্তিকে দ্রুত স্থানান্তর বা Bizum এর জন্য জিজ্ঞাসা করছে কারণ তাদের একটি দ্রুত ডিপোজিট প্রয়োজন, অথবা "অ্যাকাউন্ট সম্পর্কে কিছু দেখার জন্য" ব্যাঙ্কের পাসওয়ার্ডের জন্য কিছু মুহূর্ত জিজ্ঞাসা করছে, উদাহরণস্বরূপ।
আইনি সমস্যা এবং দায়বদ্ধতা
ভয়েস ক্লোনিংয়ের অপব্যবহার আইনি সমস্যা এবং দায়বদ্ধতার চ্যালেঞ্জের দিকে নিয়ে যেতে পারে ভয়েস রেকর্ডিংয়ের সত্যতা নির্ধারণ করা আরও জটিল হতে পারে. এবং যদিও আগে সত্যতা দেখার জন্য বিশেষজ্ঞ এবং বিশেষজ্ঞদের প্রয়োজন ছিল, এখন ক্লোন করা ভয়েসের ফ্যাক্টরকে বিচারের জন্য বিবেচনা করতে হবে।
আমাদের অংশের জন্য, আমাদের কেবল এটি কীভাবে বিকশিত হয় এবং মেটা সুরক্ষা সমস্যাটির সাথে এটির কাজটি পাবে কিনা তা দেখার জন্য অপেক্ষা করতে হবে। এই মুহুর্তে তারা ঘোষণা করেছে যে প্রকল্পটি বন্ধ উত্স হবে, তাই আমরা এটির জন্য আমাদের ভয়েস ব্যবহার করার সময় একটি নির্দিষ্ট সতর্কতার পরামর্শ দিই, যেহেতু আমরা স্পষ্ট নই যে সংস্থাটি সংগৃহীত ডেটাতে কী ব্যবহার করবে।